Звуки и знаки - [6]

Шрифт
Интервал

Какие же слова считать употребительными, а какие нет? Ответ на этот вопрос дает статистика, так называемые частотные словари.

Частоты и слова

Чем чаще встречается в текстах слово, тем оно употребительнее, или, говоря языком математики, имеет большую частоту. Но как избежать слов, характерных только для данного текста, а в других почти не встречающихся? Самый лучший путь — брать не один источник, а несколько. А затем, подсчитав, сколько раз встречаются в этих книгах различные слова, сравнить результаты. Если они совпадают, то слово действительно является частым (или редким). Если не совпадают, то, значит, в одном из текстов оно было завышено из-за сюжета или пристрастия автора к этому слову.

Так, весьма частое для «Капитанской дочки» слово крепость, встретилось всего лишь в четырнадцати источниках из ста тридцати трех. Значит, слово это отнюдь не частое и занимает скромное место в списке самых употребительных слов русского языка. А составляй мы список лишь по «Капитанской дочке», то оно вошло бы едва ли не в первую двадцатку самых ходовых слов нашего языка!

В «Истории Пугачева» оно встречается еще чаще — сто тридцать четыре раза (ведь там речь то и дело идет о крепостях, взятых Пугачевым). В «Путешествии в Арзрум» оно встречается шестнадцать раз. Зато во всех художественных произведениях (кроме «Капитанской дочки») Пушкин употребил слово крепость всего один раз (в «Дубровском») и два раза в стихотворениях и поэмах.

Но не только количество разных текстов может гарантировать наши подсчеты от случайности. Не менее важно взять большой объем этих текстов. И чем он больше, тем вернее мы гарантированы, что никакие случайные факторы не повлияют на точность наших подсчетов.

Подсчеты частот слов производились давно: еще в средние века составлялись индексы к религиозным текстам, в которых указывалось, сколько и где упоминаются слова бог, ангел и т. д. Но только на пороге нашего века появляется серьезная потребность в частотных словарях. Первым таким словарем считается словарь немецкого языка, выпущенный в Берлине в 1897–1898 годах. Его составитель Ф. Кединг обработал колоссальный материал в одиннадцать миллионов слов!

Вслед за тем приходит черед частотных словарей английского языка. В Лондоне в 1904 году священник Дж. Ноулз составляет список из слов, которые встретились более двадцати пяти раз в текстах, объемом в сто тысяч слов.

Американец Р. Элдридж, управляющий небольшой фабрикой, где в основном работали иммигранты, за два года расписал на карточки двести пятьдесят статей из газет, составивших около пятидесяти тысяч слов, и подсчитал частоты этих слов.

Первоначально, как говорил Элдридж в предисловии к своему словарю, выпущенному в 1911 году, его целью было выявить минимум слов, который помог бы рабочим-иностранцам быстро овладеть разговорной речью. Но затем, продолжает Элдридж, он понял, что частотные словари могут принести и более существенную пользу, в том числе оказать помощь в реформе английской орфографии, которую справедливо называют «чудовищной».

Но частотные словари Ноулза, Элдриджа, а также ряд других, выпущенных в начале нашего века, были все-таки любительскими, ненадежными. Ноулз опирался на текст Библии, Элдридж — на текст газетных статей, другие авторы — на выборки из различных писем. Да и объем исследуемого материала был невелик. В двадцатых годах профессора Колумбийского университета Э. Торндайк и И. Лордж начинают работу над серией больших частотных словарей английского языка. Завершился их четвертьвековой труд выпуском крупнейшего в мире частотного словаря. Обработав различные тексты общим объемом в восемнадцать миллионов слов, ученые привели в своем словаре тридцать тысяч слов, которые встретились в этих текстах.

В настоящее время частотные словари созданы почти по всем европейским языкам. Словарь испанского языка, составленный Гарсиа Осом, создан на основании подсчетов четырехсот тысяч слов; словарь чешского языка — одного миллиона двухсот тысяч слов, польского — семи миллионов, французского — полутора миллионов и т. д.

Пришел черед и для частотного словаря русского языка. В настоящее время составлено пять таких словарей.

Пять частотных словарей

Интерес к русскому языку возрастает во всем мире. Русский учат в США и Анголе, в Японии и на Кубе, в Финляндии и Монголии, в Канаде и Эфиопии. Сколько же слов надо знать иностранцу, чтобы читать произведения русской классики? вести деловой разговор? объясниться с прохожим, приехав гостем в СССР?

Мы уже говорили о картотеке Института русского языка, где зарегистрировано четыреста сорок тысяч слов. В семнадцатитомном «Словаре современного русского языка» приводится сто пятьдесят тысяч различных слов. Вряд ли целесообразно иностранцу, решившему постичь великий и могучий русский язык, заучивать все эти слова, которые в полном объеме неведомы и русским людям. Ему нужен на первых порах минимум, слова самые употребительные, самые частые.

В 1953 году в американском городе Детройте выходит в свет первый частотный словарь русского языка. Его составитель Г. Г. Джоссельсон использовал тексты общим объемом в один миллион слов. Но так как основным материалом для анализа Джоссельсон взял произведения дореволюционных писателей, то в список часто употребляемых слов попало слово


Еще от автора Александр Михайлович Кондратов
Книга о букве

О языкознании написано много интересных научно-популярных книг. О грамматологии — ни одной. «Книга о букве» — первая попытка рассказать об увлекательных и разнообразных проблемах, которые решает наука о письме. Рассказ о грамматологии строится как серия очерков, в которых излагаются основные проблемы этой науки. При этом главное внимание уделено наиболее важным темам — происхождению письма, его ранним этапам, типам письменности, их соотношению, общему направлению развития письма, а также методам дешифровки.


Здравствуй, ад!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Загадка сфинкса

В 1972 году исполнится 150 лет со времени дешифровки французским ученым Франсуа Шампольоном египетских иероглифов, бывших главной загадкой древней культуры Египта.О титаническом труде Шампольона и других исследователей, о развитии египтологии, открывшей миру великую и древнюю цивилизацию планеты, о вкладе русских ученых в дешифровку иероглифов, о неразгаданных и по сей день египетских письменах рассказывается в этой книге.


Укор сроку

Палиндром (в переводе с греческого — бегущий назад) — слово или стих, одинаково читаемый как слева направо, так и справа налево.Поэма Александра Кондратова продолжает традиции классического русского палиндрома.


Земля людей — земля языков

В языках повсюду можно отыскать следы древнейшей истории и культурных контактов, первобытного мировоззрения и особенностей мышления данного народа. Конечно, в одной книге можно лишь приоткрыть дверь в увлекательный мир, который скрывается за такими, казалось бы, сухими и скучными страницами словарей и грамматик.В книге делается краткий обзор истории мировых языков, прослеживается связь между ними, взаимовлияния культур.


Загадки Великого океана

Когда-то Тихий океан открывали Кук, Лаперуз, Лисянский, Крузенштерн, Литке и другие. В наши дни идет новое открытие величайшего океана — открытие его дна, гигантской подводной страны, занимающей 1/3 поверхности нашей планеты. Исследование Тихого океана и его дна связано с решением вопроса, который вот уже около двухсот лет горячо обсуждается учеными всего мира: не существовала ли некогда в Тихом океане обширная страна (материк или группа архипелагов), ныне погруженная на дно? Гипотеза о затонувшей земле связана с целым рядом других гипотез: океанографических, археологических, лингвистических, зоологических, этнографических, геологических и т. д.Книга «Загадки Великого океана», рассчитанная на широкий круг читателей, продолжает цикл работ автора, посвященных загадкам океанов и затонувших земель.«Загадки Великого океана» — двадцать первая книга Александра Кондратова.


Рекомендуем почитать
Перо и маска

«Настоящая книга представляет собою сборник новелл о литературных выдумках и мистификациях, объединенных здесь впервые под понятиями Пера и Маски. В большинстве они неизвестны широкому читателю, хотя многие из них и оставили яркий след в истории, необычайны по форме и фантастичны по содержанию».


Мир истории: Россия в XVII столетии

О пути, который прошла Русь на протяжении XIII–XV веков, от политической раздробленности накануне татаро-монгольского нашествия до победы в Куликовской битве и создания централизованного Русского государства, рассказывают доктор исторических наук И. Б. Греков и писатель Ф. Ф. Шахмагонов. Виктор Иванович Буганов — известный советский ученый, доктор исторических наук, заведующий отделом источниковедения Института истории СССР Академии наук СССР. Его перу принадлежит более 300 научных работ, в том числе пять монографий, и научно-популярные книги.


Неудобное наследство: Гены, расы и история человечества

Человечеству в ХХ веке пришлось пережить многие войны, национальные конфликты и революции, сопровождавшиеся кровавыми расправами одних сторон над другими. Характер и масштаб их был разный, но в основе своей они нередко несли расовые противоречия.С тех пор научное сообщество в своем большинстве наложило гласные и негласные запреты не только на явно расистские учения, как, например, евгенику, но и на вполне научные области знания — среди них генетические, биологические, антропологические направления, связанные с развитием и особенностями человеческих рас.


[Не]правда о нашем теле. Заблуждения, в которые мы верим

Знать правду весьма полезно, особенно о своей жизни и своем здоровье. Это экономит силы, время и деньги, которых можно лишиться, гоняясь за химерами. Мифы о здоровье окружают нас везде, и их своевременное развенчание — залог полноценной жизни! В этой книге Андрей Сазонов собрал тридцать распространенных медицинских мифов, ложных утверждений, о который все не только слышали, но и успешно претворяли в жизнь. Какие продукты сжигают жиры, и есть ли смысл в перекусах? Вода обычная и минеральная — нужно ли нам выпивать 8 стаканов ежедневно? Седина от стресса и аллергия от тополиного пуха — где правда? Каждый развенчанный миф — шаг к осознанию того, как действительно нужно следить за своим здоровьем. Давайте жить качественно! Лечится тем, что помогает, покупать то, что нужно, делать то, что идет нам на пользу. Ударим по мифам научным подходом!


Великая разруха Московского государства, 1598–1612 гг.

В русской истории 14 лет, прошедших с 1598 по 1612 год, называют «разрухою» или «Смутным временем». «Смятения» Русской земли, или «Московская трагедия», как писали о ней иностранцы, началась с прекращением династии Рюриковичей, т. е. после кончины Царя Фёдора Ивановича, и кончилась, когда земские чины, собравшиеся в Москве в начале 1613 г., избрали на престол в Цари Михаила Фёдоровича, родоначальника новой династии Дома Романовых.


Физике становится тепло. Лорд Кельвин. Классическая термодинамика

Под именем лорда Кельвина вошел в историю британский ученый XIX века Уильям Томсон, один из создателей экспериментальной физики. Больше всего он запомнился своими работами по классической термодинамике, особенно касающимися введения в науку абсолютной температурной шкалы. Лорд Кельвин сделал вклад в развитие таких областей, как астрофизика, механика жидкостей и инженерное дело, он участвовал в прокладывании первого подводного телеграфного кабеля, связавшего Европу и Америку, а также в научных и философских дебатах об определении возраста Земли.


Научная фантастика

В сборник включены лучшие из тех произведений советских писателей-фантастов, которые впервые были опубликованы в издательстве «Знание». Это рассказы известных писателей, чей путь в научной фантастике начался в 50 — 60-е годы (Г. Альтова, Д. Биленкина, Е. Войскунского и И. Лукодьянова, Г. Гуревича, А. Днепрова, М. Емцева и Е. Парнова), а также произведения писателей младшего поколения (В. Колупаева, Г. Шаха и других). Книга рассчитана на широкий круг читателей.