Звуки и знаки - [8]

Шрифт
Интервал

В английском языке тысяча самых употребительных слов покрывает около семидесяти процентов литературных текстов и свыше восьмидесяти процентов — научных. Во французском языке та же тысяча самых частых слов покрывает около восьмидесяти процентов литературных текстов и свыше девяноста — разговорной речи.

Но какими бы ни были вариации, ясно, что чем больше мы будем удаляться от «верхушки» частотного словаря, тем больше понадобится нам различных слов для покрытия (а стало быть, и перевода) текста.

Возьмем французский язык. Первая тысяча слов дала возможность покрыть свыше девяноста процентов разговорной речи. Но если мы добавим еще тысячу слов, то прирост будет равен всего четырем процентам. А следующие три тысячи слов увеличат покрываемость текста немногим более трех процентов.

Примерно та же картина получится, если мы возьмем другие языки или другие стили. В среднем первая тысяча самых частых слов покрывает около восьмидесяти процентов всего текста. Увеличение списка еще на одну тысячу дает прирост порядка шести процентов. Добавление следующей, третьей, тысячи позволит покрыть около трех процентов, четвертой — около двух процентов, пятой — немногим более одного процента текста.

«Пользуясь этими данными, можно разумно планировать введение лексики в ходе преподавания иностранного языка, — пишут советские специалисты, говоря о помощи, которую статистика и лингвистика оказывают преподаванию языков. — Так, если согласиться с тем, что за одно занятие учащиеся неспециального вуза могут усвоить 12–18 словоформ, то через 7—10 занятий они должны будут знать не менее 120 словоформ, покрывающих более чем 50 % текста. В этом случае учащийся должен узнавать и переводить по отдельности каждое второе слово неадаптированного текста данной специальности. Через 30–40 занятий учащемуся будет знакомо уже около 500 словоформ, покрывающих в среднем около двух третей всех словоупотреблений текста, а к концу первого учебного года учащийся сможет узнавать около 1000 словоформ, покрывающих около 80 % текста».

Словари, словари, словари…

В чем отличие частотного словаря от любого другого? Прежде всего в том, что вместе со словом в нем приводится и частота употребления этого слова в тексте. Слова могут идти либо в алфавитном порядке, либо по убыванию частот. В «Частотном словаре русского языка», как мы уже говорили, дается и алфавитный, и частотный списки. Частотный словарь может быть полным, когда в нем приводится список всех слов, встретившихся в тексте, и неполным, когда дается лишь список слов, встретившихся с определенной частотой. Так, алфавитный список «Частотного словаря русского языка» — полный, а частотный — неполный, он дает лишь список слов с частотой «десять» и более, остальные тридцать тысяч слов, менее употребительных, в него не включены.

Объем материала, который лег в основу словаря, в значительной мере влияет и на состав этого словаря. В зависимости от того, сколько тысяч или миллионов слов текста обследовалось — или просчитывалось на электронно-вычислительной машине — выделяют малые, средние и большие частотные словари (так, первые частотные словари английского языка были, безусловно, малыми, а словарь Торндайка и Лорджа, составленный по текстам в восемнадцать миллионов слов, относится, разумеется, к большим).

Однако на словарь влияет и стиль, и тематика, и жанр, и авторская принадлежность того или иного текста. Вот почему различают частотные словари устной и письменной речи, словари общие (вроде нашего «Частотного словаря русского языка») и отраслевые (например, Е. А. Калининой с помощью ЭВМ составлен частотный словарь русского подъязыка электроники). Есть словари отдельных произведений, как классиков, так и современных авторов. Составлены «персональные» частотные словари — Пушкина, Шекспира, Шевченко и других.

Не менее важно и то, что именно фиксируется в словаре: исходная форма слова, словоформа, то есть слово в различных грамматических формах, основа слова или словосочетание. В таких языках, как китайский, разница между словарем основ и словоформ практически неощутима. В английском языке она уже заметна. Когда же мы обращаемся к такому языку, как русский, где множество падежей, глагольных форм и т. д., различие между исходной формой слова и словоформой огромно. Например, частотный словарь русского подъязыка электроники, составленный по текстам в двести тысяч слов, дал свыше двадцати одной тысячи различных словоформ и менее семи тысяч слов!

Частоты, приводимые рядом со словами, также различны. Это может быть абсолютная частота, указывающая, сколько раз в тексте встретилось то или иное слово. Частота эта может быть относительной, выраженной в процентах или вероятностях (ведь объемы словарей могут быть разными, в зависимости от них различны и абсолютные частоты). Во многих словарях приводятся и другие числовые характеристики, например количество источников, в которых встретилось то или иное слово.

Наконец, словари могут различаться по способу анализа материала. Обычно их составляют на основании выборок. Так, для «Частотного словаря русского языка» брались отрывки из произведений различных авторов — писателей и драматургов, ученых и публицистов. В их числе были Ленин и Калинин, Леонов и Шолохов, Вавилов и Тарле, Тимирязев и Ферсман.


Еще от автора Александр Михайлович Кондратов
Книга о букве

О языкознании написано много интересных научно-популярных книг. О грамматологии — ни одной. «Книга о букве» — первая попытка рассказать об увлекательных и разнообразных проблемах, которые решает наука о письме. Рассказ о грамматологии строится как серия очерков, в которых излагаются основные проблемы этой науки. При этом главное внимание уделено наиболее важным темам — происхождению письма, его ранним этапам, типам письменности, их соотношению, общему направлению развития письма, а также методам дешифровки.


Здравствуй, ад!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Укор сроку

Палиндром (в переводе с греческого — бегущий назад) — слово или стих, одинаково читаемый как слева направо, так и справа налево.Поэма Александра Кондратова продолжает традиции классического русского палиндрома.


Загадка сфинкса

В 1972 году исполнится 150 лет со времени дешифровки французским ученым Франсуа Шампольоном египетских иероглифов, бывших главной загадкой древней культуры Египта.О титаническом труде Шампольона и других исследователей, о развитии египтологии, открывшей миру великую и древнюю цивилизацию планеты, о вкладе русских ученых в дешифровку иероглифов, о неразгаданных и по сей день египетских письменах рассказывается в этой книге.


Загадки Великого океана

Когда-то Тихий океан открывали Кук, Лаперуз, Лисянский, Крузенштерн, Литке и другие. В наши дни идет новое открытие величайшего океана — открытие его дна, гигантской подводной страны, занимающей 1/3 поверхности нашей планеты. Исследование Тихого океана и его дна связано с решением вопроса, который вот уже около двухсот лет горячо обсуждается учеными всего мира: не существовала ли некогда в Тихом океане обширная страна (материк или группа архипелагов), ныне погруженная на дно? Гипотеза о затонувшей земле связана с целым рядом других гипотез: океанографических, археологических, лингвистических, зоологических, этнографических, геологических и т. д.Книга «Загадки Великого океана», рассчитанная на широкий круг читателей, продолжает цикл работ автора, посвященных загадкам океанов и затонувших земель.«Загадки Великого океана» — двадцать первая книга Александра Кондратова.


Земля людей — земля языков

В языках повсюду можно отыскать следы древнейшей истории и культурных контактов, первобытного мировоззрения и особенностей мышления данного народа. Конечно, в одной книге можно лишь приоткрыть дверь в увлекательный мир, который скрывается за такими, казалось бы, сухими и скучными страницами словарей и грамматик.В книге делается краткий обзор истории мировых языков, прослеживается связь между ними, взаимовлияния культур.


Рекомендуем почитать
Я, паразит

Слово «паразит» ни у кого не вызывает положительных эмоций. Паразитами называют тех, кто живет за чужой счет, — идет ли речь о людях или патогенных организмах. Тем не менее, само существование паразитов будоражит наше воображение: нас поражает их способность адаптации к меняющимся внешним условиям, их сложный жизненный цикл, их «модус операнди», не имеющий аналогов в животном мире. Эта книга максимально доступным языком, с использованием множества примеров рассказывает о том, чем занимается наука паразитология.


Таинственная жизнь грибов. Удивительные чудеса скрытого от глаз мира

Наш прекрасный мир и его чудесная природа обрели свой вид только благодаря грибам, без которых немыслима ни одна экосистема. Без них не было бы ни наших лесов, ни нашего климата, да и, возможно, самой жизни. Грибы вездесущи, и, если использовать их правильно, они могут помочь нам в совершенно неожиданных областях. Грибы – партнеры, грибы – мастера утилизации отходов, грибы – чудо-лекарство, грибы – источник страсти… Известный австрийский биолог и специалист по охране природы, автор более 20 книг Роберт Хофрихтер, обобщая научные данные и собственный профессиональный и жизненный опыт, расскажет в этой книге о многом, чего мы до сих пор не знали о грибах.


Наблюдая за китами

Книга рассказывает о прошлом, настоящем и будущем самых, быть может, загадочных созданий на Земле. О том, как выглядели древнейшие, ранние киты, как эти обитавшие на суше животные миллионы лет назад перешли к водному образу жизни, мы узнаем по окаменелостям. Поиск ископаемых костей китов и работа по анатомическому описанию существующих видов приводила автора в самые разные точки планеты: от пустыни Атакама в Чили, где обнаружено самое большое в мире кладбище древних китов — Серро-Баллена, до китобойной станции в Исландии, от арктических до антарктических морей. Киты по-прежнему остаются загадочными созданиями.


Самая совершенная вещь на свете

Птичьи яйца – важная составляющая нашей культуры, символ плодовитости, неотъемлемый атрибут религиозных верований и мифологических представлений. Издревле за яйцами охотились коллекционеры и зачастую рисковали жизнью, взбираясь по скалистым склонам в поисках уникальных экземпляров. Казалось бы, яйцо устроено очень просто – но эта простота лишь кажущаяся. Один из ведущих орнитологов современности, известный британский популяризатор науки, обладатель множества наград за исследования в области поведенческой экологии и орнитологии, Тим Беркхед делится своими уникальными знаниями и раскрывает множество тайн этого настоящего чуда природы.


Захватывающий мир легких

Как происходит дыхание? Почему нам порой не хватает воздуха и какое отношение имеет к этому маленькая Русалочка? Как наши эмоции влияют на дыхание? Почему мы кашляем, но не чувствуем боли в дыхательных путях? Может ли вырасти новое легкое? Как самый большой орган нашего тела защищается от микробов и вредных веществ. И самое главное: что мы можем предпринять, чтобы этот чудесный орган сохранял свою работоспособность всю жизнь? Обо всем этом увлекательно и захватывающе повествует специалист по легким Кай-Михаэль Бе. Для широкого круга читателей.


Это невероятно! Открытия, достойные Игнобелевской премии

Книга основателя Игнобелевской (Шнобелевской) премии — сборник эссе о самых разных исследованиях вполне почтенных ученых. Только вот предмет этих исследований заставляет читателей сначала рассмеяться, а потом задуматься о весьма серьезных вещах. Почему чаще всего крадут книги по этике? Как найти оптимальный способ нарезки ветчины с помощью математики? Отчего танцоры в Вегасе получают большие чаевые в определенные месяцы? И какое ухо лучше распознает ложь — правое или левое? Абрахамс рассказывает о подобных довольно странных исследованиях в области биологии, физики, математики и других наук с большим юмором, иронией и — глубоким знанием человеческой природы.


Научная фантастика

В сборник включены лучшие из тех произведений советских писателей-фантастов, которые впервые были опубликованы в издательстве «Знание». Это рассказы известных писателей, чей путь в научной фантастике начался в 50 — 60-е годы (Г. Альтова, Д. Биленкина, Е. Войскунского и И. Лукодьянова, Г. Гуревича, А. Днепрова, М. Емцева и Е. Парнова), а также произведения писателей младшего поколения (В. Колупаева, Г. Шаха и других). Книга рассчитана на широкий круг читателей.