Звуки и знаки - [14]

Шрифт
Интервал

и ь, п и р и т. д.).

Изобретение телеграфа, телефона, других средств связи вызвало сближение инженерии, математики и лингвистики. Их союз помогает решать задачи кодирования слов и букв языка в электрические сигналы, сокращения «избыточных» частей текста при передаче телеграмм.

Однако подлинный союз техники, лингвистики и статистики в изучении языка начался с появлением электронных вычислительных машин. Если раньше необходимые подсчеты требовали многих лет труда и большого коллектива сотрудников, то теперь с помощью ЭВМ они могут быть произведены очень быстро и экономично.

Мы упоминали частотный словарь немецкого языка, составленный Кедингом на основании одиннадцати миллионов слов. Разумеется, один человек такую работу проделать не мог: не хватило бы всей его жизни. В составлении словаря Кедингу помогали сотрудники. Как вы думаете, сколько их было? Десяток, сотня, две сотни? Нет, гораздо больше — тысяча человек!

В течение нескольких лет вел кропотливую работу над составлением «Словаря языка Пушкина» коллектив сотрудников Института русского языка Академии наук СССР. Четверть века вели свою работу над частотным словарем английского языка Торндайк и Лордж…

В наши дни составление этих словарей поручено электронным вычислительным машинам. Именно они являются соавторами всех больших частотных словарей, появившихся в последние годы, включая «Частотный словарь русского языка».

С помощью ЭВМ в наши дни осуществляется издание монументального, в пятнадцати томах, словаря французского языка. Он охватывает почти шестьсот произведений авторов XVIII–XX столетий, общим объемом в семьдесят миллионов (!) слов. Каждому из семидесяти тысяч слов, вошедших в словарь, дается толкование, приводится общая частота его употребления, а также частоты, с которыми оно употреблялось в том или ином веке. Нет сомнения в том, что и для других языков появятся столь же нужные словари. Конечно, без машины составление их вряд ли было бы возможно: вспомните Кединга и его тысячу помощников.

ЭВМ помогают и в составлении частотных словарей отдельных «подъязыков», охватывающих ту или иную область науки и техники: электронику, терапию, строительные материалы, автомобилестроение, геологию нефти и газа и т. п. В нашей стране составлено более десятка таких словарей для английского, немецкого, французского и других языков. Осуществляет это важное и жизненно необходимое для практики дело группа «Статистика речи».

Правда, объем текстов, взятых для словаря, сравнительно невелик: выборка состоит, как правило, из двухсот тысяч слов. Но на это есть свои причины. Вы помните, что львиная доля текста покрывается самыми частыми словами, первой их тысячью. Вторая тысяча частых слов даст незначительный прирост, третья — еще меньший и т. д. Чем больший объем текста мы возьмем, тем больше разных слов в нем будет, но прирост этот будет замедляться. Вот что показывают расчеты. В словаре английского языка, составленном Г. Кучерой на основе машинной обработки миллиона слов, встретилось около пятидесяти тысяч различных слов. Если увеличить выборку в десять раз, то есть до десяти миллионов, число разных слов возросло бы не в десять, а примерно в два с половиной раза. Если довести выборку до ста миллионов слов, число разных слов увеличилось бы не в сто, а лишь в четыре раза.

Еще меньший прирост дают тексты по отдельным подъязыкам и областям знания. Вот какая картина рисуется нам, если мы попробуем применить ЭВМ для составления полного частотного словаря английских текстов по электронике. Двести тысяч слов, обработанных на машине, дали около десяти тысяч различных слов. Если увеличить выборку в пять раз, до миллиона слов, то число разных слов даже не удвоится. Увеличь мы выборку в пятьдесят раз, число разных слов возрастет только в три раза; увеличение в пятьсот раз, до ста миллионов слов, даст прирост в четыре раза. И если мы доведем выборку до фантастической величины в десять миллиардов, то есть в пятьдесят тысяч раз, то число разных слов возрастет лишь шестикратно. Наш словарь охватит лишь шестьдесят тысяч разных слов, между тем терминология электроники гораздо богаче, эти слова ее не исчерпывают, хотя мы обработали бы на ЭВМ около тридцати миллионов страниц текстов!

Вот почему ученые находят более рациональное применение вычислительной технике. С помощью машин выявляются не все слова в той или иной области науки и техники (где употребляются сотни тысяч различных терминов), а наиболее употребительные, а также самые частые словосочетания. Ведь они, например, в отраслевых англо-русских словарях, занимают почти три четверти объема словаря. Выявить же эти сочетания, одновременно подсчитывая их частоту вручную, практически невозможно: лишь ЭВМ способна проделать столь утомительную и однообразную работу.

Но не только электронные вычислительные машины оказывают помощь лингвистике. В свою очередь, помощь современного языкознания оказалась крайне необходимой для вычислительной техники. С рождением кибернетики появляется и проблема «разговора» человека и робота. ЭВМ понимают только строго формализованный, однозначный язык чисел и логических команд. Можно ли перевести на него наш обычный человеческий язык?


Еще от автора Александр Михайлович Кондратов
Книга о букве

О языкознании написано много интересных научно-популярных книг. О грамматологии — ни одной. «Книга о букве» — первая попытка рассказать об увлекательных и разнообразных проблемах, которые решает наука о письме. Рассказ о грамматологии строится как серия очерков, в которых излагаются основные проблемы этой науки. При этом главное внимание уделено наиболее важным темам — происхождению письма, его ранним этапам, типам письменности, их соотношению, общему направлению развития письма, а также методам дешифровки.


Земля людей — земля языков

В языках повсюду можно отыскать следы древнейшей истории и культурных контактов, первобытного мировоззрения и особенностей мышления данного народа. Конечно, в одной книге можно лишь приоткрыть дверь в увлекательный мир, который скрывается за такими, казалось бы, сухими и скучными страницами словарей и грамматик.В книге делается краткий обзор истории мировых языков, прослеживается связь между ними, взаимовлияния культур.


Загадка сфинкса

В 1972 году исполнится 150 лет со времени дешифровки французским ученым Франсуа Шампольоном египетских иероглифов, бывших главной загадкой древней культуры Египта.О титаническом труде Шампольона и других исследователей, о развитии египтологии, открывшей миру великую и древнюю цивилизацию планеты, о вкладе русских ученых в дешифровку иероглифов, о неразгаданных и по сей день египетских письменах рассказывается в этой книге.


Адрес — Лемурия?

Таинственные острова в Индийском океане, которых не найти на современной карте, но о которых повествуют древние источники… Дравидийские легенды о Южном материке, ушедшем на дно… Создатели древнейшей цивилизации Двуречья, прибывшие откуда-то с юга… Загадки происхождения других цивилизаций — Древнего Египта, Индостана, Элама… Прародина человечества, которую Энгельс и Геккель, Гексли и Вирхов помещали на материке, затонувшем в Индийском океане… Сухопутный «мост», соединявший Мадагаскар и другие острова с Индостаном… Не говорит ли все это о том, что некогда здесь была земля Лемурия, колыбель человеческого рода и древнейших цивилизаций?Загадку Лемурии предстоит решить будущим исследователям, прежде всего, океанографам и подводным археологам.


Загадки Великого океана

Когда-то Тихий океан открывали Кук, Лаперуз, Лисянский, Крузенштерн, Литке и другие. В наши дни идет новое открытие величайшего океана — открытие его дна, гигантской подводной страны, занимающей 1/3 поверхности нашей планеты. Исследование Тихого океана и его дна связано с решением вопроса, который вот уже около двухсот лет горячо обсуждается учеными всего мира: не существовала ли некогда в Тихом океане обширная страна (материк или группа архипелагов), ныне погруженная на дно? Гипотеза о затонувшей земле связана с целым рядом других гипотез: океанографических, археологических, лингвистических, зоологических, этнографических, геологических и т. д.Книга «Загадки Великого океана», рассчитанная на широкий круг читателей, продолжает цикл работ автора, посвященных загадкам океанов и затонувших земель.«Загадки Великого океана» — двадцать первая книга Александра Кондратова.


Была земля Арктида

Книга представляет собой вторую часть трилогии об исчезнувших землях — «магаданских Атлантидах». Известный популяризатор науки, автор более тридцати книг, рассказывает об арктическом, мосте суши, некогда соединявшем берега Евразии и Северной Америки.


Рекомендуем почитать
Легенда о Вавилоне

Петр Ильинский, уроженец С.-Петербурга, выпускник МГУ, много лет работал в Гарвардском университете, в настоящее время живет в Бостоне. Автор многочисленных научных статей, патентов, трех книг и нескольких десятков эссе на культурные, политические и исторические темы в печатной и интернет-прессе США, Европы и России. «Легенда о Вавилоне» — книга не только о более чем двухтысячелетней истории Вавилона и породившей его месопотамской цивилизации, но главным образом об отражении этой истории в библейских текстах и культурных образах, присущих как прошлому, так и настоящему.


Открытия и гипотезы, 2005 №11

Научно-популярный журнал «Открытия и гипотезы» представляет свежий взгляд на самые главные загадки вселенной и человечества, его проблемы и открытия. Никогда еще наука не была такой интересной. Представлены теоретические и практические материалы.


Жители планет

«Что такое на тех отдаленных светилах? Имеются ли достаточные основания предполагать, что и другие миры населены подобно нашему, и если жизнь есть на тех небесных землях, как на нашей подлунной, то похожа ли она на нашу жизнь? Одним словом, обитаемы ли другие миры, и, если обитаемы, жители их похожи ли на нас?».


Знание-сила, 2000 № 07 (877)

Ежемесячный научно-популярный и научно-художественный журнал.


Меч и Грааль

Взыскание Святого Грааля, — именно так, красиво и архаично, называют неповторимое явление средневековой духовной культуры Европы, породившее шедевры рыцарских романов и поэм о многовековых поисках чудесной лучезарной чаши, в которую, по преданию, ангелы собрали кровь, истекшую из ран Христа во время крестных мук на Голгофе. В некоторых преданиях Грааль — это ниспавший с неба волшебный камень… Рыцари Грааля ещё в старых текстах именуются храмовниками, тамплиерами. История этого католического ордена, основанного во времена Крестовых походов и уничтоженного в начале XIV века, овеяна легендами.


Популярно о микробиологии

В занимательной и доступной форме автор вводит читателя в удивительный мир микробиологии. Вы узнаете об истории открытия микроорганизмов и их жизнедеятельности. О том, что известно современной науке о морфологии, методах обнаружения, культивирования и хранения микробов, об их роли в поддержании жизни на нашей планете. О перспективах разработок новых технологий, применение которых может сыграть важную роль в решении многих глобальных проблем, стоящих перед человечеством.Книга предназначена широкому кругу читателей, всем, кто интересуется вопросами современной микробиологии и биотехнологии.


Научная фантастика

В сборник включены лучшие из тех произведений советских писателей-фантастов, которые впервые были опубликованы в издательстве «Знание». Это рассказы известных писателей, чей путь в научной фантастике начался в 50 — 60-е годы (Г. Альтова, Д. Биленкина, Е. Войскунского и И. Лукодьянова, Г. Гуревича, А. Днепрова, М. Емцева и Е. Парнова), а также произведения писателей младшего поколения (В. Колупаева, Г. Шаха и других). Книга рассчитана на широкий круг читателей.