Звуки и знаки - [23]

Шрифт
Интервал

Какой может быть эта смысловая связь? Во-первых, одно и то же значение можно выразить с помощью разных слов или оборотов. Вполне понятно, что все синонимы будут объединены. Во-вторых, смыслы слов могут быть полностью противоположны (как антонимы типа холодный — горячий, мертвый — живой и т. п.) В-третьих, смысл одного слова может включать в себя смысл другого, или даже многих слов, например значение слова человек включает в себя наименования сотен различных национальностей нашей планеты. Смысловые связи между словами могут строиться по типу причина — следствие или часть — целое. Наконец значения слов между собой связаны самыми различными ассоциациями. Причем именно проблема ассоциаций является наиболее трудно разрешимой задачей при построении того или иного тезауруса.

Специалистам в данной области науки нетрудно выделить термины, которыми эта наука пользуется. Сложнее построить иерархию из слов-терминов по смыслу. Однако и эта задача разрешима логическим путем. Можно разграничить смысл слов и словосочетаний, которые образуют новые значения. Например, термины скорость бурения и бурение скоростное — это не синонимы, они имеют совершенно разные значения, так же как дюнный песок и песчаная дюна. Но специалисты по информатике с успехом ликвидируют подобного рода случаи (в первом случае бурение является аспектом, а во втором — атрибутом; в сочетании песчаная дюна песок — вещественная составляющая, а в сочетании дюнный песок — причина образования дюны).

С ассоциациями дело обстоит много сложней. Ибо здесь действуют законы не двузначной, а многозначной логики.

В тезаурусах группируются, например, понятия ранение — несчастные случаи — диагноз — медицина патология — терапия или чернила — краски — печатание — письмо. Интуитивно нам понятно, что объединение этих слов оправдано. Но попробуйте-ка доказать его путем формальной логики, и вы убедитесь, что это далеко не так просто, как на первый взгляд кажется. А ведь такие связи существуют не только между обычными словами языка, но и научными терминами.

Еще в 1942 году американский исследователь А. Л. Болдуин попытался внести количественные меры в изучение смысловых связей между словами. Он подсчитал совместную встречаемость слов в письмах, написанных одной женщиной, и показал, что частоты их могут быть указателями настроений этой женщины, круга ее интересов и т. п. С тех пор предложено несколько десятков формул, по которым можно вычислять смысловые связи слов.

Применяются для выявления этих связей и электронные вычислительные машины.

Конечно, как замечает один из специалистов по информатике — Р. М. Нидхем, «нельзя ожидать, что в результате нескольких часов работы ЭВМ. будет получено нечто, что могло бы сразу же заменить интуицию и труд ученого (который все равно необходим при выборе единиц анализа и интерпретации результатов). На что мы можем надеяться — так это на то, что выявятся группы слов, ранее не замеченные, но потенциально возможные».

Тезаурусы составляются учеными в «союзе» с машиной.

Сначала группа специалистов подчеркивает термины в данной области знания. Затем тексты вводятся в ЭВМ, которая выдает эти слова в исходной форме, то есть в именительном падеже, единственном числе и т. п. Потом специалисты разбивают на участки смысловое «поле», внутри этих участков производят более мелкое деление, а полученную схему оформляют в виде анкеты.

Анкета заполняется специалистами по каждому термину, а затем она поступает в ЭВМ, которая объединяет все термины, имеющие одинаковые признаки. И, наконец, человек составляет из них тезаурус.

Семантические множители

Нельзя ли использовать тезаурусы в качестве языка-посредника при машинном переводе? Этой мыслью задались английские ученые Кембриджской лингвистической группы.

В 1959 году один из крупнейших авторитетов в области машинного перевода, Бар-Хиллел, заявил, что высококачественный перевод с помощью ЭВМ принципиально невозможен. Ибо в нашем языке есть такая многозначность слов, которую нельзя ликвидировать, не обращаясь к внешнему миру, к внеязыковой, или, как говорят ученые, экстралингвистической ситуации, машине недоступной. Бар-Хиллел привел образец подобного рода принципиально непереводимой фразы… И в том же году сотрудники Кембриджской группы добились правильного машинного перевода этой фразы!

Если все предыдущие работы по машинному переводу стремились игнорировать значение, полагая, что ЭВМ недоступно «понимание» смысла текста, то в работах Кембриджской группы акцент делался именно на перевод значения. Ведь его-то передача и является целью всякого перевода с языка на язык. Сделать же этот перевод по смыслу помог знаменитый тезаурус Роджета.

Перевод с помощью тезауруса происходит не так, как обычный человеческий или стандартный машинный перевод. Это перевод не отдельных слов или фраз. Переводятся целые абзацы. Вначале строится единая «формула смысла» данного абзаца, причем смысл фраз, входящих в него, кодируется номерами тезауруса. Затем для полученной «формулы» смысла находятся соответствующие «формулы смысла» того языка, на который переводится текст.


Еще от автора Александр Михайлович Кондратов
Книга о букве

О языкознании написано много интересных научно-популярных книг. О грамматологии — ни одной. «Книга о букве» — первая попытка рассказать об увлекательных и разнообразных проблемах, которые решает наука о письме. Рассказ о грамматологии строится как серия очерков, в которых излагаются основные проблемы этой науки. При этом главное внимание уделено наиболее важным темам — происхождению письма, его ранним этапам, типам письменности, их соотношению, общему направлению развития письма, а также методам дешифровки.


Земля людей — земля языков

В языках повсюду можно отыскать следы древнейшей истории и культурных контактов, первобытного мировоззрения и особенностей мышления данного народа. Конечно, в одной книге можно лишь приоткрыть дверь в увлекательный мир, который скрывается за такими, казалось бы, сухими и скучными страницами словарей и грамматик.В книге делается краткий обзор истории мировых языков, прослеживается связь между ними, взаимовлияния культур.


Загадка сфинкса

В 1972 году исполнится 150 лет со времени дешифровки французским ученым Франсуа Шампольоном египетских иероглифов, бывших главной загадкой древней культуры Египта.О титаническом труде Шампольона и других исследователей, о развитии египтологии, открывшей миру великую и древнюю цивилизацию планеты, о вкладе русских ученых в дешифровку иероглифов, о неразгаданных и по сей день египетских письменах рассказывается в этой книге.


Адрес — Лемурия?

Таинственные острова в Индийском океане, которых не найти на современной карте, но о которых повествуют древние источники… Дравидийские легенды о Южном материке, ушедшем на дно… Создатели древнейшей цивилизации Двуречья, прибывшие откуда-то с юга… Загадки происхождения других цивилизаций — Древнего Египта, Индостана, Элама… Прародина человечества, которую Энгельс и Геккель, Гексли и Вирхов помещали на материке, затонувшем в Индийском океане… Сухопутный «мост», соединявший Мадагаскар и другие острова с Индостаном… Не говорит ли все это о том, что некогда здесь была земля Лемурия, колыбель человеческого рода и древнейших цивилизаций?Загадку Лемурии предстоит решить будущим исследователям, прежде всего, океанографам и подводным археологам.


Загадки Великого океана

Когда-то Тихий океан открывали Кук, Лаперуз, Лисянский, Крузенштерн, Литке и другие. В наши дни идет новое открытие величайшего океана — открытие его дна, гигантской подводной страны, занимающей 1/3 поверхности нашей планеты. Исследование Тихого океана и его дна связано с решением вопроса, который вот уже около двухсот лет горячо обсуждается учеными всего мира: не существовала ли некогда в Тихом океане обширная страна (материк или группа архипелагов), ныне погруженная на дно? Гипотеза о затонувшей земле связана с целым рядом других гипотез: океанографических, археологических, лингвистических, зоологических, этнографических, геологических и т. д.Книга «Загадки Великого океана», рассчитанная на широкий круг читателей, продолжает цикл работ автора, посвященных загадкам океанов и затонувших земель.«Загадки Великого океана» — двадцать первая книга Александра Кондратова.


Была земля Арктида

Книга представляет собой вторую часть трилогии об исчезнувших землях — «магаданских Атлантидах». Известный популяризатор науки, автор более тридцати книг, рассказывает об арктическом, мосте суши, некогда соединявшем берега Евразии и Северной Америки.


Рекомендуем почитать
Легенда о Вавилоне

Петр Ильинский, уроженец С.-Петербурга, выпускник МГУ, много лет работал в Гарвардском университете, в настоящее время живет в Бостоне. Автор многочисленных научных статей, патентов, трех книг и нескольких десятков эссе на культурные, политические и исторические темы в печатной и интернет-прессе США, Европы и России. «Легенда о Вавилоне» — книга не только о более чем двухтысячелетней истории Вавилона и породившей его месопотамской цивилизации, но главным образом об отражении этой истории в библейских текстах и культурных образах, присущих как прошлому, так и настоящему.


Открытия и гипотезы, 2005 №11

Научно-популярный журнал «Открытия и гипотезы» представляет свежий взгляд на самые главные загадки вселенной и человечества, его проблемы и открытия. Никогда еще наука не была такой интересной. Представлены теоретические и практические материалы.


Жители планет

«Что такое на тех отдаленных светилах? Имеются ли достаточные основания предполагать, что и другие миры населены подобно нашему, и если жизнь есть на тех небесных землях, как на нашей подлунной, то похожа ли она на нашу жизнь? Одним словом, обитаемы ли другие миры, и, если обитаемы, жители их похожи ли на нас?».


Знание-сила, 2000 № 07 (877)

Ежемесячный научно-популярный и научно-художественный журнал.


Меч и Грааль

Взыскание Святого Грааля, — именно так, красиво и архаично, называют неповторимое явление средневековой духовной культуры Европы, породившее шедевры рыцарских романов и поэм о многовековых поисках чудесной лучезарной чаши, в которую, по преданию, ангелы собрали кровь, истекшую из ран Христа во время крестных мук на Голгофе. В некоторых преданиях Грааль — это ниспавший с неба волшебный камень… Рыцари Грааля ещё в старых текстах именуются храмовниками, тамплиерами. История этого католического ордена, основанного во времена Крестовых походов и уничтоженного в начале XIV века, овеяна легендами.


Популярно о микробиологии

В занимательной и доступной форме автор вводит читателя в удивительный мир микробиологии. Вы узнаете об истории открытия микроорганизмов и их жизнедеятельности. О том, что известно современной науке о морфологии, методах обнаружения, культивирования и хранения микробов, об их роли в поддержании жизни на нашей планете. О перспективах разработок новых технологий, применение которых может сыграть важную роль в решении многих глобальных проблем, стоящих перед человечеством.Книга предназначена широкому кругу читателей, всем, кто интересуется вопросами современной микробиологии и биотехнологии.


Научная фантастика

В сборник включены лучшие из тех произведений советских писателей-фантастов, которые впервые были опубликованы в издательстве «Знание». Это рассказы известных писателей, чей путь в научной фантастике начался в 50 — 60-е годы (Г. Альтова, Д. Биленкина, Е. Войскунского и И. Лукодьянова, Г. Гуревича, А. Днепрова, М. Емцева и Е. Парнова), а также произведения писателей младшего поколения (В. Колупаева, Г. Шаха и других). Книга рассчитана на широкий круг читателей.