Профессия: переводчик - [44]

Шрифт
Интервал

Важно здесь то, что выполнить качественный перевод без использования фоновых знаний невозможно, а систе­мы второго уровня фоновую информацию использовать не могут.

Системы третьего, высшего уровня можно сравнить с переводчиком-профессионалом, знающим тематику переводимого текста.

Системы третьего уровня используют модели синтакси­ческого и семантического анализа и синтеза, а также (что их и отличает) концептуальные модели окружающего ми­ра. К сожалению, как уже говорилось, они существуют лишь на стадии эксперимента.

Таким образом, рынок коммерческих программных продуктов для автоматического перевода предлагает пока что лишь системы второго уровня. Давайте рас­смотрим более подробно, как они работают и как их мо­жет применить в своей работе переводчик.

Очевидно, что основой любой системы машинного пе­ревода является автоматический словарь, и коммерческие системы второго уровня не являются исключением.

Как правило, все эти системы снабжены большими сло­варями, а в некоторых из них имеется очень важная, на мой взгляд, функция пополнения словарей новой лекси­кой.

Автоматический словарь системы машинного перевода - это программный модуль, который выполняет следую­щие функции:

а) распознает во входном тексте символьные цепочки слов и словосочетаний, например, символьная строка пред­ложения LEAD*ABSORBS*RADIATION.(* - пробел) бу­дет разделена на цепочки словоформ LEAD, ABSORBS и RADIATION;

6) преобразует текстовые словоформы в словарный вид, например, словоформу ABSORBS в вид ABSORB;

в) по графемному составу слова регистрирует грамматиче­скую информацию о слове, например, флексию S в слове ABSORBS, которая может быть признаком третьего лица глагола или множественного числа существительного, или суффикс -TION в слове RADIATION, который мо­жет служить формальным признаком отглагольного существительного;

г) регистрирует информацию, имеющуюся в словарном файле для данного слова, - переводные эквиваленты, грамматические и семантические признаки исходного

слова и его переводного эквивалента, например, для слова RADIATION эти данные могут выглядеть таким образом: RADIATION; (N); (process; characteristics) = РАДИАЦИЯ, (N); (процесс, характеристика); ИЗЛУЧЕ­НИЕ, (N); (процесс, характеристика);

д) формирует синтаксическое и семантическое представ­ление входного текста (как правило, предложения), на­пример, для предложения LEAD ABSORBS RADIATION такое синтактико-семантическое представление может иметь вид:

(lead)=V(TRANS/OBJ=Nanim,inanim)/N (MATER/ ABSTR); (absorbs) =V(TRANS,SUBJ=Ninanim, mater; OBJ=Ninanim, mater);

(radiation)=N(PROC/PARAM).

Здесь нужно сделать оговорку. Я думаю, достаточно очевидно, что приведенная в примерах информация по синтаксическим и семантическим моделям носит иллюст­ративный характер и ни в коей мере не претендует на пол­ноту или универсальность. То же можно сказать и о тех примерах, которыми будет иллюстрироваться работа дру­гих модулей системы автоматического перевода.

В каждой конкретной системе данные и процедуры их обработки имеют свою специфику. Зачастую такая ин­формация даже носит конфиденциальный характер.

Моя же задача состоит лишь в том, чтобы показать на примерах основные функции программного модуля авто­матического словаря и других типовых модулей перево­дящего автомата. Но вернемся к описанию функций.

Выходные данные модуля автоматического словаря, т.е. синтаксическое и семантическое представление исходного текста и семантико-синтаксическая информация о пере­водных эквивалентах поступают на вход второго этапа об­работки, т.е. на вход модуля преобразования синтактико-семантического представления входного текста в синтак­тико-семантическое представление выходного. Это преоб­разование в специальной литературе носит заимствован­ное название "трансфер".

В процессе трансфера:

1. Производится анализ синтаксиса и семантики вход­ного текста и уточняется его структура. При этом структу­ра предложения выражается в форматах так называемой машинной грамматики, т.е. в виде формального описания синтаксических (и, как правило, семантических) элементов предложения и отношений между ними.

Сейчас чаще всего используют грамматику зависимо­стей или непосредственно составляющих в форматах "уни-фикационной грамматики {unification grammar)">37.

Так, например, в результате обработки на этапе анализа уточненная синтактико-семантическая структура того же английского предложения может иметь вид:

N(MATER/ABSTR)(SUBJECT)<=(PREDICATE) V(TRANS,SUBJ=Ninanim, mater; OBJ=Ninanim, mater)=> (OBJECT)N(PROQPARAM).

2. Преобразование структуры входного предложения в промежуточную (ядерную) структуру по правилам ма­шинной грамматики. Например, по правилам грамматики непосредственно составляющих такое преобразование бу­дет иметь вид:

NVN=>NV=>V.

3. Синтез синтаксической структуры выходного пред­ложения. Для нашего простого примера она может быть двоякой:

- для предложения с глаголом-сказуемым в действи­тельном залоге:

Nl(nomin) V(active) N2(accus.);

- для предложения с глаголом-сказуемым в страдатель­ном залоге:

N2(nomin) V(passive) Nl (instr.).

После этапа трансфера следует этап лексического синте­за элементов выходного предложения, т.е. выбор эквива­лентов по синтаксическим и семантическим признакам.


Рекомендуем почитать
Знание-сила, 2003 № 10 (916)

Ежемесячный научно-популярный и научно-художественный журнал.


Охотники за нейтрино. Захватывающая погоня за призрачной элементарной частицей

Эта книга – захватывающий триллер, где действующие лица – охотники-ученые и ускользающие нейтрино. Крошечные частички, которые мы называем нейтрино, дают ответ на глобальные вопросы: почему так сложно обнаружить антиматерию, как взрываются звезды, превращаясь в сверхновые, что происходило во Вселенной в первые секунды ее жизни и даже что происходит в недрах нашей планеты? Книга известного астрофизика Рэя Джаявардхана посвящена не только истории исследований нейтрино. Она увлекательно рассказывает о людях, которые раздвигают горизонты человеческих знаний.


Здоровая пища — поиски идеала. Есть ли золотая середина в запутанном мире диет?

Наше здоровье зависит от того, что мы едим. Но как не ошибиться в выборе питания, если число предлагаемых «правильных» диет, как утверждают знающие люди, приближается к 30 тысячам? Люди шарахаются от одной диеты к другой, от вегетарианства к мясоедению, от монодиет к раздельному питанию. Каждый диетолог уверяет, что именно его система питания самая действенная: одни исходят из собственного взгляда на потребности нашего организма, другие опираются на религиозные традиции, третьи обращаются к древним источникам, четвертые видят панацею в восточной медицине… Виктор Конышев пытается разобраться во всем этом разнообразии и — не принимая сторону какой-либо диеты — дает читателю множество полезных советов, а попутно рассказывает, какова судьба съеденных нами генов, какую роль сыграло в эволюции голодание, для чего необходимо ощущать вкус пищи, что и как ели наши далекие предки и еще о многом другом…Виктор Конышев — доктор медицинских наук, диетолог, автор ряда книг о питании.Книга изготовлена в соответствии с Федеральным законом от 29 декабря 2010 г.


Ньютон. Закон всемирного тяготения. Самая притягательная сила природы

Исаак Ньютон возглавил научную революцию, которая в XVII веке охватила западный мир. Ее высшей точкой стала публикация в 1687 году «Математических начал натуральной философии». В этом труде Ньютон показал нам мир, управляемый тремя законами, которые отвечают за движение, и повсеместно действующей силой притяжения. Чтобы составить полное представление об этом уникальном ученом, к перечисленным фундаментальным открытиям необходимо добавить изобретение дифференциального и интегрального исчислений, а также формулировку основных законов оптики.


Легенда о Вавилоне

Петр Ильинский, уроженец С.-Петербурга, выпускник МГУ, много лет работал в Гарвардском университете, в настоящее время живет в Бостоне. Автор многочисленных научных статей, патентов, трех книг и нескольких десятков эссе на культурные, политические и исторические темы в печатной и интернет-прессе США, Европы и России. «Легенда о Вавилоне» — книга не только о более чем двухтысячелетней истории Вавилона и породившей его месопотамской цивилизации, но главным образом об отражении этой истории в библейских текстах и культурных образах, присущих как прошлому, так и настоящему.


Открытия и гипотезы, 2005 №11

Научно-популярный журнал «Открытия и гипотезы» представляет свежий взгляд на самые главные загадки вселенной и человечества, его проблемы и открытия. Никогда еще наука не была такой интересной. Представлены теоретические и практические материалы.