Профессия: переводчик - [45]

Шрифт
Интервал

За лексическим синтезом следует графемный синтез (преобразование словарных форм переводных эквивален­тов в соответствующие текстовые формы - в нужном па­деже, лице, числе и т.д.). В результате выходное предложе­ние принимает вид:

свинец (лот / грузило / проводник) всасывает (впиты­вает / абсорбирует / амортизирует / поглощает) излуче­ние (радиацию) или

излучение (радиация) впитывается (абсорбируется / амортизируется / поглощается) свинцом (лотом / гру­зилом / проводником).

Так в общих чертах работает переводящий автомат второго уровня, построенный по схеме синтактико-семан-тического трансфера. Такой автомат строится для опреде­ленной пары языков и, как вы сами можете судить, ис­пользует алгоритмические процедуры анализа и синтеза на основе синтаксической и семантической информации.

Как уже говорилось, большинство коммерческих пере­водящих систем работает на этом принципе. В некоторых из них синтактико-семантическая информация более пол­ная и алгоритмы анализа более тонкие, чем в других. Такие "электронные переводчики" переводят чуть лучше, чем их более примитивно устроенные "братья по классу", но в лю­бом случае без привлечения фоновой информации они не в состоянии конкурировать с человеком.

Кроме схемы трансфера в переводящих системах второ­го уровня применяется также так называемый язык-посредник. Язык-посредник (interlingua, pivot language) -это некий универсальный код, с помощью которого мож­но единым образом выразить грамматическую и семанти­ческую информацию, содержащуюся в тексте на любом языке.

Задача переводящего автомата, применяющего язык-посредник, будет состоять в том, чтобы преобразовать текст на одном языке в форму языка-посредника, а затем, используя средства другого языка, генерировать выходной текст из форматов языка-посредника.

Привлекательность этой идеи достаточно очевидна, но ее практическое воплощение оказалось очень непростым. И хотя некоторые зарубежные системы в своих рекламных буклетах пишут об использовании единого языка-посредника для автоматического перевода с разных язы­ков, это, насколько мне известно, скорее рекламный при­ем, чем действительное положение вещей.

Описать в едином формате даже структурно подобные языки достаточно сложная задача сама по себе, не говоря уже о ее алгоритмической реализации. Поэтому в настоя­щее время, несмотря на обширный теоретический матери­ал, едва ли можно говорить о коммерческих системах ма­шинного перевода, работающих на принципе языка-посредника.

Такова ситуация с практической реализацией систем второго уровня.

Что же касается систем третьего уровня, то, как уже го­ворилось выше, экспериментальные системы такого типы разработаны лишь для некоторых очень ограниченных тематических сфер.

В этих системах окончательное решение о выборе пере­водного эквивалента принимается "блоком принятия ре­шений" на основе так называемой базы знаний - формаль­ного описания фрагмента реального мира (его составляю­щих и отношений между ними). Сложность концептуаль­ной и программной реализации таких систем, я думаю, очевидна.

Особое место в теории и практике машинного перевода занимают системы, основанные на статистических моделях переводных соответствий.

Согласно статистическому подходу к конструированию систем автоматического перевода, любое слово одного языка может быть переведено любым словом другого, только с разной вероятностью.

Задача переводящего автомата, работающего на веро­ятностном принципе достаточно проста.

На первом этапе, называемом этапом обучения, этот

автомат должен сравнивать оригинальные тексты и вы­полненные человеком переводы этих текстов и регистри­ровать величины вероятности разных переводных эквива­лентов.

Параллельно на этапе обучения автомата в зависимости от используемой модели регистрируется либо порядок слов в исходном и переводном предложении, либо вероят­ность перевода двух-, трехсловных словосочетаний.

В итоге на основании анализа параллельных двуязыч­ных текстов автомат после этапа обучения составляет сло­варь наиболее вероятных эквивалентов.

После этого следует этап перевода, когда автомат, поль­зуясь составленным таким образом вероятностным слова­рем, переводит новый текст. В случае неполноты словаря обучение автомата продолжают на новом массиве парал­лельных текстов.

Такова общая идея. Конечно, она представлена упро­щенно - в действительности вычисление вероятности пе­реводных эквивалентов производится по сложным много­параметрическим формулам, учитывающим текстовое ок­ружение исходного и переводного слова.

Идея статистического машинного перевода появилась еще в пятидесятые годы, но сейчас она снова становится популярной. Возрождение идеи статистического машин­ного перевода можно объяснить следующим:

• Огромными технологическими возможностями со­временных компьютеров (память, быстродействие).

• Наличием больших объемов двуязычных параллель­ных текстов на машинных носителях.

• Отсутствием стройной и непротиворечивой теории перевода, которая смогла бы выдержать проверку на компьютерной модели.

Статистические модели перевода активно разрабатыва­ются в США и в некоторых других странах, и, на мой взгляд, у них большое будущее.


Рекомендуем почитать
Знание-сила, 2003 № 10 (916)

Ежемесячный научно-популярный и научно-художественный журнал.


Охотники за нейтрино. Захватывающая погоня за призрачной элементарной частицей

Эта книга – захватывающий триллер, где действующие лица – охотники-ученые и ускользающие нейтрино. Крошечные частички, которые мы называем нейтрино, дают ответ на глобальные вопросы: почему так сложно обнаружить антиматерию, как взрываются звезды, превращаясь в сверхновые, что происходило во Вселенной в первые секунды ее жизни и даже что происходит в недрах нашей планеты? Книга известного астрофизика Рэя Джаявардхана посвящена не только истории исследований нейтрино. Она увлекательно рассказывает о людях, которые раздвигают горизонты человеческих знаний.


Здоровая пища — поиски идеала. Есть ли золотая середина в запутанном мире диет?

Наше здоровье зависит от того, что мы едим. Но как не ошибиться в выборе питания, если число предлагаемых «правильных» диет, как утверждают знающие люди, приближается к 30 тысячам? Люди шарахаются от одной диеты к другой, от вегетарианства к мясоедению, от монодиет к раздельному питанию. Каждый диетолог уверяет, что именно его система питания самая действенная: одни исходят из собственного взгляда на потребности нашего организма, другие опираются на религиозные традиции, третьи обращаются к древним источникам, четвертые видят панацею в восточной медицине… Виктор Конышев пытается разобраться во всем этом разнообразии и — не принимая сторону какой-либо диеты — дает читателю множество полезных советов, а попутно рассказывает, какова судьба съеденных нами генов, какую роль сыграло в эволюции голодание, для чего необходимо ощущать вкус пищи, что и как ели наши далекие предки и еще о многом другом…Виктор Конышев — доктор медицинских наук, диетолог, автор ряда книг о питании.Книга изготовлена в соответствии с Федеральным законом от 29 декабря 2010 г.


Ньютон. Закон всемирного тяготения. Самая притягательная сила природы

Исаак Ньютон возглавил научную революцию, которая в XVII веке охватила западный мир. Ее высшей точкой стала публикация в 1687 году «Математических начал натуральной философии». В этом труде Ньютон показал нам мир, управляемый тремя законами, которые отвечают за движение, и повсеместно действующей силой притяжения. Чтобы составить полное представление об этом уникальном ученом, к перечисленным фундаментальным открытиям необходимо добавить изобретение дифференциального и интегрального исчислений, а также формулировку основных законов оптики.


Легенда о Вавилоне

Петр Ильинский, уроженец С.-Петербурга, выпускник МГУ, много лет работал в Гарвардском университете, в настоящее время живет в Бостоне. Автор многочисленных научных статей, патентов, трех книг и нескольких десятков эссе на культурные, политические и исторические темы в печатной и интернет-прессе США, Европы и России. «Легенда о Вавилоне» — книга не только о более чем двухтысячелетней истории Вавилона и породившей его месопотамской цивилизации, но главным образом об отражении этой истории в библейских текстах и культурных образах, присущих как прошлому, так и настоящему.


Открытия и гипотезы, 2005 №11

Научно-популярный журнал «Открытия и гипотезы» представляет свежий взгляд на самые главные загадки вселенной и человечества, его проблемы и открытия. Никогда еще наука не была такой интересной. Представлены теоретические и практические материалы.