PC Magazine/RE, 2009 № 09 - [12]

Шрифт
Интервал

Технологии автоматизированного перевода в мире за последние годы развивались экстенсивно. Интернет позволил набрать громадную статистику по массе языков, текстам разного стиля и тематики; большие надежды возлагались на статистические методы перевода, когда система перевода работает буквально «в лоб»: очевидно, что, имея гигантскую БД одних и тех же текстов на разных языках, можно выявить соответствующие оригиналы и переводы сначала для словосочетаний, затем для предложений, абзацев и, наконец, текстов. Эта идея реализована, например, в Web-службе переводов поисковика Google, неплохое качество его работы поначалу стало причиной весьма радужных прогнозов. Жизнь, как водится, внесла коррективы. Практика показала, что статистический подход имеет ряд серьезных ограничений, не позволяющих говорить о решении столь сложной задачи, как машинный перевод. Во-первых, этот метод принципиально зависит от объема словарных БД, во-вторых, неуверенно справляется с длинными предложениями (поскольку снижается вероятность найти правильный перевод в БД и приходится склеивать их из фрагментов, лишь в некоторой степени вроде бы соответствующих смыслу) и т. д. Для «бета-версии» такой прием сгодится, но в реальной работе (с переводом деловых документов, бланков, презентаций, руководств и пр.) требуется нечто более эффективное. Возможности настройки такой системы более чем ограниченны, да и те, что имеются, доступны скорее программистам Google, но никак не конечному пользователю. И если работать с переводом необходимо здесь и сейчас, то практически остается только переводчик PROMT (если говорить о нашей стране и русском языке), либо Web-служба translate.ru, построенная на общем для программ PROMT, ядре перевода (хотя она и имеет ряд ограничений, связанных с ее бесплатностью).

Интерфейс PROMT 8.5 внешне не слишком отличается от интерфейса предыдущей версии. Главная программа комплекса, лингвистический редактор, и ряд дополнительных утилит имеют интерфейс в стиле Office 2007 с фирменной «лентой» вместо меню. Здесь стоит быть внимательным, поскольку в недра ленточных панелей упрятаны некоторые полезные функции (например, команда «Загрузить из файла» в утилите Dictionary Editor; по словам разработчиков, к моменту выпуска новой версии будут внесены исправления). И если в прошлом мы сталкивались с некоторыми неприятными мелочами (вроде сброса выделения текста), ныне они в основном исправлены.

Система стала ощутимо быстрее, особенно это заметно при редактировании словарей и добавлении в пользовательский словарь оборотов со сложным управлением. Хотелось бы отметить явное ускорение обработки документов, если подключены объемные базы «памяти перевода» (Translation Memory, TM). У нас имеется собственная БД такого рода, в ней содержатся парные переводы из статей журнала за несколько лет. База данных довольно объемная (порядка шести тысяч пар «оригинал – перевод»), причем для весьма длинных предложений. Это становилось причиной снижения скорости перевода при активации процедуры нечеткого поиска (т. е. снижении порога точности совпадения фраз из Translation Memory до величины менее 100 %).

Причины вполне понятны: в такой конфигурации система вынуждена «перелопачивать» базы данных Translation Memory, рассчитывая степень соответствия каждого фрагмента предложения. В итоге для текстов объемом 100–120 тыс. знаков процесс перевода в PROMT 8.0 порой занимал несколько часов, менее объемные тексты (15–18 тыс. знаков) требовали до 30–40 мин. В тестах с PROMT 8.5 отмечено заметное ускорение, тот же тестовый документ (15 тыс. знаков) был переведен примерно за 7 мин. (Без Translation Memory перевод занял около 23 с в PROMT 8.0 и 15 с в PROMT 8.5.)

Из недостатков отметим только незначительную проблему с импортом текстов в формате TMX в память переводов средствами модуля Translation Manager: при наличии ошибки в TMX-файле не выдается никакой диагностики, просто создается пустое окно. Причина, вероятнее всего, кроется в каких-то особенностях XML-парсера Microsoft и обходится предварительным прогоном файла через утилиту TMXCheck (доступна на сайте отраслевой ассоциации lisa.org), но хотелось бы видеть более внятное сообщение об ошибке.

Из общих пожеланий, реализации которых мы, к сожалению, не нашли в новой версии, можно назвать более развитые возможности для использования макрокоманд. Пакет позволяет подключать внешние сценарии (на языках, совместимых с Active Scripting Engine, в частности JavaScript и VBScript), но программно доступен довольно небольшой набор возможностей.

Качество перевода, как уже отмечалось, возросло. В частности, разработчики отмечают, что были уточнены поиск антецедента для its, анализ слова that, процедура русского синтеза в отношении места наречия, улучшена транслитерация с английского языка на русский и др.

Мы попытались оценить повышение качества перевода на собственном корпусе текстов и действительно можем констатировать улучшение. При выборочном сравнении с переводами, сделанными PROMT 8.0, процент редакторской обработки заметно снизился (по предварительным оценкам, на 6–10 %).


Еще от автора PC Magazine/RE
PC Magazine/RE, 2009 № 12

Главный материал декабрьского номера, традиционный предновогодний обзор «советы Деду Морозу 2009», адресован самому широкому кругу читателей, озадаченных выбором приянного и полезного подарка.Также в номере:Системные платы: четырехъядерность на маршеУже много лет этапы жизненного/рыночного цикла технологии можно кратко описать так: роскошь – насущная необходимость – устарело. Четырехъядерные процессоры пока находятся на первом этапе, хотя определенные признаки движения в сторону второго уже видны: если все равно назрела смена системы, то именно на такую, но переходить на нее «насильственно» пока рано.


PC Magazine/RE, 2009 № 11

Главный материал ноябрьского номера – «Неттопы: экономия не в ущерб эффективности» – представляет собой обзор восьми сверхкомпактных, но достаточно производительных настольных компьютеров. Статья адресована широкому кругу пользователей и демонстрирует, что малютки с ценой нетбуков способны окончательно вытеснить ПК в корпусах «башня» с конторских столов.Также в номере:Программы: урожай 2009Нельзя сказать, чтобы кризис никак не отозвался на индустрии программного обеспечения, но, если пользоваться двоичной системой медиков из «Буратино», пациент скорее жив.


PC Magazine/RE, 2009 № 08

Главный материал августовского номера, обзор «Офисные мониторы: антикризисные дюймы», представляет результаты сравнительных испытаний шести моделей широкоформатных ЖК-мониторов с диагональю 22 дюйма. «Поскольку в нынешних условиях все большую популярность приобретает сдельная и дистанционная работа, домашний компьютер превращается из игрушки в персональное средство производства. И в этом отношении крайне важно, чтобы работать с ним – точнее даже, им – было удобно. К счастью, как раз незадолго до кризиса рынок ЖК-панелей испытал серьезное потрясение.


PC Magazine/RE, 2009 № 10

Главный материал октябрьского номера, обзор «Проекторы: мини-, микро-, пико-…», посвящен изучению возможностей современных портативных проекторов.Также в номере:Расцвет HDD, заря SSDДля тех, кто решил модернизировать свой компьютер, настали трудные времена: новейшие полупроводниковые накопители во всех отношениях превосходят старые добрые «винчестеры», кроме одного – цены. А уж если человек начал подсчитывать, что почем, не перестанет. Лаборатория PC Magazine/RE поможет вам понять, за что же берут деньги изготовители системных дисков…Mac OS X Snow Leopard – дружелюбный хищник«Когда речь заходит о продукции компании Apple, равнодушных нет!» – с этим не будут спорить обитатели обоих лагерей в «священной войне».


Рекомендуем почитать
Цифровой журнал «Компьютерра» 2012 № 48 (148)

ОглавлениеКолумнистыДмитрий Вибе: Заблудшая планета Автор: Дмитрий ВибеВасилий Щепетнёв: Укрепление тары Автор: Василий ЩепетневКафедра Ваннаха: Душа по Пенроузу Автор: Михаил ВаннахГолубятня-ОнлайнГолубятня: Аудиофилия второй волны Автор: Сергей Голубицкий.


Компьютерра PDA N136 (17.09.2011-23.09.2011)

ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Ужастик ЕвернотВаннах Михаил: Кафедра Ваннаха: Углерод и кремнийДенис Злобин: Пиратство: почему мы перестали ценить информациюСергей Голубицкий: Голубятня: Исход из 1PasswordВасилий Щепетнев: Василий Щепетнёв: Исчезновение столицыДмитрий Шабанов: Аргумент ХойлаАлла Аршинова: Александр Бондарь (ИЯФ СО РАН) о megascience-проектахВаннах Михаил: Кафедра Ваннаха: Удешевить странуЮрий Ильин: После шаттла: "Клипер" и "Русь"Киви Берд: Кивино гнездо: Дежавю, или Хождение по кругуСергей Голубицкий: Голубятня: News360 и ZiteВасилий Щепетнев: Василий Щепетнёв: Светлая сторона торгаАлександр Амзин: Возникнут модыАндрей Федив: Обзор Windows 8 Developer PreviewВаннах Михаил: Кафедра Ваннаха: Демократия хищных вещейДмитрий Вибе: Почтальон сойдёт с ума.


Компьютерра PDA N142 (22.10.2011-28.10.2011)

ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Хронотоп детстваВасилий Щепетнев: Василий Щепетнёв: Колхоз имени Тома СойераЕвгений Лебеденко, Mobi.ru: Микропроцессор Hobbit: на каком языке говорили полуросликиВаннах Михаил: Кафедра Ваннаха: Intel в зеркале финансов Киви Берд: Кивино гнездо: Стены и мосты Олег Нечай: Обзор NAS Buffalo Link Station Pro Duo 2 ТВВасилий Щепетнев: Василий Щепетнёв: Без параллелейЕвгений Крестников: Валентин Макаров (РУССОФТ) о тендере на создание НППВаннах Михаил: Кафедра Ваннаха: Выкидуха в боюДмитрий Шабанов: Аргумент ГоссеАлександр Амзин: На отвлечённую темуСергей Голубицкий: Голубятня: Будучи ТАМВасилий Щепетнев: Василий Щепетнёв: До двенадцатого знакаДмитрий Вибе: Немного холодной воды у солнцаАндрей Федив: Обзор телефона Apple iPhone 4S.


Компьютерра PDA N174 (19.05.2012-25.05.2012)

ОГЛАВЛЕНИЕДмитрий Вибе: Ударим Венерой по МарсуВасилий Щепетнев: Василий Щепетнёв: После точкиСергей Голубицкий: Голубятня: От ашрама-дхармы к президенту-вампируДмитрий Шабанов: Объемное слышаниеОлег Нечай: PocketBook A 10": планшет, притворяющийся ридеромДмитрий Вибе: Так будет не всегда.


Цифровой журнал «Компьютерра» 2012 № 28 (128)

ОглавлениеСтатьиОбратная сторона эпохи пост-ПК: 30-долларовый компьютер Raspberry Pi Автор: Андрей ПисьменныйТерралабКак производятся материнские платы Автор: Олег НечайКолумнистыКафедра Ваннаха: Европейский лидер Автор: Михаил ВаннахВасилий Щепетнёв: Честь пикейного жилета Автор: Василий ЩепетневДмитрий Шабанов: Судьба точек роста в системе декоративного образования Автор: Дмитрий ШабановДмитрий Вибе: Лунная астрономия Автор: Дмитрий ВибеГолубятня-ОнлайнГолубятня: Про одного битого зелёного слоника Автор: Сергей ГолубицкийГолубятня: 4 спичечных коробка Автор: Сергей Голубицкий.


Цифровой журнал «Компьютерра» 2012 № 08 (108)

ОглавлениеКолумнистыКафедра Ваннаха: Горячая цифровая война Автор: Михаил ВаннахДмитрий Шабанов: Парадокс ускорения эволюции Автор: Дмитрий ШабановКивино гнездо: Пароль для серой зоны Автор: Киви БердВасилий Щепетнёв: Предсказания и пророчества Автор: Василий ЩепетневДмитрий Вибе: Мы сверху Автор: Дмитрий ВибеГолубятня-ОнлайнГолубятня: Идеальный мобильный звук. Часть вторая Автор: Сергей Голубицкий.