Цифровой журнал «Компьютерра» 2011 № 37 (85) - [19]
14 лет назад из-под тонких пальчиков профессиональной машинистки выскочили 219 страничек моей диссертации. Как водится, первый экземпляр перекочевал к научному руководителю, второй — на кафедру, третий — в Ленинскую библиотеку в архивный отдел, а вот четвертый я зажал на память. Все эти годы я периодически возвращался к этим желтым и жухлым страничкам и всякий раз убеждался, что они — лучшее, что я создал в этой жизни. Вполне естественно, что желание перевести свою диссертацию в электронный вид не покидало меня ни на одно мгновение. Я набрасывался на всякий новый пакет OCR, но вот что из этого получалось, я вам сейчас продемонстрирую.
Перед вами типичный образец оригинального текста:
По большому счету, ничего тут героического нет: ну бледненько все, ну буквы неравномерно отбились — эка невидаль! Машинистка у меня была профессиональная — брала по восемьдесят копеечек за страницу, поэтому опечаток и замазок — самая малость. Не тут-то было! Этот «исходник» оказался не по зубам всем OCR без исключения.
То, как распознал этот отрывок FineReader предыдущей версии (4.64 Professional), достойно музея Гугенхайма:
Я насчитал только пять правильно распознанных слов (из двадцати девяти). Сами понимаете, «оцифровывание» моей диссертации пришлось отложить до лучших времен — проще все по новой перепечатать.
Приблизительно таким же был результат у CuneiForm 96 и CuneiForm 97, и CuneiForm 98… В какой-то момент я окончательно решил, что — не судьба. Как вдруг на свет появился CuneiForm 2000. Прорыв налицо:
Почувствуй, как говорится, разницу! Не беда, что «вещи с самом совой» и гарантия в четыре слова — «р их га антий». Тут уже можно было работать. И я принялся не спеша, неделя за неделей, разгребать авгиевы конюшни ультрасовременных технологий.
Но, как оказалось, я переоценил свое терпение. Потому что через месяц мне вся эта процедура обрыдла выше крыши. И я опять остался сидеть у самого синего моря в ожидании золотой рыбки.
В минувшее воскресенье я подставил свою диссертацию под FineReader 5.0. В успех не верил. Вот что получилось:
Нужны ли какие-нибудь комментарии? Нужны ли мои традиционные «эмоции взахлеб»? Думаю — нет. Факты, господа, одни только факты. Говорят, «аббисты-файнридерцы» переписали код программы с нуля. Если это так, то перед нами лишнее доказательство того, что русский человек не может ничего построить без того, чтобы сперва не развалить!
Помнится, дорогие аббийцы на меня за тот текст тогда обиделись, даже прислали письмо в редакцию с предложением провести независимое тестирование, давая понять, что мои результаты по четвертой версии — следствие мною же криво выставленных настроек. Я оправдывался: писал, что никаких настроек вообще не настраивал, а просто запускал процесс распознания текста по умолчанию, что говорится, из коробки. Детство отечественной айти-журналистики, чего уж там ☺
_________________________
За 11 лет много воды утекло: канула в Лету добрая «Кунейка» (CuneiForm) — единственный достойных конкурент Abbyy (не считать же конкурентом жуткий американский IRIS). Файнридер, однако, в нарушение всех законов и канонов бизнеса, оказавшись в гордом монопольном одиночестве, не то что не испортился-зазнался-остановился-в-развитии-деградировал, как чаще всего и бывает в бесконкурентном пространстве, а продолжил реально набирать обороты, превратившись в абсолютный мировой стандарт (с мировым же именем) и достигнув акурат маяковского состояния: «Мы говорим OCR — подразумеваем Файнридер, и наоборот».
Но даже не это самое главное. Мало того, что FR стал стандартом, так он еще и сохранил молодость технологического порыва, совершенствуя движок OCR, а не только рюшки-ряшки пользовательского интерфейса!
Именно эту уникальную способность FineReader к самосовершенствованию я и хочу сегодня продемонстрировать читателям. Я взял ту же самую историческую страничку своей диссертации и скормил ее одиннадцатой версии программы. Смотрите, что получилось:
Здесь не нужны комментарии. Это просто фантастика. Смотрите, что при этом творит Файнридер:
Программа констатирует ущербность качества исходного изображения, однако вместо претензий к пользователю (ну-ка быстро исправил мне разрешение! добавил DPI!), знакомых по предыдущим версиям, спокойно и самостоятельно за кадром доводит картинку до нужной кондиции. Такой, которая позволяет провести безупречное распознание текста.
Как водится, в новом одиннадцатом релизе множество мелких фич и примочек, с которыми читатель при желании самостоятельно ознакомится на сайте Abbyy. Меня интересовали лишь ключевые моменты, которые бы оправдали апгрейд даже самого консервативного пользователя. Помимо помянутого улучшения движка OCR в FineReader 11.0 я обнаружил еще одну функцию, заставившую меня даже хлопнуть в ладоши:
Почему подавляющее большинство офисных программ сегодня делает вид, что на рынке не существует двух абсолютно приоритетных для пользователя формата — EPUB и FB2 — ускользает от моего понимания. Ортодоксальная косность — другого объяснения не подберешь. Чего стоит отсутствие хоть какого-то нормального вьюера для EPUB на Маке, в котором этот формат является де-факто стандартом для чтения в iTunes.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
ОглавлениеКолонкаПочему мы позволяем нас обманывать, или Грустные размышления об иррациональности политической жизни Автор: Дмитрий ШабановГолубятня: Samsung Galaxy S4 — цидули перебежчика (часть 1) Автор: Сергей ГолубицкийУроки любви к Родине: McAfee патентует технологию обнаружения и блокировки пиратского содержания Автор: Сергей ГолубицкийПодпадает ли астрономия под закон о митингах Автор: Дмитрий ВибеIT-рынокНасколько глупа шумиха вокруг «умных» часов? Автор: Андрей ПисьменныйПромзонаПосмотрите на свалку, которую китайцы превратили в парк Автор: Николай МаслухинЭтот сайт позволяет создать собственное световое шоу на точном макете Токио Автор: Николай МаслухинТехнологииДжипег, подвинься! Веппи как единственный необходимый графический формат Автор: Евгений ЗолотовИнновацииПочему менеджерам российских корпораций не нужны стартапы Автор: Елена КраузоваИнга Нахмансон (Fitting Reality): «Российскому e-commerce не до виртуальности» Автор: Елена КраузоваГидGoogle Now для iOS появился без лишнего шума и уже собирает сведения Автор: Андрей Васильков.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Документ создан на основе открытого контента, расположенного по адресуhttp://offline.computerra.ru/2005/599/Размер изображений не менялся, поэтому некоторые могут быть некорректно отображены на неVGA-моделях КПК (особенно скриншоты и таблицы).
ОглавлениеТерралабOpera 10.50: оперативный релиз Автор: Андрей КрупинАнтивирус со вкусом "Яндекса" Автор: Андрей КрупинБлоки питания на любой случай, часть 2. 600–700 Вт Автор: Константин ИвановОбзор Samsung i5700 Galaxy Spica Автор: Алексей СтародымовСвоя играМодель чугунного дирижабля, или Учитель Добреску — 2 Автор: Василий ЩепетневКафедра Ваннаха: Нано-блюз Автор: Ваннах МихаилВасилий Щепетнёв: Разбор полётов перед стартом Автор: Василий ЩепетневКивино гнездо: За что боролись Автор: БЕРД КИВИОткрытые системы Королевского Флота Автор: Ваннах МихаилИнтерактивCeBIT 2010: первые новинки Автор: Алексей СтародымовReaDitorialMovavi: история развития Автор: Наталья ХудяковаГолубятня-ОнлайнГолубятня: Хули Холи Автор: Сергей ГолубицкийГолубятня: Бабу Автор: Сергей ГолубицкийГолубятня: Агора № 20 Автор: Сергей ГолубицкийНаука и жизньМарсианский экспресс Автор: Олег Волошин.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Далия ТРУСКИНОВСКАЯВИХРИ ВРАЖДЕБНЫЕ… грозят человечеству, и если бы не домовые, трудно сказать, что с нами было бы.А. ВАЛЕНТИНОВ, М. и С. ДЯЧЕНКО, Г. Л. ОЛДИПЕНТАКЛЬО сути нового совместного проекта расскажут читателям сами авторы.Наталия ИПАТОВАНЕСКОЛЬКО ШАГОВ, ЧТОБЫ ИСЧЕЗНУТЬДело тов. Дзержинского, лучшего друга детей, живет теперь уже в среде малолетних орков, эльфов и гномов.Евгений БЕНИЛОВЛГУНЬЯНикогда не разговаривайте с незнакомцами, а с незнакомками — тем паче.Чарлз ДЕ ЛИНТ«МОЛ ЖИЗНЬ, КАК ПТИЦА»Честно говоря, омерзительный тип! И чего он привязался к бедняжке…Грегор ХАРТМАННГЕНРИ В ДЕРЕВАХМолодой колдун «завязал» с магией.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
"Литературная газета" общественно-политический еженедельник Главный редактор "Литературной газеты" Поляков Юрий Михайлович http://www.lgz.ru/.
ОглавлениеКолонкаПринуждение к альтруизму, или 451 градус политкорректности Автор: Василий ЩепетнёвМатематика как ресурс: На каком наследии работает отрасль информационных технологий Автор: Михаил ВаннахГолубятня: Праздник на нашей улице, или Фактура, столь редкая для софтверных обзоров Автор: Сергей ГолубицкийТень Рикардо: Чему биржевик и мыслитель былых времён может научить нас в информационную эру? Автор: Михаил ВаннахЗаказная мифология IT-прессы Автор: Сергей ГолубицкийЛожь навсегда: почему нас обманывают снова и снова Автор: Василий ЩепетнёвИгра в беспилотники: Как технологии боевых роботов соотносятся с классическим римским правом Автор: Михаил ВаннахСотая колонка: попытка перевести дух, осмотреться и понять, что и зачем я делаю Автор: Дмитрий ШабановВот и пришел Песочный Человек: о презентации Samsung своего нового флагмана и харакири Филла Шиллера Автор: Сергей ГолубицкийЧто общего между отключением Google Reader, заявлением Элиссы Финк и жалобой Дина Гарфилда? Автор: Сергей ГолубицкийОрганика в старом веществе Солнечной системы Автор: Дмитрий ВибеIT-рынокКак компьютеры, стоящие доллар, изменят привычные вещи и перевернут всё с ног на голову Автор: Андрей ПисьменныйАлександр Чачава: «Россия появилась на мировой технологической карте как полноценный инновационный рынок» Автор: Елена КраузоваGrowth Hackers: кто это и почему они нужны стартапам Автор: Игорь ТишкинКак смартфоны смогут демократизировать такси Автор: Андрей ПисьменныйПромзонаПосмотрите на серию плакатов, посвящённых выдающимся учёным и их открытиям Автор: Николай МаслухинДополненная реальность как способ обучения игре в бильярд Автор: Николай МаслухинПосмотрите на составные часы, складывающие время из сотен других часов Автор: Николай МаслухинMobileТестирование приложений для Android как инструмент выхода в ТОП на Google Play Автор: Дмитрий Куриленко, компания PromwadВосемь угроз вашему мобильному банку.
ОглавлениеИнтервьюВалерий Тельнов (ИЯФ СО РАН) о бозоне Хиггса Автор: Алла АршиноваТерралабНовое поколение нетбуков Acer и Packard Bell Автор: Ника ПарамоноваКолумнистыВасилий Щепетнёв: Освобождение Автор: Василий ЩепетневДмитрий Вибе: А вы уже закупили спички и соль? Автор: Дмитрий ВибеКафедра Ваннаха: Сланцевая передышка Автор: Михаил ВаннахДмитрий Шабанов: Вперёд, к эпигенетическому будущему! Автор: Дмитрий ШабановГолубятня-ОнлайнГолубятня: Хоть бы что-нибудь еще… всё не так, как надо! Автор: Сергей ГолубицкийГолубятня: Касталийский мираж истории Автор: Сергей Голубицкий.
ОглавлениеСтатьиTertium datur: другие компьютеры Автор: Евгений Лебеденко, Mobi.ruИнтервьюПавел Фролов («ГНУ/Линуксцентр») о НПП Автор: Евгений КрестниковА. Самсонов о троичной логике и цифровой археологии Автор: Андрей ПисьменныйКолумнистыВасилий Щепетнёв: Месть индейских вождей Автор: Василий ЩепетневКивино гнездо: Беззаконие роботехники Автор: Киви БердКафедра Ваннаха: Подарки и конструкции Автор: Михаил ВаннахАлександр Амзин: Силой данного мне природой мозга Автор: Александр АмзинВасилий Щепетнёв: Гимн усталому караулу Автор: Василий ЩепетневКивино гнездо: Беззаконие роботехники (окончание) Автор: Киви БердДмитрий Шабанов: Марков и Эволюция человека Автор: Дмитрий ШабановКафедра Ваннаха: Пришельцы на Луне Автор: Михаил ВаннахГолубятня-ОнлайнГолубятня: Даже гоблин ходит в отпуск Автор: Сергей ГолубицкийГолубятня: Железный парад 2011 Автор: Сергей Голубицкий.
ОглавлениеКолонкаThe Narod, Iron Balls и удовольствие от унижения сильных мира сего Автор: Сергей ГолубицкийОлимпийская тоска по хакерам Автор: Лёха АндреевВирусы, управляющие миром, и чудесная история Fab.com Автор: Сергей ГолубицкийТайный клуб миллиардеров и механизмы частного фаворитизма Автор: Сергей ГолубицкийНевидимая революция Flow как ключ к пониманию проблем отечественной коммерции Автор: Сергей ГолубицкийКак отечественная интернет-экономика меняет рынок труда? Автор: Михаил ВаннахОт «Фитбита» до медкарты: как заставить персональные данные работать на себя Автор: Так зачем DARPA открывает всему свету закрома инноваций? Автор: Михаил ВаннахОкончательный диагноз биткойна, или Что общего между пиастром ЛГБТ и кольцом Саурона? Автор: Сергей ГолубицкийПредчувствие победоносной войны Автор: Василий ЩепетнёвIT-рынок8 самых странных компьютерных симуляторов Автор: Олег НечайSony прощается с персоналкой.