Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - [6]
Для оптимального результата при нормально читаемом с бумаги тексте лучше всего выставить во всех списках вкладки пункт MiddleDark. Если же результат будет негодным, с этими параметрами придется экспериментировать, так как единого рецепта дать здесь невозможно.
На этой вкладке выставляются параметры, напрямую влияющие на качество выходного изображения.
Флажок Enhance Image (применить улучшение) включает такую специальную обработку.
Первое, что нужно сделать на этой вкладке — держа Ctrl, установить галочку Gray Enhance (улучшить в градациях серого). Затем щелкаем по самой надписи, и попадаем в окно настройки дополнительных параметров Gray image enhance.
Здесь включаем (опять держа Ctrl) флажок Correct Illumination (Коррекция освещенности). Параметры — как на рисунке. Именно этот прием обеспечит нам избавление практически от всего мусора на сканах и получение чистых черно-белых страниц.
Маленькие хитрости
В окне Gray image enhance кроме вкладки Illumination всегда стоит заглянуть на вкладку Unsharp (контурная резкость). Если включить фильтр Unsharp Mask (знакомый практически каждому, работавшему с Adobe Photoshop), то он может неплохо выгладить края символов и улучшить их четкость. Параметры фильтра можно выставить как на рисунке.
Когда все дополнительные параметры выставлены, окно Gray image enhance можно закрыть, и перейти снова на вкладку Quality. Здесь включаем флажки Smooth (сгладить), Blur (размыть) и Sharpen (усилить резкость). Параметры везде можно выставить по 1. Однако если нужно улучшить читаемость книги (особенно с монитора), параметры Smooth и Blur стоит увеличить, например поставить Smooth = 2, Blur = 1, или в любом другом сочетании. Размытие краев символов позволяет придать им большую цельность при сжатии, и такой текст с монитора будет отлично читаем.
Последняя вкладка — PDF — отвечает за подготовку PDF-документа прямо в программе ScanKromsator, но я предпочитаю ее не трогать, и вам не советую.
2.4 Подготовка рисунков
После того, как все опции установлены и общие параметры пакетной обработки заданы, приходит время разобраться с рисунками (если таковые имеются в книге). Первое, что стоит сделать с найденным рисунком выделить его мышью.
Выделенная область в программе ScanKromsator носит название зоны (Zone). Чтобы выделенный рисунок распознавался программой как не подлежащий обработке, после выделения достаточно щелкнуть в инструментальной панели на кнопке Mark as Picture Zone —
(отметить как картинку). Впрочем, для одноцветных рисунков выделение необязательно, наоборот — преобразование в ч/б может сильно улучшить их восприятие.
Большие хитрости
Самая большая хитрость в подготовке черно-белых изображений — выбрать правильный способ их кодирования. Дело в том, что ScanKromsator может преобразовать изображение не только в черно-белое фотографическое (оно будет просто вырезано из страницы), но и в так называемое точечно-диффузное одноцветное (Bitonal Dithered Image). Суть этого процесса в том, что оттенки черно-белого изображения получаются путем изменения частоты расстановки отдельных черных пикселей. Фактически (с точки зрения алгоритма сжатия) такое изображение — одноцветное, то есть безградационное. Это позволяет очень существенно (до 20 раз!) выиграть в размере при сжатии алгоритмами, аналогичными LZW, DjVu, ZIP и другими. В случае JPEG сжатие может вообще не удаться, так как этот алгоритм рассчитан на плавные переходы оттенков.
Использовать Dithered Image возможно только на изображениях с высоким разрешением. Дело в том, что при отображении на экране или бумаге диффузного изображения с высоким разрешением происходит уменьшение, и отдельные черные и белые точки пересчитываются в серые. Если изображение не уменьшается при отображении, расположение точек становится заметным глазу, и изображение приходит в негодность.
Применять диффузное кодирование при работе в ScanKromsator имеет смысл при работе с фотографическими изображениями, напечатанными офсетом (на них виден небольшой растр) и глубокой печатью (на них мал общий контраст). Высококонтрастное или фактически одноцветное изображение кодировать диффузным способом опасно — можно «обсыпать» края контрастных объектов отдельными точками. Фактически, можно применить диффузное кодирование к любому изображению с достаточно высокой плотностью серого цвета и достаточно малым общим контрастом (например, таким, как показанное на рисунке выше).
Диффузное кодирование задается для выделенного рисунка кнопкой Exclude and Mark as Dithered Zone
(Исключить и отметить как зону диффузного кодирования) инструментальной панели, или командой меню Zones => Exclude and Mark as Dithered Zone. При включении диффузного кодирования рисунок не изымается из страницы при обработке.
2.5 Обработка и подготовка выходных файлов
После того, как все настройки заданы и рисунки оформлены в виде зон — нужно проверить качество выходных файлов. Для этого следует выбрать несколько страниц, которые вам покажутся самыми «проблемными». Как правило, это страницы с рисунками, чертежами и таблицами. Каждая страница передается на обработку командой