Цифровой журнал «Компьютерра» 2011 № 40 (88) - [28]

Шрифт
Интервал

Возвращаемся к теме конвертации. Проблемы скачать в сети электронную книгу в каком-нибудь совершенно неприличном DOC или того страшнее DJVU и затем конвертировать книгу в один из читальных стандартов больше нет. Зато остается во всей красе проблема оперативного создания электронной книги из веб-материалов. Думаю, понятно, о чем идет речь, но на всякий случай поясняю: проблема не об отдельной странице, которую сходу можно сохранить на диск в родном HTML и затем конвертировать в какой-нибудь PDF (через опцию печати), а в целом веб-сайте со всеми его «прелестями» — многоуровневой иерархией и структурой, скриптами, всплывающими окнами и т.п.

Сложность задачи усугубляется сразу двумя моментами: «захватом» всего контента с сайта и непосредственно конвертацией «добычи». Иными словами требуется оптимальный граббер, умеющий сохранять сайт на жестком диске именно в таком виде, который окажется доступным пониманию конвертера.

При всей кажущейся пустяковости задачи на практике получается одно разочарование. Грабберы входили в обойму моих обязательных программ, кажется, со Дня №1 моей компьютерной жизни, поэтому перепробовал я, думаю, все поделки, какие только существуют на свете: Teleport Pro, HTTP Weazel, Web Wacker, Offline Explorer Pro, Black Widow, ДискоКачалка — you name it. Все это форточное наследие было скрупулезно протестировано и запротоколировано для читателей в многочисленных Голубятнях.

В прошлые годы, однако, передо мной не стояла специфическая задача создания электронной книги, поэтому грабберы (программы для захвата содержания веб-сайта) интересовали меня, в первую очередь, в плане чисто функциональной мощи: возможности выборочного копирования данных, селекция по уровню погружения в иерархию, обработка джавы и ActiveX скриптов и прочая ересь (эх, молодость!). Тогда, если не изменяет память, моим фаворитом был отечественный Offline Explorer, что впрочем уже не актуально.

С годами мне стало совершенно фиолетово, как работают настройки и что там со скриптами: важен исключительно результат. Очевидно, что мой переход на Мак оказался успешным, именно по той причине, что эта платформа заточена на дурашливый прагматизм: нажал кнопочку и компьютер сам выполняет работу, не нагружая пользователя ненужными подробностями техникалий. Ситуация еще более осложнилась, что на согласно моим текущим потребностям на выходе после захвата хотелось получать (без малейшего вмешательства ручками) данные в виде, понятном априорно конвертеру электронных книг.

Как видите, задача в итоге получилась не из тривиальных. Признаюсь, я ума не приложу, как бы ее можно было решить в условиях Windows, поскольку философия этой платформы изначально предполагает активное вмешательство пользователя непосредственно в процесс, а не результат. Боюсь даже подумать, сколько бы пришлось перелопачивать нового софта, а затем манипулировать тонкими настройками и в граббере, и в конвертере, для того чтобы добиться совместимости и желанного результата.

Теперь самое удивительное: на Маке решение проблемы было найдено за какой-то час, причем без малейшего усилия с моей стороны. Невероятно, но факт: мне не понадобилось ровным счетом ничего делать! Представьте ситуацию: запускаю граббер, вбиваю URL нужного сайта и, минуя закладку Настроек, одним кликом мыши инициирую процесс загрузки. Дальше — вообще научная фантастика: открываю конвертер, указываю файл index.html из папки, в которую был загружен на жесткий диск нужный сайт, затем нажимаю на кнопку Конвертировать в EPUB и через пару минут получаю на выходе электронную книгу, полностью готовую к чтению! Со всеми уровнями, сложными структурам и иерархиями сайта, которые в ибуксе все сводятся к простому гипертексту.

Как такое возможно?! А я вам скажу как: благодаря все той же помянутой выше философии платформы, которая в епархии Надкусана существует не в виде какого-то каприза Apple, а в виде общепринятого универсального кодекса поведения всех программистов, пишущих для Mac OS X! Встречаются, разумеется, оригиналы, которые лезут в эту экосистему с собственными представлениями о том, как нужно взаимодействовать пользователю с компьютером (в основном это все те же «ручечники», навязывающие мануальное ковыряние), но таковых в Макцарстве абсолютное меньшинство и — главное — они долго не живут, поскольку их программами никто предпочитает не пользоваться.

Так вот, общая парадигма автоматического непрозрачного выполнения поставленных задач, создает ситуации, когда разработчики совершенно, казалось бы разнопрофильного софта, думая в одинаковом ключе, создают программы идеально сочетающиеся друг с другом именно в плане желанной функциональности. На практике это выливается в чудеса, подобно описанному в сегодняшней Голубятне.

Берем граббер с дурацко-инфантильным названием Web Devil, в простеньком однооконном интерфейсе вбиваем Base URL — стартовый адрес нужного сайта и нажимает — вы не поверите — кнопку «Start»! После завершения процесса мы закрываем Web Devil (да-да, мавр уже сделал свое дело и нам больше не нужен!) и открываем


Еще от автора Журнал «Компьютерра»
Компьютерра, 2008 № 01-02 (717-718)

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Цифровой журнал «Компьютерра» 2013 № 18 (171)

ОглавлениеКолонкаПочему мы позволяем нас обманывать, или Грустные размышления об иррациональности политической жизни Автор: Дмитрий ШабановГолубятня: Samsung Galaxy S4 — цидули перебежчика (часть 1) Автор: Сергей ГолубицкийУроки любви к Родине: McAfee патентует технологию обнаружения и блокировки пиратского содержания Автор: Сергей ГолубицкийПодпадает ли астрономия под закон о митингах Автор: Дмитрий ВибеIT-рынокНасколько глупа шумиха вокруг «умных» часов? Автор: Андрей ПисьменныйПромзонаПосмотрите на свалку, которую китайцы превратили в парк Автор: Николай МаслухинЭтот сайт позволяет создать собственное световое шоу на точном макете Токио Автор: Николай МаслухинТехнологииДжипег, подвинься! Веппи как единственный необходимый графический формат Автор: Евгений ЗолотовИнновацииПочему менеджерам российских корпораций не нужны стартапы Автор: Елена КраузоваИнга Нахмансон (Fitting Reality): «Российскому e-commerce не до виртуальности» Автор: Елена КраузоваГидGoogle Now для iOS появился без лишнего шума и уже собирает сведения Автор: Андрей Васильков.


Компьютерра, 2007 № 15 (683)

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Компьютерра, 2006 № 30 (650)

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Компьютерра, 2005 № 27-28 (599-600)

Документ создан на основе открытого контента, расположенного по адресуhttp://offline.computerra.ru/2005/599/Размер изображений не менялся, поэтому некоторые могут быть некорректно отображены на неVGA-моделях КПК (особенно скриншоты и таблицы).


Цифровой журнал «Компьютерра» 2010 № 10

ОглавлениеТерралабOpera 10.50: оперативный релиз Автор: Андрей КрупинАнтивирус со вкусом "Яндекса" Автор: Андрей КрупинБлоки питания на любой случай, часть 2. 600–700 Вт Автор: Константин ИвановОбзор Samsung i5700 Galaxy Spica Автор: Алексей СтародымовСвоя играМодель чугунного дирижабля, или Учитель Добреску — 2 Автор: Василий ЩепетневКафедра Ваннаха: Нано-блюз Автор: Ваннах МихаилВасилий Щепетнёв: Разбор полётов перед стартом Автор: Василий ЩепетневКивино гнездо: За что боролись Автор: БЕРД КИВИОткрытые системы Королевского Флота Автор: Ваннах МихаилИнтерактивCeBIT 2010: первые новинки Автор: Алексей СтародымовReaDitorialMovavi: история развития Автор: Наталья ХудяковаГолубятня-ОнлайнГолубятня: Хули Холи Автор: Сергей ГолубицкийГолубятня: Бабу Автор: Сергей ГолубицкийГолубятня: Агора № 20 Автор: Сергей ГолубицкийНаука и жизньМарсианский экспресс Автор: Олег Волошин.


Рекомендуем почитать
Газета Завтра 319 (2 2000)

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Газета Завтра 272 (7 1999)

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Литературная Газета 6335 (№ 31 2011)

"Литературная газета" общественно-политический еженедельник Главный редактор "Литературной газеты" Поляков Юрий Михайлович http://www.lgz.ru/.


Литературная Газета 6303 (№ 01 2011)

"Литературная газета" общественно-политический еженедельник Главный редактор "Литературной газеты" Поляков Юрий Михайлович http://www.lgz.ru/.


Литературная Газета 6259 (№ 04 2010)

"Литературная газета" общественно-политический еженедельник Главный редактор "Литературной газеты" Поляков Юрий Михайлович http://www.lgz.ru/.


Цифровой журнал «Компьютерра» 2012 № 05 (105)

ОглавлениеТерралабСинтез звука: сказки и сказочники Автор: Павел ЗолинЧто показывали на Consumer Electronics Show 2012 Автор: Олег НечайКолумнистыКафедра Ваннаха: Непроданная Луна Автор: Михаил ВаннахАлександр Амзин: Воля и разум Автор: Александр АмзинДмитрий Шабанов: Суррогаты природоохраны Автор: Дмитрий ШабановВасилий Щепетнёв: Исчезновение видов Автор: Василий ЩепетневДмитрий Вибе: Запрограммированное счастье Автор: Дмитрий ВибеГолубятня-ОнлайнГолубятня: Читалка-планшет Pocketbook eReader A10' Автор: Сергей Голубицкий.


Цифровой журнал «Компьютерра» 2013 № 11 (164)

ОглавлениеКолонкаПринуждение к альтруизму, или 451 градус политкорректности Автор: Василий ЩепетнёвМатематика как ресурс: На каком наследии работает отрасль информационных технологий Автор: Михаил ВаннахГолубятня: Праздник на нашей улице, или Фактура, столь редкая для софтверных обзоров Автор: Сергей ГолубицкийТень Рикардо: Чему биржевик и мыслитель былых времён может научить нас в информационную эру? Автор: Михаил ВаннахЗаказная мифология IT-прессы Автор: Сергей ГолубицкийЛожь навсегда: почему нас обманывают снова и снова Автор: Василий ЩепетнёвИгра в беспилотники: Как технологии боевых роботов соотносятся с классическим римским правом Автор: Михаил ВаннахСотая колонка: попытка перевести дух, осмотреться и понять, что и зачем я делаю Автор: Дмитрий ШабановВот и пришел Песочный Человек: о презентации Samsung своего нового флагмана и харакири Филла Шиллера Автор: Сергей ГолубицкийЧто общего между отключением Google Reader, заявлением Элиссы Финк и жалобой Дина Гарфилда? Автор: Сергей ГолубицкийОрганика в старом веществе Солнечной системы Автор: Дмитрий ВибеIT-рынокКак компьютеры, стоящие доллар, изменят привычные вещи и перевернут всё с ног на голову Автор: Андрей ПисьменныйАлександр Чачава: «Россия появилась на мировой технологической карте как полноценный инновационный рынок» Автор: Елена КраузоваGrowth Hackers: кто это и почему они нужны стартапам Автор: Игорь ТишкинКак смартфоны смогут демократизировать такси Автор: Андрей ПисьменныйПромзонаПосмотрите на серию плакатов, посвящённых выдающимся учёным и их открытиям Автор: Николай МаслухинДополненная реальность как способ обучения игре в бильярд Автор: Николай МаслухинПосмотрите на составные часы, складывающие время из сотен других часов Автор: Николай МаслухинMobileТестирование приложений для Android как инструмент выхода в ТОП на Google Play Автор: Дмитрий Куриленко, компания PromwadВосемь угроз вашему мобильному банку.


Цифровой журнал «Компьютерра» 2012 № 49 (149)

ОглавлениеИнтервьюВалерий Тельнов (ИЯФ СО РАН) о бозоне Хиггса Автор: Алла АршиноваТерралабНовое поколение нетбуков Acer и Packard Bell Автор: Ника ПарамоноваКолумнистыВасилий Щепетнёв: Освобождение Автор: Василий ЩепетневДмитрий Вибе: А вы уже закупили спички и соль? Автор: Дмитрий ВибеКафедра Ваннаха: Сланцевая передышка Автор: Михаил ВаннахДмитрий Шабанов: Вперёд, к эпигенетическому будущему! Автор: Дмитрий ШабановГолубятня-ОнлайнГолубятня: Хоть бы что-нибудь еще… всё не так, как надо! Автор: Сергей ГолубицкийГолубятня: Касталийский мираж истории Автор: Сергей Голубицкий.


Цифровой журнал «Компьютерра» 2012 № 01 (101)

ОглавлениеСтатьиTertium datur: другие компьютеры Автор: Евгений Лебеденко, Mobi.ruИнтервьюПавел Фролов («ГНУ/Линуксцентр») о НПП Автор: Евгений КрестниковА. Самсонов о троичной логике и цифровой археологии Автор: Андрей ПисьменныйКолумнистыВасилий Щепетнёв: Месть индейских вождей Автор: Василий ЩепетневКивино гнездо: Беззаконие роботехники Автор: Киви БердКафедра Ваннаха: Подарки и конструкции Автор: Михаил ВаннахАлександр Амзин: Силой данного мне природой мозга Автор: Александр АмзинВасилий Щепетнёв: Гимн усталому караулу Автор: Василий ЩепетневКивино гнездо: Беззаконие роботехники (окончание) Автор: Киви БердДмитрий Шабанов: Марков и Эволюция человека Автор: Дмитрий ШабановКафедра Ваннаха: Пришельцы на Луне Автор: Михаил ВаннахГолубятня-ОнлайнГолубятня: Даже гоблин ходит в отпуск Автор: Сергей ГолубицкийГолубятня: Железный парад 2011 Автор: Сергей Голубицкий.


Цифровой журнал «Компьютерра» 2014 № 07 (212)

ОглавлениеКолонкаThe Narod, Iron Balls и удовольствие от унижения сильных мира сего Автор: Сергей ГолубицкийОлимпийская тоска по хакерам Автор: Лёха АндреевВирусы, управляющие миром, и чудесная история Fab.com Автор: Сергей ГолубицкийТайный клуб миллиардеров и механизмы частного фаворитизма Автор: Сергей ГолубицкийНевидимая революция Flow как ключ к пониманию проблем отечественной коммерции Автор: Сергей ГолубицкийКак отечественная интернет-экономика меняет рынок труда? Автор: Михаил ВаннахОт «Фитбита» до медкарты: как заставить персональные данные работать на себя Автор: Так зачем DARPA открывает всему свету закрома инноваций? Автор: Михаил ВаннахОкончательный диагноз биткойна, или Что общего между пиастром ЛГБТ и кольцом Саурона? Автор: Сергей ГолубицкийПредчувствие победоносной войны Автор: Василий ЩепетнёвIT-рынок8 самых странных компьютерных симуляторов Автор: Олег НечайSony прощается с персоналкой.