«Проблема кодировок»: стечение обстоятельств или стратегический замысел? - [4]
Уместно рассмотреть теперь, какие агрессивные шаги предпринимают корпорации для утверждения Unicode в качестве международного стандарта.
В начале 1990-х в ISO для решения проблемы кодировок рассматривалась другая, более совершенная чем Unicode, система кодирования символов – UCS (Universal Coded Character Set). Объём её таблицы символов составляет примерно 4,3 миллиарда символов (а точнее, 2^32=4294967296). Эта таблица разбита на 65536 «внутренних» таблиц по 65536 символов каждая, и разбивка этих «внутренних» таблиц (256x256 рядов) совпадает с разбивкой таблицы, используемой в системе Unicode. Для переключения между «внутренними» таблица ми в UCS предлагалось использовать управляющие последовательности.
Система UCS была описана в «черновике» ISO DIS-10646.1:1990, подготовленном ISO/IEC JTC1/SC02/WG02. Её поддержали европейские и японские исследователи. Однако американские корпорации UCS не устраивала. А поскольку ISO, как она сама указывает в своих документах, «выпускает только те стандарты, которые нужны рынку», а также потому, что многие нанимаемые ISO «эксперты» – это работники американских компьютерных корпораций, то неудивительно, что вскоре черновик ISO DIS-10646.1:1990 тихо прекратил своё существование.
«Зато» появился – уже в качестве не черновика, а стандарта – документ ISO/IEC 10646 Version 2, позднее названный ISO/IEC 10646-1: 1993. Он был обозначен как «ISO/IEC 10646 Universal Multiple-Octet Coded Character Set (UCS) – Part 1: Architecture and Basic Multilingual Plane», и в качестве его базовой таблицы символов (т.е. первой из «внутренних» 65536-символьных таблиц) была утверждена… правильно, таблица системы Unicode, со всеми вытекающими отсюда последствиями.
Заметим, что по мере изменения и пополнения таблицы символов системы Unicode и выхода новых версий этой системы – а эта работа ведётся постоянно, поскольку изначально система Unicode была представлена в ISO в недоработанном виде – выходят и новые документы ISO. Система Unicode существует в общей сложности в следующих версиях: 1.1 (соответствует стандарту ISO/IEC 10646-1: 1993), 2.0, 2.1 (тот же стандарт ISO/IEC 10646-1: 1993 плюс дополнения: «Amendments» с 1-го по 7-е и «Technical Corrigenda» 1 и 2), 3.0 (стандарт ISO/IEC 10646-1:2000). В начале 2002-го года планируется выход Unicode 3.2, а в 2003-м – Unicode 4.0.
Кстати, работа по «унификации» иероглифов для таблицы символов Unicode сейчас ведётся тоже не консорциумом Unicode, а ISO – специальным комитетом IRG при JTC1/SC02/WG02. И это при том, что в оригинальной версии UCS (в черновике ISO DIS-10646.1:1990) было чётко определено, что «базовая» (первая «внутренняя») таблица вообще не предназначена для иероглифов. При этом работа по «унификации» продолжается до сих пор, хотя в одной из более поздних версий системы Unicode было объявлено, что таблица символов будет расширена до примерно 1000000 позиций (с помощью использования специальных «расширений», которые в первоначальной версии Unicode не планировались – см. выше).
В дополнение к всему уже сказанному об Unicode нужно отметить ещё некоторые обстоятельства. Для того, чтобы сделать её хотя бы частично совместимой с ранее существовавшим ПО (а возможно, и чтобы не тратить денег на серьёзную переделку своего ПО, находящегося в стадии разработки), членами консорциума были разработаны различные методы представления (номеров) символов таблицы Unicode: UTF-8, UTF16, UTF16LE и UTF16BE. Отсюда возникает необходимость в реализации в ПО поддержки каждого из них, что определённо порождает новый виток путаницы. С этим обстоятельством связано, вероятно, большинство проблем, существующих в конкретных реализациях поддержки работы с системой кодирования Unicode в различном ПО.
Отметим, что консорциум Unicode держит «про запас» методы UTF32, UTF32LE, UTF32BE, в которых для кодирования (номера) каждого символа предусматривается использование уже 32-битных последовательностей (что, однако, «автоматически» не означает, что таблица символов будет расширена до 4,3 миллиардов позиций). Однако их применение чрезвычайно расточительно с точки зрения расходования системных ресурсов, и представители Unicode прямо указывают, что в ближайшее время промышленность (читай – корпорации-члены Unicode) не планирует переходить на применение этих методов.
У системы Unicode есть и другие нерешённые проблемы, наличие которых для международного стандарта просто неприлично, но мы не будем на них останавливаться отдельно. Интересующиеся могут ознакомиться с этой информацией на web-сайте проекта TRON[9].
Зададимся теперь вопросом: почему же всё-таки не возник единый международный стандарт, в таблице символов которого были бы последовательно занесены символы всех существующих естественных языков[10], притом одинаково удобный для применения во всех странах мира? Почему, напротив, в качестве международных принимались и принимаются заведомо несовершенные стандарты, часто недоработанные, и появилось большое количество несовместимых таблиц символов? Попробуем оценить основные причины.
1. корпорациям-производителям ПО, очевидно, весьма выгодно продавать разные «национальные» версии операционных систем, офисных пакетов и т.д. за отдельные деньги. Так, Microsoft продавала «американскую», «панъевропейскую», «восточно-азиатскую», « ближневосточную» и «тайскую» версии Windows 95, а IBM – стандартную, «арабскую», «израильскую», «японскую», «корейскую», «китайскую» и «тайваньскую» версии PC DOS. Отсюда возникновение несовместимых таблиц символов, содержащих 256 позиций каждая.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Сборник эссе, интервью, выступлений, писем и бесед с литераторами одного из самых читаемых современных американских писателей. Каждая книга Филипа Рота (1933-2018) в его долгой – с 1959 по 2010 год – писательской карьере не оставляла равнодушными ни читателей, ни критиков и почти неизменно отмечалась литературными наградами. В 2012 году Филип Рот отошел от сочинительства. В 2017 году он выпустил собственноручно составленный сборник публицистики, написанной за полвека с лишним – с I960 по 2014 год. Книга стала последним прижизненным изданием автора, его творческим завещанием и итогом размышлений о литературе и литературном труде.
Проблемой номер один для всех без исключения бывших республик СССР было преодоление последствий тоталитарного режима. И выбор формы правления, сделанный новыми независимыми государствами, в известной степени можно рассматривать как показатель готовности страны к расставанию с тоталитаризмом. Книга представляет собой совокупность «картинок некоторых реформ» в ряде республик бывшего СССР, где дается, в первую очередь, описание институциональных реформ судебной системы в переходный период. Выбор стран был обусловлен в том числе и наличием в высшей степени интересных материалов в виде страновых докладов и ответов респондентов на вопросы о судебных системах соответствующих государств, полученных от экспертов из Украины, Латвии, Болгарии и Польши в рамках реализации одного из проектов фонда ИНДЕМ.
Вопреки сложившимся представлениям, гласность и свободная полемика в отечественной истории последних двух столетий встречаются чаще, чем публичная немота, репрессии или пропаганда. Более того, гласность и публичность не раз становились триггерами серьезных реформ сверху. В то же время оптимистические ожидания от расширения сферы открытой общественной дискуссии чаще всего не оправдывались. Справедлив ли в таком случае вывод, что ставка на гласность в России обречена на поражение? Задача авторов книги – с опорой на теорию публичной сферы и публичности (Хабермас, Арендт, Фрейзер, Хархордин, Юрчак и др.) показать, как часто и по-разному в течение 200 лет в России сочетались гласность, глухота к политической речи и репрессии.
В рамках журналистского расследования разбираемся, что произошло с Алексеем Навальным в Сибири 20–22 августа 2020 года. Потому что там началась его 18-дневная кома, там ответы на все вопросы. В книге по часам расписана хроника спасения пациента А. А. Навального в омской больнице. Назван настоящий диагноз. Приведена формула вещества, найденного на теле пациента. Проанализирован политический диагноз отравления. Представлены свидетельства лечащих врачей о том, что к концу вторых суток лечения Навальный подавал признаки выхода из комы, но ему не дали прийти в сознание в России, вывезли в Германию, где его продержали еще больше двух недель в состоянии искусственной комы.
К сожалению не всем членам декабристоведческого сообщества удается достойно переходить из административного рабства в царство научной свободы. Вступая в полемику, люди подобные О.В. Эдельман ведут себя, как римские рабы в дни сатурналий (праздник, во время которого рабам было «все дозволено»). Подменяя критику идей площадной бранью, научные холопы отождествляют борьбу «по гамбургскому счету» с боями без правил.