«Проблема кодировок»: стечение обстоятельств или стратегический замысел?

«Проблема кодировок»: стечение обстоятельств или стратегический замысел?

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность. Книга завершается финалом, связывающим воедино темы и сюжетные линии, исследуемые на протяжении всей истории. В целом, книга представляет собой увлекательное и наводящее на размышления чтение, которое исследует человеческий опыт уникальным и осмысленным образом.

Жанр: Публицистика
Серии: -
Всего страниц: 14
ISBN: -
Год издания: Не установлен
Формат: Полный

«Проблема кодировок»: стечение обстоятельств или стратегический замысел? читать онлайн бесплатно

Шрифт
Интервал

"Проблема кодировок": стечение обстоятельств или стратегический замысел?

В данном материале будет рассказано об одной из наиболее обсуждаемых как среди специалистов в области ИТ, так среди и рядовых пользователей компьютерной техники, тем – о проблеме представления (кодирования) символов естественных языков в машинно-читаемом виде. В кругах ИТ-общественности она получила название «проблемы кодировок».

Эта проблема состоит в том, что для решения задачи кодирования символов естественных языков в машинно-читаемом виде было предложено и принято множество стандартов, в том числе международных, которые несовместимы между собой и противоречат друг другу. В результате, как несложно догадаться, при работе с компьютерной техникой возникают многочисленные проблемы при обработке текстовой информации на ряде языков. Эти проблемы в значительной степени препятствуют и свободному обмену такой информацией, в том числе через сеть Internet.

В современном мире сложилась ситуация, когда положение той или иной страны в мировом сообществе напрямую зависит от того, какое положение она занимает в мировой сфере ИТ. И понятно, что поскольку участие страны в существующей мировой сфере ИТ в огромной степени определяется тем, как в этой сфере реализована поддержка работы с информацией на национальном языке, на котором говорит народ этой страны, «проблема кодировок» является чрезвычайно, даже стратегически, важной, как будет показано ниже.

К сожалению, в подавляющем большинстве материалов на тему «проблемы кодировок» их авторы (как русские, так и зарубежные) погружаются исключительно в одну тему – в описание многочисленных технических «внутренностей» различных стандартов, из-за которых при работе с тем или иным языком возникают проблемы. Если даже они и предлагают свои собственные варианты решения данной проблемы, то делают это, «не видя за деревьями леса» и не поднимая ряда нетехнических вопросов, которые имеют более глобальный характер. В результате ничего не меняется – несовместимые стандарты лишь продолжают множиться, и «проблема кодировок» остаётся нерешённой.

Для того, чтобы на практике приблизиться к решению «проблемы кодировок», нужно иметь представление о том,

– каким образом она возникла;

– кто её создал и продолжает поддерживать;

– кто несёт от неё наибольший ущерб, а кто – выигрывает.

Собственно, рассмотрению этих вопросов и посвящена статья.

***

К началу 1960-х годов мировая сфера производства компьютерной техники контролировалась рядом крупнейших транснациональных корпораций, головные отделения которых располагались, преимущественно, в одной стране – США. И сложилась ситуация, когда каждая корпорация в своих устройствах предлагала свою собственную систему для кодирования символов естественных языков, несовместимую с таковой системой конкурентов. Каждая корпорация таким образом хотела заставить покупателей приобретать исключительно свою «линейку оборудования», в рамках которой совместимость различных устройств была обеспечена.

Подобная ситуация не устраивала покупателей компьютерной техники и шла вразрез с национальными интересами США – ведь буквы английского языка в каждой из указанных систем кодировались по-своему, и это тормозило развитие национальной сферы ИТ в США. Поэтому американскому национальному стандартизирующему органу – ASA (позднее – ANSI) – была поставлена задача решить проблему путём разработки единого государственного стандарта на систему кодирования символов естественных языков в машинно-читаемом виде.

Был организован специальный комитет (X3.4 Committee), для работы в котором были приглашены представители крупнейших корпораций-производителей компьютерной техники. Некоторые согласились принять участие в этой работе, поскольку на тот момент путаница в области систем кодирования достигла такой степени, что, очевидно, стала причинять проблемы уже и им самим. Ведь речь шла уже о том, что из-за использования разных систем кодирования символов стал невозможен обмен информацией даже между двумя компьютерами, произведёнными одной и той же корпорацией, но принадлежащих к разным «линейкам» или семействам.

«У нас существовало более 60 различных систем, использовавшихся для кодирования символов естественных языков в компьютерах. Это было самое настоящее 'вавилонское столпотворение'»[1] – констатировал в интервью американскому журналу «ComputerWorld» Боб Бемер (Bob Bemer), с 1956-го по 1962-й годы – работник корпорации IBM и один из главных разработчиков системы ASCII, которая в 1963-м году была принята ANSI в качестве государственного стандарта США на кодирование символов естественных языков в машинно-читаемом виде. При этом принята она была в недоработанном виде; окончательная версия системы ASCII была утверждена в 1968-м году.

Заметим, что корпорация IBM – бесспорный лидер в производстве компьютерной техники в 1960-х – 1970-х гг. – тем не менее без каких-либо последствий для себя нарушала государственный стандарт ASCII на протяжении многих лет после его официального принятия (вплоть до августа 1981-го года, когда она выпустила первые компьютеры серии PC). IBM использовала в своих «мэйнфреймах» System/360, которые впервые поступили в продажу в 1964-м году, свою собственную, несовместимую с ASCII, патентованную систему кодирования символов – EBCDIC, – которая существовала в 57 различных версиях, в том числе «национальных». При этом получить от IBM документацию по версиям EBCDIC было чрезвычайно сложно.


Еще от автора Павел Кармышев
Общеизвестное недосказанное, или Чем чреват монополизм в области информационных технологий

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Рекомендуем почитать
Голые землекопы

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Гип-гип, ура, клоун

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Марфа-посадница, или Плач по Великому Новгороду

Историческая драма в 2-х действиях по мотивам русских летописей и произведений Н.М.Карамзина.


ЧМО

ОТ АВТОРА. В основу сюжета этой пьесы положены события, которые в свое время стали шоком для заполярного Норильска. Пьеса была написана в 1988 году и тогда же поставлена на сцене Норильского драматического театра им. Маяковского. У меня было искушение перенести ее действие в наши дни, так как то, что случилось без малого двадцать лет назад, сегодня стало едва ли не повседневностью. Но я не стал этого делать. Пусть будет все, как было. Ибо то, что происходит сегодня, не сегодня началось. Нет, не сегодня.


Кризис номер два

Эссе несомненно устаревшее, но тем и любопытное.


Зачем писать? Авторская коллекция избранных эссе и бесед

Сборник эссе, интервью, выступлений, писем и бесед с литераторами одного из самых читаемых современных американских писателей. Каждая книга Филипа Рота (1933-2018) в его долгой – с 1959 по 2010 год – писательской карьере не оставляла равнодушными ни читателей, ни критиков и почти неизменно отмечалась литературными наградами. В 2012 году Филип Рот отошел от сочинительства. В 2017 году он выпустил собственноручно составленный сборник публицистики, написанной за полвека с лишним – с I960 по 2014 год. Книга стала последним прижизненным изданием автора, его творческим завещанием и итогом размышлений о литературе и литературном труде.


Длинные тени советского прошлого

Проблемой номер один для всех без исключения бывших республик СССР было преодоление последствий тоталитарного режима. И выбор формы правления, сделанный новыми независимыми государствами, в известной степени можно рассматривать как показатель готовности страны к расставанию с тоталитаризмом. Книга представляет собой совокупность «картинок некоторых реформ» в ряде республик бывшего СССР, где дается, в первую очередь, описание институциональных реформ судебной системы в переходный период. Выбор стран был обусловлен в том числе и наличием в высшей степени интересных материалов в виде страновых докладов и ответов респондентов на вопросы о судебных системах соответствующих государств, полученных от экспертов из Украины, Латвии, Болгарии и Польши в рамках реализации одного из проектов фонда ИНДЕМ.


Несовершенная публичная сфера. История режимов публичности в России

Вопреки сложившимся представлениям, гласность и свободная полемика в отечественной истории последних двух столетий встречаются чаще, чем публичная немота, репрессии или пропаганда. Более того, гласность и публичность не раз становились триггерами серьезных реформ сверху. В то же время оптимистические ожидания от расширения сферы открытой общественной дискуссии чаще всего не оправдывались. Справедлив ли в таком случае вывод, что ставка на гласность в России обречена на поражение? Задача авторов книги – с опорой на теорию публичной сферы и публичности (Хабермас, Арендт, Фрейзер, Хархордин, Юрчак и др.) показать, как часто и по-разному в течение 200 лет в России сочетались гласность, глухота к политической речи и репрессии.


Был ли Навальный отравлен? Факты и версии

В рамках журналистского расследования разбираемся, что произошло с Алексеем Навальным в Сибири 20–22 августа 2020 года. Потому что там началась его 18-дневная кома, там ответы на все вопросы. В книге по часам расписана хроника спасения пациента А. А. Навального в омской больнице. Назван настоящий диагноз. Приведена формула вещества, найденного на теле пациента. Проанализирован политический диагноз отравления. Представлены свидетельства лечащих врачей о том, что к концу вторых суток лечения Навальный подавал признаки выхода из комы, но ему не дали прийти в сознание в России, вывезли в Германию, где его продержали еще больше двух недель в состоянии искусственной комы.


Казус Эдельман

К сожалению не всем членам декабристоведческого сообщества удается достойно переходить из административного рабства в царство научной свободы. Вступая в полемику, люди подобные О.В. Эдельман ведут себя, как римские рабы в дни сатурналий (праздник, во время которого рабам было «все дозволено»). Подменяя критику идей площадной бранью, научные холопы отождествляют борьбу «по гамбургскому счету» с боями без правил.