Информация как основа жизни - [20]

Шрифт
Интервал

Свойство инвариантности, как мы уже видели, позволяет утверждать, что одну и ту же информацию можно фиксировать любыми носителями. Носители информации – языки, алфавиты, способы фиксации и подложки – выступают как бы в роли "информационной тары", которая может содержать информацию, причем любую. Если представление о количестве информации не лишено смысла, то отсюда следует, что для фиксации одного и того же количества информации с помощью разных носителей емкость используемой для этого информационной тары должна быть одной и той же. Полагая элементарные носители информации – отдельные буквы алфавита – дискретными, можно утверждать, что одну и ту же информацию, по меньшей мере в пределах одного и того же языка, можно записывать самыми разными алфавитами, содержащими разное число букв, в том числе и бинарным. Формула (1), показывающая, сколько битов информации содержится в некотором сообщении, по существу означает, что для записи этого сообщения бинарным кодом требуется М букв.

Формулу (1) можно записать несколько иначе, а именно (13):

Очевидно, что данная формула показывает, сколько знаков М алфавита, состоящего из п букв, требуется для записи данного количества Н информации. Очевидно, что в основе формулы (13) лежит формула (6), означающая, следовательно, сколько информации может "вместиться" в один из символов данного алфавита. Приняв в качестве единицы количества информации один бит и используя разные значения п и pi, легко убедиться, что информационная емкость отдельных символов может быть выражена любым числом, как целым, так и дробным, в том числе апериодическим. Это лучше согласуется с представлением о континуальности, нежели о дискретности самой информации, в отличие от единиц информационной тары.

Итак, мы пришли к выводу, что информационная емкость i-го символа любого алфавита, выраженная в битах, равна –log>2p>i, где p>i есть частота встречаемости этого символа в данном языке. Это утверждение, выведенное из формулы (6) К. Шеннона, можно назвать правилом Шеннона.

Заметим, однако, что в работах самого К. Шеннона речь идет не об информационной емкости, а о количестве информации. Справедливо полагая, что количество информации, связанной с каким-либо сообщением, не должно зависеть от его семантики, К. Шеннон формулировал вопрос так: сколько информации получает адресат, воспринимая каждую из букв сообщения? Количество такой информации он и предложил выражать через величину Н и постулировал аддитивность этой величины по отношению к любому числу символов, составляющих сообщение. При этом непроизвольно произошла подмена терминов: понятие об информации, как о содержательной стороне сообщения, было подменено понятием о количестве информации, представляющем собой функцию статистических характеристик составляющих сообщение символов. Эта подмена терминов не имела никаких последствий для развития математической теории связи и даже оказалась для нее благотворной: ведь по каналам связи передают не информацию, а ее носителей, и для оптимизации работы систем связи безразлично, какую именно информацию эти носители содержат и содержат ли они ее вообще. Однако для теории информации эти различия весьма существенны, и вот почему.

Рассмотрим два сообщения: "Каин убил Авеля" и "инилА ваКу лебя". Оба они состоят из одинаковых 15 знаков, но первое – вполне осмысленно, т. е. содержит информацию, а второе представляет собой случайную последовательность букв и никакой информации не содержит. Согласно формуле (8), однако, с ними обоими связано одно и то же количество информации –около 45 битов. Если принять это утверждение за истинное, то отсюда следует, что информация может быть лишена семантики, что на самом деле нонсенс, ибо бессмысленной информации не бывает. Но возможен другой выход из этого противоречия: считать, что формула (8) является мерой не количества информации, а емкости информационной тары. Первая фраза – это тара, "полностью загруженная информацией", а вторая фраза это совершенно пустая тара. Очевидно, что емкость тары не зависит от того, загружена она или нет, полностью загружена или частично, а также от того, чем именно она загружена. Если тара заполнена, то ее емкость может служить мерой количества содержащегося в ней груза. Эти простые соображения позволяют сделать три вывода. Во-первых, если H-функцию считать емкостью информационной тары, то ее в равной мере можно прилагать и к осмысленным, и к бессмысленным наборам символов, которые могут служить носителями информации. Во-вторых, одни и те же единицы измерения, биты, можно применять для оценки и емкости тары, и количества информации, которая в ней может содержаться. В-третьих, при измерении в битах количество информации В, содержащейся в сообщении, заключено в интервал 0≤В≤Н, где Н – емкость составляющих сообщение носителей информации. Н сообщения, таким образом, – это верхняя граница того количества информации, которое может в нем содержаться, причем В = Н только при абсолютно компактном тексте.

К этим же выводам можно прийти и другим путем, рассматривая смысловое содержание понятия "избыточности", или условную вероятность встречаемости i- ro символа после 1-го, 2-го и т. д., а также после разных сочетаний двух, трех и т. д. символов [11]. При таком подходе легко показать, что величина Н имеет максимальное значение только при совершенно случайном расположении символов в сообщении, а при возрастании его осмысленности величины pi независимо от i, стремятся к единице, а Я стремится к нулю. В нашей интерпретации это выглядит вполне естественным: по мере заполнения тары информацией свободного места в ней остается все меньше. Если перед правыми частями формул (6)-(8) не ставить знак минус, как это делал Н. Винер [5], то величина Н будет меньше или равной нулю и будет обозначать количество недостающей в таре информации до ее полного заполнения. Естественно, что эта величина имеет минимальное значение лишь при совершенно случайном расположении составляющих сообщение букв.


Рекомендуем почитать
Выдающиеся ученые о познании

Книга будет интересна всем, кто неравнодушен к мнению больших учёных о ценности Знания, о путях его расширения и качествах, необходимых первопроходцам науки. Но в первую очередь она адресована старшей школе для обучения искусству мышления на конкретных примерах. Эти примеры представляют собой адаптированные фрагменты из трудов, писем, дневниковых записей, публицистических статей учёных-классиков и учёных нашего времени, подобранные тематически. Прилагаются Словарь и иллюстрированный Указатель имён, с краткими сведениями о характерном в деятельности и личности всех упоминаемых учёных.


Этнос и глобализация: этнокультурные механизмы распада современных наций

Монография посвящена одной из ключевых проблем глобализации – нарастающей этнокультурной фрагментации общества, идущей на фоне системного кризиса современных наций. Для объяснения этого явления предложена концепция этно– и нациогенеза, обосновывающая исторически длительное сосуществование этноса и нации, понимаемых как онтологически различные общности, в которых индивид участвует одновременно. Нация и этнос сосуществуют с момента возникновения ранних государств, отличаются механизмами социогенеза, динамикой развития и связаны с различными для нации и этноса сферами бытия.


Гностический миф в изложении Иринея и Ипполита

Из кн.: Афонасин Е.В. Античный гностицизм. СПб, 2002, с. 321–340.


Три статьи о еврейском образовании

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Архитектура и иконография. «Тело символа» в зеркале классической методологии

Впервые в науке об искусстве предпринимается попытка систематического анализа проблем интерпретации сакрального зодчества. В рамках общей герменевтики архитектуры выделяется иконографический подход и выявляются его основные варианты, представленные именами Й. Зауэра (символика Дома Божия), Э. Маля (архитектура как иероглиф священного), Р. Краутхаймера (собственно – иконография архитектурных архетипов), А. Грабара (архитектура как система семантических полей), Ф.-В. Дайхманна (символизм архитектуры как археологической предметности) и Ст.


Вырождение. Современные французы

Макс Нордау"Вырождение. Современные французы."Имя Макса Нордау (1849—1923) было популярно на Западе и в России в конце прошлого столетия. В главном своем сочинении «Вырождение» он, врач но образованию, ученик Ч. Ломброзо, предпринял оригинальную попытку интерпретации «заката Европы». Нордау возложил ответственность за эпоху декаданса на кумиров своего времени — Ф. Ницше, Л. Толстого, П. Верлена, О. Уайльда, прерафаэлитов и других, давая их творчеству парадоксальную характеристику. И, хотя его концепция подверглась жесткой критике, в каких-то моментах его видение цивилизации оказалось довольно точным.В книгу включены также очерки «Современные французы», где читатель познакомится с галереей литературных портретов, в частности Бальзака, Мишле, Мопассана и других писателей.Эти произведения издаются на русском языке впервые после почти столетнего перерыва.