Аналогия - [21]

Шрифт
Интервал

сухерробьдщяыхвщиюайжтлфвнзагфоенвштцр хгбкучтжюряпчькйхрыс (1)

Как видите, получилось нечто такое, что нельзя и выговорить. Именно такой текст и содержит 5 бит/символ, он наиболее информативен, потому что вероятность появления каждого последующего знака определяется только случаем и всегда равна 1/32. Но мы-то знаем, что в русском тексте разные буквы встречаются с разной частотой. Чаще всего встречается буква «о» (частота 0,090.), но это только в письменной речи. В устной, в московском говоре, где безударное «о» выговаривается как «а» («с Масквы, с пасада, с калашнава ряда»), положение другое[4]. В других языках в фаворитах ходят другие буквы. Вспомните «Золотого жука» Эдгара По — там герой уверенно принимает наиболее часто встречающийся в тексте знак за букву «е». На пергаменте был английский текст, но и в испанском и во французском языке, которыми также пользовались пираты Карибского моря, «е» — чаще всего встречающаяся буква.

Определить частоту встречаемости букв просто, нужно только учитывать характер текста. Буква «ф» в русскоязычных текстах относительно редка (частота 0,002, из согласных чаще всего встречаются «т» и «н») — за исключением математических (за счет таких слов как функция и дифференциал). Лучше использовать средние данные по различным источникам. Оказалось, что с учетом разной частоты встречаемости энтропия на символ уже 4,35 бит. Искусственный «текст» с этими поправками будет выглядеть по Добрушину примерно так:

еынт цияьа оерб однг ьуемлолйк збя енвтша (2)

Как видите, этого приближения явно недостаточно, чтобы случайно подобранная фраза зазвучала по-русски. Мы подходим к важному феномену: наличию связей, корреляций между символами в тексте. В самом деле, не каждая буква может занимать любое место. После пробела никогда не встретится мягкий знак, а «и» — редко, лишь в заимствованных словах (Йорк, йод). Система корреляций между символами оказывается разной у разных языков. Русский язык относится к индоевропейским, в них возможны сочетания нескольких согласных (взвод, встреча, бодрствовать) и закрытые, оканчивающиеся на согласный слоги. А в японском и полинезийском языках гласные и согласные строго чередуются, и закрытых слогов нет. Это хорошо обыграл Г. Мелвил в повести «Тайпи», где герой представляется друзьям-канакам самым простым английским именем Том. Оказалось, что произнести его они не в состоянии. Томи, Томо — пожалуйста.

Но и любая гласная не может появиться после любой согласной. «Я» после «г» в русском языке крайне редка (лишь в заимствованном слове «гяур»), только Марина Цветаева осмеливалась писать — «рвя и жгя».

Добрушин учел корреляции между соседними буквами. Получилась следующая фраза:

умароно кач всванный рося ных ковкров недаре (3)

Энтропия на символ снижается до 3,52 бит, но фразу уже можно прочесть, не запинаясь. Но ведь корреляции касаются не только соседних букв, но и третьих и четвертых за выбранными. Если учтем частоту трехбуквенных сочетаний, будет фраза вроде:

покак пот дурноскака наконепио зне стволовил се твой обниль(4)

В ней уже встречаются вполне русские слова и части слов (энтропия 3,01 бит/символ). С учетом четырехбуквенных сочетаний получается фраза, которую, если ее быстро произнести, можно счесть за русскую:

весел враться не сухом и непо и корко (5)

Ясно, что учет более дальних корреляций приведет к появлению чисто русских слов, в дальнейшем уже и не в бессмысленных комбинациях, а энтропия на символ будет снижаться. Расшифровка поврежденного или закодированного текста «по Паганелю» как раз и связана с учетом корреляций между символами.

А как обстоит дело с символами в нуклеотидной последовательности ДНК или в аминокислотной — белка? Этот вопрос занимал меня давно, еще тогда, когда не был прочтен ни один ген, а за расшифровку первого белка — инсулина Сэнгер получил свою первую Нобелевскую премию. Поэтому я старался каждую появившуюся в литературе последовательность оценить с этой точки зрения. И уже первые результаты смущали и заставляли задуматься.

Вероятность встречи в любом месте одного из четырех символов, слагающих последовательность гена, или одного из двадцати символов, слагающих белок, была пропорциональна только процентному содержанию этого символа в тексте и не зависела от соседних. То есть, генетический текст оказывался построенным согласно модели 2 Добрушина.

Гены — дети случая. С какой-то стороны это меня огорчило. Я надеялся, что системы корреляций, паче чаяния они в нуклеотидных текстах окажутся, будут разными в разных геномах. А это принесло бы пользу новой отрасли систематики — геносистематике, развивающейся на наших глазах. Хороший пример из анализа лингвистических текстов. По-видимому, древнейшая или хотя бы одна из древнейших письменностей Европы — слоговое письмо А догреческого населения острова Крит — пока еще не расшифрована. Мы можем ее читать, но не понимаем языка. Однако мы знаем, что построен он был наподобие японского или полинезийского, в которых гласные и согласные строго чередуются. Греки-ахейцы, взявшие Трою, переняли это письмо и стали писать на нем по-гречески (


Еще от автора Борис Михайлович Медников
Аксиомы биологии

Современная биология – это совокупность научных дисциплин, с разных сторон и на разных уровнях изучающих все многообразие живой материи. Можно ли, опираясь на сумму накопленных знаний, построить некую систему теоретических положений, необходимых для понимания специфических отличий живого от неживого? Можно, считает автор, и в доступной форме излагает основные принципы, которые играют в биологии такую же роль, какую в геометрии – аксиомы.Для широкого круга читателей.


Дарвинизм в XX веке

Учение Дарвина стоит на трех «китах» — трех основных факторах эволюции: наследственности, изменчивости и отборе. Выдержали ли эти «киты» натиск новых фактов, добытых науками нашего века — генетикой, молекулярной биологией, теорией информации? Кто прав — Дарвин или учитель Александра Македонского Аристотель? Есть ли прогресс в природе? Когда возник естественный отбор — вместе с жизнью или до нее?.. Обо всем этом и расскажет автор в данной книге, посвященной развитию учения об эволюции в XX столетии, борьбе материализма и идеализма в эволюционной теории.


Рекомендуем почитать
Двойная спираль. Забытые герои сражения за ДНК

История ДНК – это сага, полная блестящих научных открытий, невероятных случайностей, грубых ошибок. Она начинается с обнаружения нуклеина в конце 1860-х годов и заканчивается публикацией книги Джеймса Уотсона «Двойная спираль» в 1968 году. За эти 100 лет появились Нобелевская премия, антибиотики, рентгеновская кристаллография, радар и атомная бомба, не говоря уже о том, что прошли две разрушительные мировые войны, – и каждое из этих событий повлияло на открытие ДНК. Джеймс Уотсон и Фрэнсис Крик разгадали загадку двойной спирали, но Гарет Уильямс показывает, что их вклад был последним кусочком гигантского пазла, который собирали несколько десятилетий многие забытые историей ученые.


Краткая история насекомых. Шестиногие хозяева планеты

«Любая история, в том числе история развития жизни на Земле, – это замысловатое переплетение причин и следствий. Убери что-то одно, и все остальное изменится до неузнаваемости» – с этих слов и знаменитого примера с бабочкой из рассказа Рэя Брэдбери палеоэнтомолог Александр Храмов начинает свой удивительный рассказ о шестиногих хозяевах планеты. Мы отмахиваемся от мух и комаров, сражаемся с тараканами, обходим стороной муравейники, что уж говорить о вшах! Только не будь вшей, человек остался бы волосатым, как шимпанзе.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.


О чем пьют ветеринары. Нескучные рассказы о людях, животных и сложной профессии

О чем рассказал бы вам ветеринарный врач, если бы вы оказались с ним в неформальной обстановке за рюмочкой крепкого не чая? Если вы восхищаетесь необыкновенными рассказами и вкусным ироничным слогом Джеральда Даррелла, обожаете невыдуманные истории из жизни людей и животных, хотите заглянуть за кулисы одной из самых непростых и важных профессий – ветеринарного врача, – эта книга точно для вас! Веселые и грустные рассказы Алексея Анатольевича Калиновского о людях, с которыми ему довелось встречаться в жизни, о животных, которых ему посчастливилось лечить, и о невероятных ситуациях, которые случались в его ветеринарной практике, захватывают с первых строк и погружают в атмосферу доверительной беседы со старым другом! В формате PDF A4 сохранен издательский макет.


…А вослед ему мертвый пес: По всему свету за бродячими собаками

Это книга о бродячих псах. Отношения между человеком и собакой не столь идилличны, как это может показаться на первый взгляд, глубоко в историю человечества уходит достаточно спорный вопрос, о том, кто кого приручил. Но рядом с человеком и сегодня живут потомки тех первых неприрученных собак, сохранившие свои повадки, — бродячие псы. По их следам — не считая тех случаев, когда он от них улепетывал, — автор книги колесит по свету — от пригородов Москвы до австралийских пустынь.Издание осуществлено в рамках программы «Пушкин» при поддержке Министерства иностранных дел Франции и посольства Франции в России.


Экспериментальные исследования способностей животных к количественным оценкам предметного мира

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.