Аналогия - [21]
Как видите, получилось нечто такое, что нельзя и выговорить. Именно такой текст и содержит 5 бит/символ, он наиболее информативен, потому что вероятность появления каждого последующего знака определяется только случаем и всегда равна 1/32. Но мы-то знаем, что в русском тексте разные буквы встречаются с разной частотой. Чаще всего встречается буква «о» (частота 0,090.), но это только в письменной речи. В устной, в московском говоре, где безударное «о» выговаривается как «а» («с Масквы, с пасада, с калашнава ряда»), положение другое[4]. В других языках в фаворитах ходят другие буквы. Вспомните «Золотого жука» Эдгара По — там герой уверенно принимает наиболее часто встречающийся в тексте знак за букву «е». На пергаменте был английский текст, но и в испанском и во французском языке, которыми также пользовались пираты Карибского моря, «е» — чаще всего встречающаяся буква.
Определить частоту встречаемости букв просто, нужно только учитывать характер текста. Буква «ф» в русскоязычных текстах относительно редка (частота 0,002, из согласных чаще всего встречаются «т» и «н») — за исключением математических (за счет таких слов как функция и дифференциал). Лучше использовать средние данные по различным источникам. Оказалось, что с учетом разной частоты встречаемости энтропия на символ уже 4,35 бит. Искусственный «текст» с этими поправками будет выглядеть по Добрушину примерно так:
Как видите, этого приближения явно недостаточно, чтобы случайно подобранная фраза зазвучала по-русски. Мы подходим к важному феномену: наличию связей, корреляций между символами в тексте. В самом деле, не каждая буква может занимать любое место. После пробела никогда не встретится мягкий знак, а «и» — редко, лишь в заимствованных словах (Йорк, йод). Система корреляций между символами оказывается разной у разных языков. Русский язык относится к индоевропейским, в них возможны сочетания нескольких согласных (взвод, встреча, бодрствовать) и закрытые, оканчивающиеся на согласный слоги. А в японском и полинезийском языках гласные и согласные строго чередуются, и закрытых слогов нет. Это хорошо обыграл Г. Мелвил в повести «Тайпи», где герой представляется друзьям-канакам самым простым английским именем Том. Оказалось, что произнести его они не в состоянии. Томи, Томо — пожалуйста.
Но и любая гласная не может появиться после любой согласной. «Я» после «г» в русском языке крайне редка (лишь в заимствованном слове «гяур»), только Марина Цветаева осмеливалась писать — «рвя и жгя».
Добрушин учел корреляции между соседними буквами. Получилась следующая фраза:
Энтропия на символ снижается до 3,52 бит, но фразу уже можно прочесть, не запинаясь. Но ведь корреляции касаются не только соседних букв, но и третьих и четвертых за выбранными. Если учтем частоту трехбуквенных сочетаний, будет фраза вроде:
В ней уже встречаются вполне русские слова и части слов (энтропия 3,01 бит/символ). С учетом четырехбуквенных сочетаний получается фраза, которую, если ее быстро произнести, можно счесть за русскую:
Ясно, что учет более дальних корреляций приведет к появлению чисто русских слов, в дальнейшем уже и не в бессмысленных комбинациях, а энтропия на символ будет снижаться. Расшифровка поврежденного или закодированного текста «по Паганелю» как раз и связана с учетом корреляций между символами.
А как обстоит дело с символами в нуклеотидной последовательности ДНК или в аминокислотной — белка? Этот вопрос занимал меня давно, еще тогда, когда не был прочтен ни один ген, а за расшифровку первого белка — инсулина Сэнгер получил свою первую Нобелевскую премию. Поэтому я старался каждую появившуюся в литературе последовательность оценить с этой точки зрения. И уже первые результаты смущали и заставляли задуматься.
Вероятность встречи в любом месте одного из четырех символов, слагающих последовательность гена, или одного из двадцати символов, слагающих белок, была пропорциональна только процентному содержанию этого символа в тексте и не зависела от соседних. То есть, генетический текст оказывался построенным согласно модели 2 Добрушина.
Гены — дети случая. С какой-то стороны это меня огорчило. Я надеялся, что системы корреляций, паче чаяния они в нуклеотидных текстах окажутся, будут разными в разных геномах. А это принесло бы пользу новой отрасли систематики — геносистематике, развивающейся на наших глазах. Хороший пример из анализа лингвистических текстов. По-видимому, древнейшая или хотя бы одна из древнейших письменностей Европы — слоговое письмо А догреческого населения острова Крит — пока еще не расшифрована. Мы можем ее читать, но не понимаем языка. Однако мы знаем, что построен он был наподобие японского или полинезийского, в которых гласные и согласные строго чередуются. Греки-ахейцы, взявшие Трою, переняли это письмо и стали писать на нем по-гречески (
Современная биология – это совокупность научных дисциплин, с разных сторон и на разных уровнях изучающих все многообразие живой материи. Можно ли, опираясь на сумму накопленных знаний, построить некую систему теоретических положений, необходимых для понимания специфических отличий живого от неживого? Можно, считает автор, и в доступной форме излагает основные принципы, которые играют в биологии такую же роль, какую в геометрии – аксиомы.Для широкого круга читателей.
Учение Дарвина стоит на трех «китах» — трех основных факторах эволюции: наследственности, изменчивости и отборе. Выдержали ли эти «киты» натиск новых фактов, добытых науками нашего века — генетикой, молекулярной биологией, теорией информации? Кто прав — Дарвин или учитель Александра Македонского Аристотель? Есть ли прогресс в природе? Когда возник естественный отбор — вместе с жизнью или до нее?.. Обо всем этом и расскажет автор в данной книге, посвященной развитию учения об эволюции в XX столетии, борьбе материализма и идеализма в эволюционной теории.
История ДНК – это сага, полная блестящих научных открытий, невероятных случайностей, грубых ошибок. Она начинается с обнаружения нуклеина в конце 1860-х годов и заканчивается публикацией книги Джеймса Уотсона «Двойная спираль» в 1968 году. За эти 100 лет появились Нобелевская премия, антибиотики, рентгеновская кристаллография, радар и атомная бомба, не говоря уже о том, что прошли две разрушительные мировые войны, – и каждое из этих событий повлияло на открытие ДНК. Джеймс Уотсон и Фрэнсис Крик разгадали загадку двойной спирали, но Гарет Уильямс показывает, что их вклад был последним кусочком гигантского пазла, который собирали несколько десятилетий многие забытые историей ученые.
«Любая история, в том числе история развития жизни на Земле, – это замысловатое переплетение причин и следствий. Убери что-то одно, и все остальное изменится до неузнаваемости» – с этих слов и знаменитого примера с бабочкой из рассказа Рэя Брэдбери палеоэнтомолог Александр Храмов начинает свой удивительный рассказ о шестиногих хозяевах планеты. Мы отмахиваемся от мух и комаров, сражаемся с тараканами, обходим стороной муравейники, что уж говорить о вшах! Только не будь вшей, человек остался бы волосатым, как шимпанзе.
Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.
О чем рассказал бы вам ветеринарный врач, если бы вы оказались с ним в неформальной обстановке за рюмочкой крепкого не чая? Если вы восхищаетесь необыкновенными рассказами и вкусным ироничным слогом Джеральда Даррелла, обожаете невыдуманные истории из жизни людей и животных, хотите заглянуть за кулисы одной из самых непростых и важных профессий – ветеринарного врача, – эта книга точно для вас! Веселые и грустные рассказы Алексея Анатольевича Калиновского о людях, с которыми ему довелось встречаться в жизни, о животных, которых ему посчастливилось лечить, и о невероятных ситуациях, которые случались в его ветеринарной практике, захватывают с первых строк и погружают в атмосферу доверительной беседы со старым другом! В формате PDF A4 сохранен издательский макет.
Это книга о бродячих псах. Отношения между человеком и собакой не столь идилличны, как это может показаться на первый взгляд, глубоко в историю человечества уходит достаточно спорный вопрос, о том, кто кого приручил. Но рядом с человеком и сегодня живут потомки тех первых неприрученных собак, сохранившие свои повадки, — бродячие псы. По их следам — не считая тех случаев, когда он от них улепетывал, — автор книги колесит по свету — от пригородов Москвы до австралийских пустынь.Издание осуществлено в рамках программы «Пушкин» при поддержке Министерства иностранных дел Франции и посольства Франции в России.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.