Аналогия - [21]
Как видите, получилось нечто такое, что нельзя и выговорить. Именно такой текст и содержит 5 бит/символ, он наиболее информативен, потому что вероятность появления каждого последующего знака определяется только случаем и всегда равна 1/32. Но мы-то знаем, что в русском тексте разные буквы встречаются с разной частотой. Чаще всего встречается буква «о» (частота 0,090.), но это только в письменной речи. В устной, в московском говоре, где безударное «о» выговаривается как «а» («с Масквы, с пасада, с калашнава ряда»), положение другое[4]. В других языках в фаворитах ходят другие буквы. Вспомните «Золотого жука» Эдгара По — там герой уверенно принимает наиболее часто встречающийся в тексте знак за букву «е». На пергаменте был английский текст, но и в испанском и во французском языке, которыми также пользовались пираты Карибского моря, «е» — чаще всего встречающаяся буква.
Определить частоту встречаемости букв просто, нужно только учитывать характер текста. Буква «ф» в русскоязычных текстах относительно редка (частота 0,002, из согласных чаще всего встречаются «т» и «н») — за исключением математических (за счет таких слов как функция и дифференциал). Лучше использовать средние данные по различным источникам. Оказалось, что с учетом разной частоты встречаемости энтропия на символ уже 4,35 бит. Искусственный «текст» с этими поправками будет выглядеть по Добрушину примерно так:
Как видите, этого приближения явно недостаточно, чтобы случайно подобранная фраза зазвучала по-русски. Мы подходим к важному феномену: наличию связей, корреляций между символами в тексте. В самом деле, не каждая буква может занимать любое место. После пробела никогда не встретится мягкий знак, а «и» — редко, лишь в заимствованных словах (Йорк, йод). Система корреляций между символами оказывается разной у разных языков. Русский язык относится к индоевропейским, в них возможны сочетания нескольких согласных (взвод, встреча, бодрствовать) и закрытые, оканчивающиеся на согласный слоги. А в японском и полинезийском языках гласные и согласные строго чередуются, и закрытых слогов нет. Это хорошо обыграл Г. Мелвил в повести «Тайпи», где герой представляется друзьям-канакам самым простым английским именем Том. Оказалось, что произнести его они не в состоянии. Томи, Томо — пожалуйста.
Но и любая гласная не может появиться после любой согласной. «Я» после «г» в русском языке крайне редка (лишь в заимствованном слове «гяур»), только Марина Цветаева осмеливалась писать — «рвя и жгя».
Добрушин учел корреляции между соседними буквами. Получилась следующая фраза:
Энтропия на символ снижается до 3,52 бит, но фразу уже можно прочесть, не запинаясь. Но ведь корреляции касаются не только соседних букв, но и третьих и четвертых за выбранными. Если учтем частоту трехбуквенных сочетаний, будет фраза вроде:
В ней уже встречаются вполне русские слова и части слов (энтропия 3,01 бит/символ). С учетом четырехбуквенных сочетаний получается фраза, которую, если ее быстро произнести, можно счесть за русскую:
Ясно, что учет более дальних корреляций приведет к появлению чисто русских слов, в дальнейшем уже и не в бессмысленных комбинациях, а энтропия на символ будет снижаться. Расшифровка поврежденного или закодированного текста «по Паганелю» как раз и связана с учетом корреляций между символами.
А как обстоит дело с символами в нуклеотидной последовательности ДНК или в аминокислотной — белка? Этот вопрос занимал меня давно, еще тогда, когда не был прочтен ни один ген, а за расшифровку первого белка — инсулина Сэнгер получил свою первую Нобелевскую премию. Поэтому я старался каждую появившуюся в литературе последовательность оценить с этой точки зрения. И уже первые результаты смущали и заставляли задуматься.
Вероятность встречи в любом месте одного из четырех символов, слагающих последовательность гена, или одного из двадцати символов, слагающих белок, была пропорциональна только процентному содержанию этого символа в тексте и не зависела от соседних. То есть, генетический текст оказывался построенным согласно модели 2 Добрушина.
Гены — дети случая. С какой-то стороны это меня огорчило. Я надеялся, что системы корреляций, паче чаяния они в нуклеотидных текстах окажутся, будут разными в разных геномах. А это принесло бы пользу новой отрасли систематики — геносистематике, развивающейся на наших глазах. Хороший пример из анализа лингвистических текстов. По-видимому, древнейшая или хотя бы одна из древнейших письменностей Европы — слоговое письмо А догреческого населения острова Крит — пока еще не расшифрована. Мы можем ее читать, но не понимаем языка. Однако мы знаем, что построен он был наподобие японского или полинезийского, в которых гласные и согласные строго чередуются. Греки-ахейцы, взявшие Трою, переняли это письмо и стали писать на нем по-гречески (
Современная биология – это совокупность научных дисциплин, с разных сторон и на разных уровнях изучающих все многообразие живой материи. Можно ли, опираясь на сумму накопленных знаний, построить некую систему теоретических положений, необходимых для понимания специфических отличий живого от неживого? Можно, считает автор, и в доступной форме излагает основные принципы, которые играют в биологии такую же роль, какую в геометрии – аксиомы.Для широкого круга читателей.
Учение Дарвина стоит на трех «китах» — трех основных факторах эволюции: наследственности, изменчивости и отборе. Выдержали ли эти «киты» натиск новых фактов, добытых науками нашего века — генетикой, молекулярной биологией, теорией информации? Кто прав — Дарвин или учитель Александра Македонского Аристотель? Есть ли прогресс в природе? Когда возник естественный отбор — вместе с жизнью или до нее?.. Обо всем этом и расскажет автор в данной книге, посвященной развитию учения об эволюции в XX столетии, борьбе материализма и идеализма в эволюционной теории.
В современной нам экосистеме нет суперхищников. Нам трудно представить себе животное длиной 14 метров и весом под 10 тонн, нападающее на травоядных животных сопоставимого размера. Именно таким был самый знаменитый хищник всех времен – тираннозавр. В изучении палеобиологии тираннозавров и других динозавров за последние годы были сделаны выдающиеся открытия. Каждый год описываются десятки новых видов динозавров. Эта книга – невероятно интересное и подлинно научное путешествие длиной 100 миллионов лет, от среднеюрского до конца мелового периода.
В серии «Ученые беседуют с верующими» мы освещаем важнейшие события в жизни различных наук. Ряд брошюр посвящен биологической науке. В брошюре того же автора «Так начиналась биология» речь шла о развитии этой науки до Ч. Дарвина. В предлагаемой брошюре сообщается о трех этапных открытиях в биологии, в частности, первая глава посвящена Ч. Дарвину, труды которого составили целую эпоху и вооружили естествоиспытателей истинно научным методом изучения природы. О сущности жизни и поступательном развитии живой природы будет рассказано в следующих брошюрах.
При делении клеток организма, часть генетического материала теряется. Статья (в популярной форме, на уровне знаний по биологии даваемых в средней школе) рассказывает об открытии механизма защиты хромосом при репликации. Это открытие объясняет механизм старения клеток, возникновение раковых опухолей, и, возможно, может пролить свет на процесс старения организма.
Широко известный чешский археолог рассказывает в научно-популярной книге о «детстве» человечества, его древних обиталищах — пещерах, о той роли, которую они играли в жизни древнего человека, о сохранившихся до наших дней исторических пещерных памятниках, их изучении и сохранении.Книга рассчитана на массового читателя.
«Счастье, если в детстве у нас хороший слух: если мы слышим, как красота, любовь и бесполезность громко славят друг друга каждую минуту, из каждого уголка мира природы», — пишет американская писательница Шарман Эпт Рассел в своем «Романе с бабочками». На страницах этой элегантной книги все персонажи равны и все равно интересны: и коварные паразиты-наездники, подстерегающие гусеницу, и бабочки-королевы, сплетающиеся в восьмичасовом постбрачном полете, и английская натуралистка XVIII столетия Элинор Глэнвилль, которую за ее страсть к чешуекрылым ославили сумасшедшей, и американский профессор Владимир Набоков, читающий лекцию о бабочках ошарашенным студентам-славистам.
Эта книга написана крупным западногерманским специалистом по гидропонике – методу выращивания растений без почвы – для всех тех, кто занимается или хочет заниматься выращиванием цветов и овощей в течение круглого года. Новый метод позволяет с равным успехом выращивать растения на окнах комнаты, на балконе или под открытым небом – на приусадебном участке или в специализированном хозяйстве с гораздо меньшими затратами труда и с большей уверенностью в успехе, чем при обычной культуре на почве. В книге описаны доступные для всех без исключения способы выращивания растений на питательных растворах и на разнообразных средах, увлажняемых этими растворами.