Аналогия - [13]

Шрифт
Интервал

В передаваемой по каналу связи информации выделяются тексты, которые можно разбить на символы, и каждому символу придать значение (энтропия на символ).

Так, если бы в тексте на русском языке все буквы, включая знаки препинания и пробел между словами (32 символа), встречались с равной частотой, информационная емкость русского алфавита равнялась бы:

-∑1/32 log2l/32 = log32 = 5 бит/символ

Обычно она гораздо меньше. 5 бит/символ — это предельная величина. Но во всех реальных текстах символы встречаются с разной частотой, и энтропия обычно меньше, примерно в 2,5 раза, и приближается к двум битам на символ. Отсюда можно подсчитать и объем информации в тексте. Например, в авторском листе (единице объема рукописей) 40 000 символов и, значит, 80 000 бит информации. Но опять же это верхний предел, эта цифра имеет значение для наборщика и корректора, но не читателя. Далее мы еще вернемся к этому.

А пока ответим на вопрос: откуда развивающийся организм берет сведения о своей сложности? Ответ однозначен — из своей генетической программы, из ДНК. В ДНК «генетический текст» закодирован четырьмя символами — аденином, гуанином, цитозином и тимином. При равной частоте встречаемости символов энтропия на символ равна:

Н = — 4(0,25 log2 0,25) = 2

То есть тексты, написанные русским языком, и текст нашей генетической программы обладают примерно равной информационной емкостью. В геноме каждого из нас содержится примерно 3,2x109 нуклеотидов; соответственно объем содержащейся в нем информации 6,4x109 бит. Любители считать могут прикинуть, библиотеке какого объема это соответствует, только пусть помнят, что в выходных данных книги указываются не авторские листы, а печатные.

Значит, им нужно сначала подсчитать число символов на страницу текста книги данного формата и умножить на число страниц. Но все эти подсчеты будут сугубо приближенные: и в случае с ДНК два бита/символ — недостижимый максимум.

Кроме того, надо учесть одно обстоятельство: чтобы превратиться в признаки и свойства организма, генетическая информация перекодируется, проходя по каналу:

ДНК → РНК → белок

Передатчик этой информации — хромосома, приемник — цитоплазма клетки, в которой синтезируется белок. А уж от набора белковых молекул и их количества зависит дальнейшая судьба клетки и всего организма.

Первый этап перекодировки ДНК → РНК не изменяет информационной емкости сигнала. Ведь нуклеотидный текст остается без изменения, только тимин заменяется на урацил. А это тот же тимин, только неметилированный (без группы СН3). Зато перекодировка нуклеотидного текста информационной РНК в аминокислотную последовательность белка весьма существенна.

Сейчас и в школе учат, что одна аминокислота, точнее, один аминокислотный остаток в полипептидной цепи, образующей белок, соответствует трем нуклеотидам в информационной РНК. Возможное число сочетаний из 4 по 3 — это 43, т. е. 64 символа. Если бы в наших белках было 64 аминокислоты, то энтропия на символ равнялась бы:

H = -64(1/64 log2 1/64) = 6,1 бит

Но три символа (тройки нуклеотидов, триплеты, кодоны) — бессмысленны, они аминокислот не кодируют. На них синтез полипептидной цепи обрывается, они соответствуют пробелам между словами в печатной речи и паузам — в устной. А аминокислот в белковом тексте всего 20, причем, каждая из них кодируется разным числом триплетов. Лейцин, серии, аргинин — эти буквы белкового текста кодируются каждый шестью триплетами, а метионин и триптофан — только одним триплетом каждый. Такой код называется вырожденным.

Аналогию можно найти и в человеческих языках. В старой русской орфографии звук «эф» выражался двумя символами — Ф и Θ (ферт и фита), звук «и» — тремя: и, i, (ижица). И в орфографиях других языков встречается вырожденность кода: например, англичане звук «и» выражают через i (в начале слов, заимствованных из других языков), через е (the evening, вечер), через дифтонг ее (the speed, скорость), через еа (dean, декан), через у (prosperity). Я не останавливаюсь здесь на делении гласных на краткие и долгие; для нас это сейчас не имеет значения. Как возникла в процессе эволюции вырожденность генетического кода — неясно. Может быть, на заре жизни аминокислот в белках было больше, чем сейчас? Впоследствии часть из них выпала, а их кодоны захватили другие аминокислоты, близкие по свойствам. Но это только гипотеза, если не спекуляция.

Вернемся, однако, к энтропии на символ для белкового текста. С учетом вырожденности кода эта величина, по моим давним подсчетам, равна 4,21 бит/аминокислотный остаток. Но это опять же с допущением, что все остатки в белке встречаются с одинаковой частотой. А это далеко не так. Если учтем данные по аминокислотному составу белков, получается величина примерно в два раза меньшая — у меня получалось 2,17-2,38 бит. Разумнее все же считать эту цифру завышенной, так как я исходил из того, что, например, все шесть кодонов для аргинина встречаются с одинаковой частотой. Два бита на символ — величина, наиболее подходящая для белка.

А сколько белков может синтезировать наш организм? Решая эту проблему, исследователи столкнулись с парадоксом, получившим название «парадокса лишней ДНК» (она же «эгоистичная, паразитическая, избыточная и мусорная»). О ней-то сейчас и пойдет речь.


Еще от автора Борис Михайлович Медников
Аксиомы биологии

Современная биология – это совокупность научных дисциплин, с разных сторон и на разных уровнях изучающих все многообразие живой материи. Можно ли, опираясь на сумму накопленных знаний, построить некую систему теоретических положений, необходимых для понимания специфических отличий живого от неживого? Можно, считает автор, и в доступной форме излагает основные принципы, которые играют в биологии такую же роль, какую в геометрии – аксиомы.Для широкого круга читателей.


Дарвинизм в XX веке

Учение Дарвина стоит на трех «китах» — трех основных факторах эволюции: наследственности, изменчивости и отборе. Выдержали ли эти «киты» натиск новых фактов, добытых науками нашего века — генетикой, молекулярной биологией, теорией информации? Кто прав — Дарвин или учитель Александра Македонского Аристотель? Есть ли прогресс в природе? Когда возник естественный отбор — вместе с жизнью или до нее?.. Обо всем этом и расскажет автор в данной книге, посвященной развитию учения об эволюции в XX столетии, борьбе материализма и идеализма в эволюционной теории.


Рекомендуем почитать
Двойная спираль. Забытые герои сражения за ДНК

История ДНК – это сага, полная блестящих научных открытий, невероятных случайностей, грубых ошибок. Она начинается с обнаружения нуклеина в конце 1860-х годов и заканчивается публикацией книги Джеймса Уотсона «Двойная спираль» в 1968 году. За эти 100 лет появились Нобелевская премия, антибиотики, рентгеновская кристаллография, радар и атомная бомба, не говоря уже о том, что прошли две разрушительные мировые войны, – и каждое из этих событий повлияло на открытие ДНК. Джеймс Уотсон и Фрэнсис Крик разгадали загадку двойной спирали, но Гарет Уильямс показывает, что их вклад был последним кусочком гигантского пазла, который собирали несколько десятилетий многие забытые историей ученые.


Краткая история насекомых. Шестиногие хозяева планеты

«Любая история, в том числе история развития жизни на Земле, – это замысловатое переплетение причин и следствий. Убери что-то одно, и все остальное изменится до неузнаваемости» – с этих слов и знаменитого примера с бабочкой из рассказа Рэя Брэдбери палеоэнтомолог Александр Храмов начинает свой удивительный рассказ о шестиногих хозяевах планеты. Мы отмахиваемся от мух и комаров, сражаемся с тараканами, обходим стороной муравейники, что уж говорить о вшах! Только не будь вшей, человек остался бы волосатым, как шимпанзе.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.


О чем пьют ветеринары. Нескучные рассказы о людях, животных и сложной профессии

О чем рассказал бы вам ветеринарный врач, если бы вы оказались с ним в неформальной обстановке за рюмочкой крепкого не чая? Если вы восхищаетесь необыкновенными рассказами и вкусным ироничным слогом Джеральда Даррелла, обожаете невыдуманные истории из жизни людей и животных, хотите заглянуть за кулисы одной из самых непростых и важных профессий – ветеринарного врача, – эта книга точно для вас! Веселые и грустные рассказы Алексея Анатольевича Калиновского о людях, с которыми ему довелось встречаться в жизни, о животных, которых ему посчастливилось лечить, и о невероятных ситуациях, которые случались в его ветеринарной практике, захватывают с первых строк и погружают в атмосферу доверительной беседы со старым другом! В формате PDF A4 сохранен издательский макет.


…А вослед ему мертвый пес: По всему свету за бродячими собаками

Это книга о бродячих псах. Отношения между человеком и собакой не столь идилличны, как это может показаться на первый взгляд, глубоко в историю человечества уходит достаточно спорный вопрос, о том, кто кого приручил. Но рядом с человеком и сегодня живут потомки тех первых неприрученных собак, сохранившие свои повадки, — бродячие псы. По их следам — не считая тех случаев, когда он от них улепетывал, — автор книги колесит по свету — от пригородов Москвы до австралийских пустынь.Издание осуществлено в рамках программы «Пушкин» при поддержке Министерства иностранных дел Франции и посольства Франции в России.


Экспериментальные исследования способностей животных к количественным оценкам предметного мира

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.