Дупликация генов в пределах генома играет сходную историческую роль с дупликацией видов (видообразованием) в филогенезе. Она ответственна за разнообразие генов, так же как видообразование ответственно за филетическое разнообразие. Все великолепное разнообразие жизни возникло, начавшись с одного всеобщего предка, посредством ряда ответвлений новых видов, которые в итоге положили начало большим ветвям царств живой природы и сотням миллионов других видов, украсивших собой Землю. Похожий ряд ветвлений, но на сей раз в пределах геномов (дупликаций генов), породил обширную и разнообразную популяцию кластеров генов, составляющих современный геном.
История глобинов — лишь одна из многих. Дупликации и делеции генов происходили время от времени во всех геномах. Именно такими и другими аналогичными путями размеры геномов и могут увеличиваться в ходе эволюции. Но припомните разницу между суммарной емкостью всего генома и емкостью той его части, которая реально используется. Вспомните, что используются не все гены глобинов. Некоторые из них, такие как тета-ген в альфа-кластере генов глобинов, представляют собой псевдогены, узнаваемо родственные функциональным генам в тех же геномах, но на деле никогда не переводимые на действующий язык белков. То же, что относится к глобинам, относится и к большинству других генов. По геномам разбросано множество нефункциональных псевдогенов — ошибочных дубликатов функциональных генов, которые ничего не делают, в то время как их функциональные родственники (здесь даже незачем осторожничать, ставя это слово в кавычки) продолжают делать свое дело в другой части того же генома. А есть и гораздо большее количество ДНК, которая не заслуживает даже названия псевдогенов.
Она тоже произошла путем дупликаций, но это были не дупликации функциональных генов. Она состоит из многочисленных копий разного мусора, “тандемных дупликаций” и прочей бессмыслицы, которая может быть полезна для судебно-медицинских экспертов, но, судя по всему, не используется в самом организме. И опять же креационисты могли бы хорошенько поразмыслить над тем, зачем Создателю понадобилось засорять геномы нетранслируемыми псевдогенами и тандемными дупликациями мусорной ДНК.
Можно ли измерить информационную емкость той части генома, которая реально используется? Ее можно, по крайней мере, оценить. В случае человеческого генома она составляет около 2 % — гораздо меньше, чем та часть своего жесткого диска, которую я использовал с тех пор, как купил его. Соответствующий показатель для генома гребенчатого тритона предположительно даже меньше, но мне неизвестно, измеряли ли его. В любом случае мы не должны выносить отсюда шовинистическую идею, что человеческий геном должен почему-либо обладать самой большой базой ДНК-данных, раз мы такие замечательные. Великий эволюционист Джордж Уильямс обратил внимание на то, что животным со сложным жизненным циклом нужно кодировать развитие всех стадий жизненного цикла, но у них есть на это только один геном. Геном бабочки должен содержать всю информацию, необходимую для построения организма как гусеницы, так и бабочки. В жизненном цикле печеночной двуустки целых шесть стадий, специализированных для разного образа жизни. Нам не стоило бы особенно обижаться, если бы оказалось, что у печеночных двуусток геном больше нашего (на самом деле это не так).
Вспомним также, что даже суммарная емкость той части генома, которая реально используется, не то же самое, что настоящее количество информации в шенноновском смысле слова. Настоящее количество информации — это то, что останется, когда вся избыточность будет удалена из сообщения путем сжатия, с помощью умозрительного эквивалента программы-архиватора. Существуют даже некоторые вирусы, которые, судя по всему, используют что-то вроде такого сжатия. Они пользуются тем, что код РНК (эти вирусы содержат не ДНК, а РНК) считывается триплетами. Имеется “рамка”, которая движется вдоль последовательности РНК, считывая три буквы за один раз. Очевидно, что в обычном случае, если эта рамка начнет считывать код не с того места (как это происходит при так называемых мутациях сдвига рамки считывания), получится полная бессмыслица: “триплеты”, которые она будет считывать, пойдут не в ногу с осмысленными триплетами. Но эти замечательные вирусы научились с успехом пользоваться сдвигом рамки считывания. Они получают два сообщения по цене одного, за счет совершенно другого сообщения, заключенного в той же самой последовательности букв, если считывать ее со сдвигом рамки. В принципе можно получить даже три сообщения по цене одного, но я не знаю таких примеров.