Ученых поразило, что такая огромная доля генома не кодирует никаких белков. Однако больше всего их удивило не само это явление, а его размах. Специалисты уже много лет знали о существовании участков ДНК, не кодирующих белки. Собственно, это стало одним из первых больших сюрпризов после открытия структуры ДНК. Однако тогда вряд ли кто-нибудь представлял, какими важными окажутся эти области ДНК, и вряд ли кто-нибудь ожидал, что они помогут объяснить причины некоторых генетических заболеваний.
Сейчас не помешает чуть подробнее вглядеться в строительные блоки нашего генома. Напомним, ДНК — своего рода алфавит, к тому же весьма простой. В нем всего четыре буквы — А, Г, Т и Ц (аденин, гуанин, тимин и цитозин). Их называют нуклеотидными основаниями. Этот простенький алфавит несет в себе невероятное количество информации. Человек наследует 3 миллиарда оснований, составляющих наш генетический код, от матери, и аналогичный набор оснований от отца. Представьте себе ДНК как веревочную лестницу, где каждая ступенька — нуклеотидное основание, причем между соседними ступеньками 25 сантиметров. Такая лестница протянулась бы на 75 миллионов километров, то есть приблизительно от Земли до Марса (впрочем, тут многое зависит от того, где эти планеты будут располагаться на своих орбитах в тот момент, когда мы протянем эту воображаемую лестницу).
Еще одно сравнение. Полный корпус произведений Шекспира содержит в себе, по уверениям специалистов, 3 миллиона 695 тысяч 990 букв>1. Представим себе, что все это собрали в один толстенный том. Мы наследуем от матери текст объемом чуть больше 811 таких книг. И столько же — от отца. Это, прямо скажем, немалый объем информации.
Если продолжать аналогию с алфавитом, можно заметить, что алфавит ДНК кодирует лишь трехбуквенные слова. Каждое такое слово соответствует определенной аминокислоте — строительному блоку, из которых конструируются белки. Ген можно представить себе как предложение из таких трехбуквенных слов. Такая фраза кодирует последовательность аминокислот, из которых слагается тот или иной белок. (См. рис. 2.1.)
Рис. 2.1. Связь между геном и белком. Каждая трехбуквенная последовательность в гене кодирует один строительный блок соответствующего белка.
В каждой клетке обычно содержится по две копии каждого гена. Одну копию мы наследуем от матери, одну — от отца. Но хотя в клетке лишь две копии каждого гена, она способна создавать тысячи и тысячи белковых молекул, кодируемых тем или иным геном.