Страница 12 из 16
Некоторые биологи составили достаточно правильное и обоснованное представление о количестве генов у человека задолго до того, как был прочитан его геном. Еще в 1972 году эволюционный биолог Сусуму Оно писал в своей статье “Столько мусорной ДНК в нашем геноме"84, что у нас должно быть около 30 тысяч генов. Эту феноменально близкую к правде цифру Оно получил сорок лет назад из соображений о том, как часто происходят вредные мутации – изменения ДНК, негативно сказывающиеся на потомстве у людей, мышей и других организмов. Если бы у нас было 3 миллиона важных генов, то многие из них неизбежно портились бы в каждом поколении. А вот 30 тысяч, согласно расчетам Оно, мы могли бы содержать в нашем геноме без серьезных рисков. Но из этого следовало, что большая часть генома человека не несет жизненно важных функций или попросту является “мусором". Мутации в таких участках безвредны. В пользу принципиального существования мусора в ДНК можно добавить такой не совсем корректный, но интуитивно понятный аргумент: если бы каждый нуклеотид в любом геноме был функционален, то зачем луку геном в пять раз больший, чем наш с вами?
С появлением новых данных – полных геномов человека и других животных – ситуация прояснилась. Если взять геномы человека, шимпанзе, мыши, утконоса и так далее, окажется, что какие-то участки последовательностей нуклеотидов даже у сравнительно далеких видов очень похожи – например, гены, необходимые для синтеза белков, входящих в состав рибосом. Это понятно: рибосомы возникли очень давно, у них были миллиарды лет, чтобы в процессе эволюции достигнуть такого совершенства, что их практически невозможно улучшить или изменить, не испортив один из важнейших клеточных процессов – синтез белков, за который они отвечают.
Мутации происходят в любых участках генома, поэтому хорошим критерием функциональности участка ДНК является то, что возникающие в нем мутации не закрепляются: носители новых генетических вариантов вымирают, не оставляя потомства, устраняются естественным отбором. Другие участки геномов имеют значительные расхождения между видами и даже внутри видов. Значит, мутации в этих участках, скорее всего, безвредны, то есть их функциональная роль как минимум невелика или не зависит от конкретной последовательности нуклеотидов. Например, если последовательность нужна только для физического разделения в пространстве двух участков ДНК. Это знание используется в современной медицинской генетике, когда ученые пытаются понять, какие изменения в ДНК человека приводят к тому или иному наследственному заболеванию85: наиболее подозрительными являются мутации в эволюционно неизменных участках ДНК.
В ряде современных работ оценили долю участков ДНК человека, мутации в которых вредны, и оказалось, что они составляют лишь около 6,5-10 % генома человека86, 87, что снова совпало с предсказаниями Оно! В далеком 1972 году он из теоретических соображений называл цифру в 6 %! У нас большой геном, но, по-видимому, в нем действительно довольно много лишнего. Важен не только размер генома, но и умение им пользоваться.
Еще один актуальный вопрос: насколько последовательности ДНК различаются между живыми организмами? Насколько похожи гены человека и шимпанзе? Гены человека и банана? Степень сходства (доля совпадающих нуклеотидов) будет варьировать в зависимости от выбранного участка ДНК. Ниже показаны сравнения (нуклеотидные выравнивания) генов, кодирующих белок гистон H1 человека и шимпанзе, а также человека и банана (звездочками помечены совпадающие нуклеотиды; знаками “-” – отсутствующие). Гистоны – это белки, на которые “наматывается” ДНК, чтобы компактно упаковаться в ядре. Это очень древние белки, возникшие на заре эволюции, необходимые для жизни всем эукариотам. Поэтому степень сходства между организмами по генам этого белка выше среднего – мутации в этих генах чаще всего вредны.
Можно заметить, что ген человека и ген шимпанзе почти идентичны: всего 5 отличий на 660 нуклеотидов! В среднем у человека с шимпанзе последовательности ДНК совпадают на 98,76 %88 (чуть ниже, чем получилось для приведенного сравнения), а вот геномы двух людей совпадают примерно на 99,9 %. Мы также видим, что ген гистона банана совпадает с геном человека лишь где-то на 50 %. Для сравнения, если мы возьмем две совершенно случайные последовательности ДНК, между ними будет около 25 % сходства. Шимпанзе ближе к человеку, чем к банану, не только по степени сходства генов, но и по набору генов в геноме. У банана будет много генов, которых нет у приматов (например, связанных с фотосинтезом), а у приматов будут гены, которых нет у растений (например, связанные с развитием нервной системы).
Полезно представлять, насколько маленьким может быть геном живого организма. Геном паразитической бактерии Mycoplasma genitalium составляет всего около 580 тысяч “букв” – это один из самых маленьких известных бактериальных геномов89. Еще меньше бывают геномы вирусов. Вирусы не принято называть “живыми”, ведь они не являются клетками и не могут самостоятельно размножаться. Вирусы – это паразитическая наследственная информация, использующая генетический аппарат клеток для синтеза своих белков, размножения и распространения.
Типичный геном вируса иммунодефицита человека (ВИЧ) составляет 9749 нуклеотидов90. Бывают и на удивление крупные вирусы с очень богатым генетическим материалом, например, геномы пандоравирусов могут достигать размера в 2,5 миллиона нуклеотидов91, а живут они в амебах – одноклеточных эукариотах. Также в амебах живет и другая группа крупных вирусов с милым названием мимивирусы, геномы которых достигают миллиона нуклеотидов, что для вирусов тоже очень много92.
ВИЧ – это ретровирус, но не подумайте, что это вирус шестидесятых (впервые вызываемый им синдром приобретенного иммунодефицита – СПИД – был диагностирован в 1981 году). Он называется ретровирусом потому, что его геном сделан не из ДНК, как у большинства вирусов и живых организмов, а из РНК. У ретровирусов есть белок “обратная транскриптаза”, который умеет делать транскрипцию наоборот, то есть синтезирует ДНК, комплементарную молекуле РНК. С помощью этого белка ВИЧ создает ДНК-версию своего генома и встраивает ее в геном человеческой клетки. Дальше инфицированная клетка начинает сама производить вирусный генетический материал и его белки. Синтезированные компоненты собираются в новые вирусные частицы и выходят из клетки.
Генетические последовательности можно записывать в виде текста и работать с ними как с последовательностью букв. Так их удобно анализировать: исследовать распространенность тех или иных мутаций в популяции, изучать закономерности эволюции, находить определенные гены и так далее. Ниже приведена последовательность гена, который кодирует обратную транскриптазу ВИЧ.
А вот аминокислотная последовательность обратной транскриптазы ВИЧ в стандартном однобуквенном коде.
Обратите внимание, что теперь мы должны использовать не 4 символа, а 20 – для обозначения аминокислот, а не нуклеотидов, и количество символов уменьшилось в три раза, ведь тройке нуклеотидов отвечает одна аминокислота. Мы досконально знаем, как устроен геном ВИЧ с точностью до нуклеотидов, а точнее, мы знаем последовательности геномов сотен разных его штаммов, причем все они выложены в свободный доступ. И вот странный факт: есть целое движение людей, отрицающих существование этого вируса!