Добавить в цитаты Настройки чтения

Страница 19 из 25

Рис. 3-10. Выделение минимального набора генов клеточной жизни методами сравнительной геномики. G1, G2, G3 – три сравниваемых генома; С – набор консервативных генов.

Рис. 3-11. Распределение числа генов по биологическим функциям в минимальном генном наборе, полном наборе КОГ и среди экспериментально определенных незаменимых генов бактерии Bacillus subtilis. Данные по Koonin, 2003.

Поучительно провести теперь функциональную перепись минимального бактериального набора генов. В этом наборе преобладают гены, которые кодируют белки, участвующие в передаче информации в клетке (репликации, транскрипции и, прежде всего, трансляции). Метаболические ферменты и белки транспортной системы представлены куда более разреженно, что вполне ожидаемо для организма, растущего в самой богатой из возможных сред. Этим минимальный набор генов резко отличается от полного набора КОГ, но напоминает набор незаменимых бактериальных генов (нокаут которых убивает бактерию, см. рис. 3-11). Эта особая эволюционная устойчивость систем передачи клеточной информации является одним из центральных обобщений сравнительной геномики. Мы вернемся к этому вопросу позднее.

Рис. 3-12. Эволюционный сценарий замещения неортологичных генов.

По-видимому, самым весомым результатом поиска минимального набора генов было открытие, что в списке легко обнаружимых ортологов недостает нескольких важных функций. Этот результат был подтвержден и значительно усилен при сравнении бактериальных геномов с первым архейным (Methanocaldococcus ja

В табл. 3–2 описывается несколько примеров ключевых биологических функций, для которых два или несколько неродственных ферментов по-разному представлены в частично дополнительных, но обычно перекрывающихся группах эволюционных линий. Даже эти отдельные примеры показывают, что ЗНОГ происходит в самых различных функциональных системах и путях. В дальнейшем, с заметным увеличением числа секвенированных геномов, стало ясно, что ЗНОГ и утрата генов в отдельных линиях настолько широко распространены, что лишь малое число функций являются действительно мономорфными и вездесущими (то есть представлены ортологичными генами во всех организмах). Вместе с тем универсальное ядро жизни уменьшилось почти до исчезновения: все, что остается универсальным, – это около тридцати генов белков трансляции и три больших субъединицы РНК-полимеразы, а также примерно равное число генов структурных РНК (рРНК и тРНК).

Таблица 3–2. Примеры замещения неортологичных генов.

Даже при исключении паразитических бактерий перечень универсальных генов расширяется незначительно (Koonin, 2003). Таким образом, за исключением небольшого числа генов, участвующих в основных этапах передачи информации, не существует универсального генетического ядра жизни, в связи с повсеместными ЗНОГ и потерей генов. Концепция небольшого, универсального набора функций, необходимых для поддержания клетки, остается жизнеспособной, но, учитывая комбинаторику ЗНОГ, этот наименьший набор функциональных ниш может заполняться огромным разнообразием генных ансамблей.

Единицы эволюции и фрактальная структура генетической вселенной





Результаты сравнительной геномики приводят к ключевому обобщению, которое позволяет нам выполнять продуктивные эволюционные исследования: основные единицы эволюции могут быть довольно четко определены, и единицы эти – кластеры ортологичных генов, или эволюционные домены (КОГ), или, еще точнее, линии эволюционирующих ортологичных генов (доменов). Истории отдельных генов часто сложны (а во многих случаях даже чрезвычайно сложны) и включают в себя множественные утраты генов, дупликацию и горизонтальный перенос (ниже в настоящей книге мы обсудим эти явления подробнее, см. гл. 5 и 7). Предрасположенность генов к дупликации, утрате и переносу варьирует в широких пределах. Однако, невзирая на все эти осложнения, атомарное свойство наборов ортологичных генов твердо соблюдается: КОГ суть естественные элементы генетической вселенной.

Генетическая (геномная) вселенная (это только метафора, но удобная и, возможно, продуктивная) может быть представлена как развивающееся пространство-время, заполненное кластерами, состоящими из генов (то есть КОГ), или, точнее, эволюционирующими линиями ортологов, элементарными единицами эволюции. Ортология легче всего прослеживается между прокариотическими генами, так что здесь мы обсудим прокариотическую область геномной вселенной. Тенденции среди эукариотов в принципе похожи, но осложнены распространенной мультидоменной организацией белков и обширной паралогией. В нашем геномном пространстве заметно характерное распределение КОГ по геномам, хорошо аппроксимируемое тремя экспонентами с разными показателями, которые делят генную популяцию на три класса (см. рис. 3-13, а – в; Koonin and Wolf, 2008b).

1. (Почти) универсальные гены, те, что представлены в (почти) всех геномах клеточных форм жизни, составляют лишь малую часть генетической вселенной: это ядро клеточной жизни состоит, самое большее, из приблизительно 70 генов. В каждом конкретном геноме доля этих «ядерных» генов составляет не более 10 процентов, если говорить о самых маленьких геномах клеточных форм жизни (паразитических бактерий, таких как M. genitalium), но обычно ближе к 1 проценту или менее от общего числа генов (см. рис. 3-14).

2. Умеренно консервативная генная оболочка состоит из КОГ, представленных в самых разнообразных геномах, но не в подавляющем их большинстве. Недавний анализ имеющихся прокариотических геномов дает число КОГ оболочки около 5000. Гены оболочки составляют большую часть числа генов в любом геноме (см. рис. 3-14).

3. Малоконсервативное «облако» состоит из КОГ, встречающихся в узких группах организмов, и «генов-сирот» – генов в открытых рамках считывания (ОРС), обнаруженных пока что в одном-единственном геноме, но гомологи которых обычно обнаруживаются во вновь появляющихся геномных данных. Гены «облака» составляют переменную долю в каждом геноме, обычно в интервале 10–30 процентов от общего числа генов (см. рис. 3-14).

Примечательно, что эта структура является самоподобной, или фрактальной: те же три компонента – крошечное ядро, сравнительно большая оболочка и огромное «облако» – проявляются на любом уровне, где бы ни рассекалось генное пространство-время, от всего мира прокариот и до узких групп бактерий (см. рис. 3-14). Мы возвратимся к последствиям этой фрактальности геномного пространства-времени прокариот в главе 5. Заметим, однако, что эволюционная модель, которая объясняла бы наблюдаемую фрактальность, еще ожидает своей разработки[36].

36

Уже после публикации оригинала этой книги такая модель в первом приближении была разработана (Lobkovsky AE, Wolf YI, Koonin EV. Gene frequency distributions reject a neutral model of genome evolution // Genome Biol Evol. 2013;5(1):233-42). Эта модель указывает на необходимость неравномерного распределения силы отбора, действующей на отдельные гены, для формирования характерной трехкомпонентной структуры генной вселенной.