Страница 11 из 71
Но секвенсоры ДНК развиваются куда стремительнее компьютерных чипов. Разработчики проекта «Геном человека» рассчитывали, что процесс секвенирования ДНК будет непрерывно ускорятся, однако действительность превзошла самые смелые ожидания.
На то, чтобы полностью (более или менее точно) расшифровать человеческий геном с его 3 миллиардами пар нуклеотидных оснований ушло 13 лет, и на всю эту гигантскую работу затратили почти 4 миллиарда долларов. Сегодня производители обычных ДНК-секвенсоров предлагают устройства, проделывающие ту же работу за один день и всего за тысячу долларов.
Основное продвижение на этом пути приходится на сравнительно недавнее время. В американском Национальном институте исследований человеческого генома построили логарифмический график, отражающий зависимость стоимости ДНК-секвенирования от времени, и сравнили его с аналогичным графиком для закона Мура. Уменьшающаяся стоимость процессора отражается на таком графике прямой линией с небольшим отклонением от горизонтали. Стоимость же ДНК-анализа начинает падать быстрее, чем муровская стоимость, уже в 2007 году, а затем ее скорость падения все больше растет (это продолжается до сих пор). Исходная расшифровка мегабазы (1 миллиона оснований) ДНК-последовательности стоила чуть меньше 10 тысяч долларов в 2001 году, нырнула под тысячедолларовую планку в 2004 году, а в 2014 году обходится… всего в полцента.
Быстрое, дешевое, надежное секвенирование – технология, коренным образом меняющая положение в науке. Количество архивируемой информации, которую получают из цепочек ДНК, растет с невообразимой скоростью. Хороший современный секвенсор, продающийся уже полностью подготовленным для работы в лаборатории, при идеальных условиях способен выявлять до 100 миллиардов пар нуклеотидных оснований в сутки. По оценкам специалистов, за 2013 год лабораториям всего мира удалось расшифровать 15 петабаз, то есть тысячу миллионов миллионов букв ДНК[23].
Что ж, ДНК-секвенирование стало весьма доступным методом. И все равно в каждом конкретном исследовании встречаются трудности, вынуждающие ученых идти на те или иные компромиссы.
Секвенирование отдельного генома в наши дни – рутинная работа, успех которой зависит главным образом от тщательности подготовки образцов, которые закладываются в секвенсор. ДНК должна быть чистой, то есть происходить от одного организма.
Если речь идет о ваших собственных клетках, особых проблем не возникает, достаточно поскрести пальцем внутри щеки. В проекте «Геном человека» у добровольцев брали пробы крови. Человеческая ДНК обладает сравнительно крупными размерами, поэтому ее после извлечения расщепляли с помощью ферментов на более «удобоваримые» куски (примерно по сотне тысяч нуклеотидных пар в каждом), а затем их «клонировали» – воспроизводили при помощи послушных лабораторных бактерий, которые, благодаря своему быстрому росту, давали большое количество искусственной бактериальной хромосомы (ИБХ) ДНК. Затем эти ИБХ извлекались из бактерий для секвенирования.
Геномы бактерий меньше, но их труднее получить в чистом виде. С теми бактериями, которые удается выращивать в виде культуры, можно разобраться достаточно легко. Прочие же так и остаются в виде непонятной смеси, содержащей неизвестно сколько различных организмов, каждый из которых добавляет в общую сумму очень небольшое количество ДНК.
Эту трудность можно обойти, прибегнув к так называемому внекультурному анализу. Он объединяет в себе растущие возможности ДНК-секвенирования с ширящимся знанием биологии бактериальной жизни. Возьмите пробу микрожизни откуда угодно: это может быть ведро морской воды, пригоршня почвы или (как раз для наших целей) кучка человеческих экскрементов. Там вы, помимо всего прочего, обнаружите массу бактерий, вирусов и (возможно) других, более крупных организмов. Не трудитесь отделять их друг от друга. Просто извлеките все ДНК, расщепите их на удобные для анализа куски и затем проведите общее секвенирование.
Появление геномики, действующей в промышленных масштабах, предоставляет ученым доступ к постоянно расширяющейся базе данных ДНК-последовательностей. А поскольку вся эта информация хранится в электронной форме (а не только в самой ДНК), компьютеры могут легко анализировать ее, сравнивая новые образцы ДНК с теми, что уже имеются в хранилище данных. Порой они находят ряд тех же букв, следующих в том же порядке; иными словами, выявляется полное совпадение данных. Иногда это часть гена, чья функция нам уже известна (зачастую она состоит в том, чтобы руководить синтезом определенного белка). Иногда этот фрагмент чуть отличается от какого-то существующего гена. Иногда он похож на ген, но содержит неизвестный компонент. Так, фрагменты ДНК, отвечающие за кодирование белков, заключают в себе особые сигналы, показывающие, где клеточная аппаратура для чтения ДНК должна прекращать работу, а где должна снова ее начинать. При тщательно продуманной интерпретации такое секвенирование «всего, что попало в ведро» способно многое поведать о населении ведра.
Впрочем, пока все равно не так-то просто осмыслить, что же присутствует в ключевых областях человеческого микробиома. Толстая кишка человека – вероятно, самая богатая и разнообразная экосистема на планете. Выделите из нее все гены, и вы обнаружите множество таких, которых никто никогда раньше не видел. Однако подобное массовое секвенирование отделяет ген от организма, которому он принадлежит; поэтому нельзя сказать, какие разновидности бактерий (или других существ) присутствуют в данном месте.
Биологи подчас пренебрегают этими подробностями, чтобы хотя бы понять, сколько различных видов имеется в образце. Для этого они сосредотачивают внимание лишь на одном определенном гене каждой бактерии. Подход действенный: у разных бактерий этот ген почти один и тот же, если не считать небольших его участков, где наблюдаются существенные отличия. Этот ген отвечает за формирование участка РНК, молекулярной кузины ДНК, а РНК входит в состав незаменимой наномашины – рибосомы, получающей генетическое послание от участка ДНК и на основе этой инструкции собирающей аминокислоты в белковую молекулу.
Один из таких генов отвечает за 16S рРНК (рибосомную РНК, названную так по скорости седиментации – скорости, с которой она движется, если поместить суспензию с ней в центрифугу. Стандартная лабораторная методика разделения крупных фрагментов клеток).
16S рРНК приносит исследователям неоценимую пользу. Она имеется лишь у бактерий, поскольку эукариотические рибосомы устроены иначе. В клетке она присутствует в больших количествах, а значит, ее можно сравнительно легко оттуда извлекать. А 1500 нуклеотидных оснований[24], из которых она состоит, можно было секвенировать уже несколько лет назад.
Как анализировать гены – по одному, все одновременно или же вид за видом?
Последовательность 16S рРНК занимает важное место в новейшей истории биологии: этот фрагмент стал стандартным инструментом первой стадии анализа микробиома. Собственно, первые работы с 16S рРНК начались еще до того, как можно было секвенировать всю последовательность. Карл Вёзе, умерший в 2012 году, давно использовал ее для того, чтобы заново нарисовать всю карту жизни. Еще в 1970-е годы он начал сравнивать последовательности коротких фрагментов РНК – олигонуклеотидов – у различных бактерий. Выстраивая взаимосвязи между микроорганизмами и «генеалогическими деревьями» этих последовательностей, в конечном счете удалось кардинальным образом пересмотреть всю структуру жизни на Земле. Вёзе обнаружил существование третьего домена (надцарства) живых организмов (входящие в него существа теперь именуются археями), довольно сильно отличающегося от двух доменов, которые уже были известны, – бактерий и эукариот (существ более крупных, имеющих клеточное ядро). Археи, как и бактерии, являются прокариотами. Раньше ученые полагали, что все прокариоты – сравнительно близкие родственники. Но археи заметно отличаются от бактерий. Поначалу их считали существами экзотическими, обитающими лишь в самых необычных местах, но теперь-то нам известно, что археи есть повсюду, в том числе в нашем микробиоме.
23
Singer, 2013.
24
Здесь уже не идет речь о парах нуклеотидных оснований: РНК – молекула однонитевая (в отличие от ДНК, которая состоит из двух нитей). (Прим. перев.)