Страница 7 из 10
Весь генетический код состоит из очень длинных цепей дезоксирибонуклеиновой кислоты (ДНК), в которой зашифрованы клеточные инструкции для производства белков. У всех видов с половым размножением (включая нас) есть две цепочки ДНК в ядрах почти всех клеток (кроме эритроцитов, у которых нет ядра) – по одной от матери и отца. Если бы мы были пирогом, то каждый из наших родителей вкладывался бы вполовину в каждый ингредиент.
Но наша ДНК состоит не из муки, сахара или пищевой соды, а из четырех типов молекул под названием нуклеотиды. Эти нуклеотидные основы называются гуанин, аденин, тимин и цитозин. Однако чаще всего их записывают по первым буквам: Г, А, Т или Ц. Пары Т и А, Г и Ц связываются вместе, подобно поездам, идущим по параллельным путям и едва касающимся друг друга. Порядок поездов, или последовательность ДНК, которую мы называем генами, создает уникальный набор инструкций для производства белков. Эти инструкции доставляются в клетки через особого проводника – рибонуклеиновую кислоту (РНК). Белки – настоящие клеточные «актеры», способные сыграть нужную роль: превратиться в определенный тип клетки, формировать структуру и регулировать работу органов и тканей, вызывать химические реакции или даже расти.
Обычно наши человеческие гены упакованы в 23 пары ДНК-цепочек внутри клеток – хромосомы, а каждая хромосома отвечает за определенный набор функций в организме. Внутри людей сокрыта примерно 21 000 генов и 3,2 миллиарда пар оснований – участков генома, создающих полный набор генов в организме. В каждой паре оснований Г соединяется с Ц, а Т – с А.
Ключевые гены в нашем организме, как правило, предоставляют клеткам инструкции для производства белков. Но около 99 % всей ДНК в кодировании белка не участвует никак. Такие гены раньше назывались мусорной ДНК ведь, по мнению ученых, они не выполняли значимых биологических функций. Сегодня же их можно считать игроками на скамейке запасных, которые подбадривают, подсказывают и направляют свою команду на поле. Эти некодирующие гены играют важную роль, управляя созданием определенных РНК-молекул, которые передают инструкции от генов к клеточному ядру и регулируют экспрессию генов, кодирующих белки.
Каждая наша клетка, обладающая ядром, содержит чертеж всего нашего тела. Но если бы каждая клетка пыталась создавать всего человека, результат оказался бы плачевным. Вместо этого нашу генетическую ДНК регулирует особый процесс – эпигенетика которая определяет, какие именно гены экспрессируются. Например, в клетках кожи можно найти схему строения клеток печени и других типов, однако эпигенетические отметки заставляют такие клетки создавать именно кожу. Возвращаясь к аллегории с футболом, каждый игрок знает план игры, но выполняет только свою определенную роль – по команде[8].
Именно поэтому одна клетка нашей оплодотворенной яйцеклетки может развиться в столь сложное существо, как человек. В этой единственной клетке содержатся инструкции для создания клеток любого типа. Однако сами клетки постепенно дифференцируются и начинают выполнять свои собственные функции. Такие специализированные клетки не являются обособленными частицам. Это, скорее, четко выраженные составляющие во взаимосвязанной клеточной экосистеме. И точно так же, как наши органы взаимодействуют в нашем теле, гены влияют друг на друга внутри динамической системы нашего генома.
Все это кажется на редкость сложным. Так оно и есть. Поэтому нам потребовались сотни лет, чтобы понять, как работают системы, и до сих пор мы не дошли до половины. Но рецепт и понимание инструкций с природой ингредиентов критически необходимы, чтобы начать готовить пирог. Хотя ученые поняли, что гены – это алфавит жизни, им еще предстояло разобраться, что означала каждая буква, чтобы иметь возможность прочесть эту книгу.
Двойная спираль ДНК оказалась руководством из букв. Но что эти буквы гласили?
Полноценная расшифровка генома человека оказалась чрезвычайно сложной для людей задачей. К счастью, на помощь пришла техника. В середине 1970-х годов ученые из Кембриджа Фредерик Сенгер и Алан Коулсон придумали гениальный способ: нужно провести электрический ток через гель, чтобы разрушить геном клетки, окрасить фрагменты генома и рассортировать разные нуклеотиды по длине. Затем этот гель пропускали через специально разработанную камеру, чтобы считать генетические структуры. Этот ранний процесс секвенирования генома был медленным и затратным. Однако он стал огромным скачком вперед.
Поняв, как автоматизировать этот процесс и улучшить считывание световых вспышек, проходящих по «буквам» ДНК, исследователи Ли Худ и Ллойд Смит смогли увеличить скорость и эффективность секвенирования, а также заложить основу для еще одного шага вперед. В 1988 году Национальный институт здравоохранения США запустил глобальную кампанию по активной разработке следующего поколения машин, секвенирующих ДНК, и она стала плацдармом для еще более амбициозных кампаний по расшифровке всего генома[9].
Проект «Геном человека» – амбициозная попытка мировых ученых под руководством США секвенировать и создать карту первого генома человека – обошелся в 2,7 миллиарда долларов и длился целых 13 лет, его завершили в 2003 году. К этому времени частная компания, возглавляемая ученым и предпринимателем Крейгом Вентером, придумала альтернативный способ секвенирования генома – не столь масштабный, но более быстрый, чем правительственный вариант. Обе этих программы стали колоссальным скачком для человечества, и дальнейшее развитие не прекращалось. Появление таких компаний, как Illumina в Сан-Диего или BGI-Shenzhen в Китае, превратило секвенирование генома в конкурирующую, быстро развивающуюся и многомиллиардную глобальную индустрию. Следующее поколение нанопоровых секвенаторов, которые под действием тока пропускают ДНК через крошечные отверстия в белках и считывают с них содержимое, как с телеграфной ленты, может стать еще большим революционным прорывом[10].
По мере того, как технологии становились точнее и мощнее, их стоимость стремительно снижалась. График ниже показывает, как резко снизилась стоимость секвенирования генома за последние 15 лет.
Источник: The Cost of Sequencing a Human Genome, NIH, дата последнего изменения 6 июля 2016 года, https://www.genome.gov/27565109/the-cost-of-sequencing-a-human-genome/.
Сегодня секвенирование всего генома выполняют за день, и оно стоит порядка 700 долларов. В начале 2017 года генеральный директор Illumina Фрэнсис де Соуза объявил, что в недалеком будущем его компания планирует секвенировать целый геном за 100 долларов. По мере того, как стоимость секвенирования приближается к затратам на материалы, а само секвенирование оказывается все более доступным, за меньшие деньги вы можете получить все больше данных. А поскольку геномика – это настоящий полигон для больших массивов данных, увеличение объема и удешевление данных заложат основу для важных открытий.
Но даже если секвенирование станет повсеместным, обыденным и бесплатным, это ничего не изменит, если ученые не научатся понимать язык геномов.
Если бы марсианка прилетела на Землю, желая выяснить, как люди структурируют информацию, ей бы пришлось узнать, что у нас есть определенные вещи, которые мы называем «книги». Затем ей пришлось бы понять, что такие книги состоят из страниц, которые заполнены словами, а те, в свою очередь, образуются из букв. Точно так же и мы узнали, что ДНК находится в генах, упакованных в хромосомы, кодирующие белки и инструктирующие клетки о дальнейших действиях. Если бы марсианка захотела понять, что сказано в книгах, ей пришлось бы разобраться, что означают слова и как их читать. Аналогично, когда ученые вывели основы организации генов, еще предстояло понять, чем на самом деле эти гены занимаются.
8
Большую часть эпигенетических меток создают в зарождающемся организме с нуля. Однако недавнее исследование показало, что небольшой процент таких меток на самом деле наследуется от родителей. Поэтому ряд исследователей усомнился в общепринятой вере, что теории Жана-Батиста де Ламарка ошибочны.
9
Почитать про техническую составляющую секвенирования ДНК можно в работе James M. Heather, Benjamin Chain. The Sequence of Sequencers: The History of Sequencing DNA // Genomics 107. – Vol. 1 (2016): 1–8. – doi:10.1016/j.ygeno.2015.11.003.
10
John J. Kasianowicz, Sergey M. Bezrukov. On Three Decades of Nanopore Sequencing // Nature Biotechnology. – Vol. 34 (2016). – PP: 481–482.