Страница 7 из 7
В большинстве случаев – да. Большая часть методик редактирования геномов оставляет за собой следы – вместе с целевым геном в геном вставляются определенные узнаваемые последовательности и маркеры. Такие следы довольно просто обнаружить при помощи молекулярно-биологических методов – например, при помощи ПЦР (полимеразной цепной реакции – операции, при которой возможно многократно копировать ДНК. Или только нужный ее фрагмент. Например, фрагмент, который мы надеемся обнаружить в геноме. Конечно, таким образом затруднительно найти любой чужеродный ген – нам нужно знать, что мы ищем, чтобы попробовать получить много копий этого, – но вполне возможно обнаружить гены и генетические маркеры, традиционно используемые при создании ГМ-организмов). Однако, если кто-то решит специально спрятать модификацию и не добавит никаких опознавательных последовательностей, то ответить однозначно, было проведено редактирование или нет, будет довольно сложно. Хотя кое-какие подсказки есть в руках именно у биоинформатиков.
Первая подсказка в том, что хотя мы и поговорили выше, как одна и та же аминокислота кодируется разными кодонами, встречаемость этих альтернативных кодонов в тексте одного гена и даже целого генома не равновероятна[30]. Вот аминокислота изолейцин может быть задана кодонами АУЦ, АУА или АУУ. Но возьмем, например, туберкулезную палочку (Mycobacterium tuberculosis). Ей нравится, чтобы кодоны в ее генах заканчивались на букву Г или Ц. Поэтому изолейцин в ее геноме записывается как АУЦ почти в 30 раз чаще, чем АУА, или в 5 раз чаще, чем АУУ[31].
Это явление получило название «предпочтение кодонов», и оно активно изучается эволюционными биологами уже много десятилетий. Какие-то организмы более строго придерживаются правил предпочтения кодонов, а какие-то менее. Для нас тут самое интересное в том, что относительно недавний перенос гена из одного организма в геном другого можно предположить, если в этом гене статистика употребления каких-то кодонов отличается от картины в других генах этого же организма. Сработает этот метод, конечно, лишь для некоторых пар организмов. Мы не сможем использовать его, если хотим, например, найти в геноме яблони сорта X следы переноса генов от яблони сорта Y. А вот найти в том же геноме яблони сорта X следы переноса генов из бактерии вида Agrobacterium tumefaciens вполне реально, так как бактерия предпочитает использовать свой набор кодонов[32].
Вторая подсказка для биоинформатиков также основана на статистике и во многом следует из факта существования принципа предпочтения кодонов. Представьте, что перед вами фото многолюдной улицы неизвестного вам города. Вы бы хотели понять, где именно сделано это фото. Оценив, какой оттенок кожи и разрез глаз вы видите на фото чаще, вы можете сделать первые выводы. Если добавить к признакам, какую одежду предпочитают люди с фото, можно скорректировать свои выводы. Добавим далее то, какая архитектура преимущественно попала на снимок, и вуаля – наш прогноз стал достаточно хорошим даже для снимка крупного портового города, каковые известны своей смесью национальностей, культур и архитектур. Примерно так же мы можем посмотреть и на геном. Сначала оценить, как часто в нем встречаются определенные буквы. Чаще всего измеряют долю букв Г и Ц (этот параметр получил название ГЦ-состав) или долю букв А и Т (АТ-состав) на геном или на определенный фрагмент генома. Уже по такому простому, казалось бы, параметру можно неплохо различать между собой различные организмы. Например, в человеческом геноме доля букв Г и Ц составляет в среднем 41 % (есть отдельные специфические регионы в геноме, которые содержат значительно больше или меньше, но среднее для большей его части такое)[33], а в геноме бабочки монарха (Danaus plexippus) ГЦ-контент равен 31,6 %[34].
Затем можно изучить различные двухбуквенные сочетания. Например, сколько раз в геноме (или определенном регионе генома) найдется сочетание АГ, или АТ, или ЦЦ. Потом вычислить частоту вхождения различных троек. Например, как много в геноме сочетаний ЦЦЦ, ГГГ или АГА. После перейти к четверкам и определить, скажем, процент вхождения сочетаний ААГГ и ЦЦГА. Затем к пятеркам… Таким образом мы сформируем индивидуальный портрет генома из признаков частоты вхождения в него различных подстрок. Такой же портрет мы можем получить для каждого отдельного региона в этом геноме. А потом наложить два портрета друг на друга и сделать выводы о том, вписывается ли рассматриваемый фрагмент в картину всего генома. Если ответ «да», вероятно, все в нем «родное». Если ответ «нет», можно предположить, что там есть ген, который был перенесен из генома организма другого вида.
К сожалению, даже этот и так не слишком-то однозначный метод имеет свои недостатки, осложняющие биоинформатический анализ. Во-первых, со временем ген как бы адаптируется к организму, в котором он оказался. То есть нетипичные кодоны в результате последовательных мутаций со временем становятся самыми типичными. Генетики говорят, что гены «одомашниваются» в процессе эволюции[35]. О том, почему это происходит, ученые тоже думают уже очень давно. Об этом мы поговорим немного далее в главе о мутациях. Во-вторых, чтобы искать чужеродный (перенесенный) ген в геноме, надо хотя бы примерно знать, что мы ищем и где именно – в каком месте генома. Иначе такая задача поиска будет достаточно вычислительно сложной, что связано с большой длиной эукариотических[36]
Конец ознакомительного фрагмента.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
30
Hershberg R., Petrov D.A. Selection on codon bias. A
31
Andersson S.G.E., Sharp P.M. Codon usage in the Mycobacterium tuberculosis complex. Microbiology (Reading). 1996 Apr;142 (Pt 4):915–925. doi: 10.1099/00221287–142–4–915. PMID: 8936318. https://www.microbiologyresearch.org/content/journal/micro/10.1099/00221287–142–4–915
32
Также агробактериальные вставки в таком случае можно найти и молекулярно-биологическими методами. – Прим. науч. редактора.
33
International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature 409, 860–921 (2001). https://doi.org/10.1038/35057062
34
Cong, Q., Shen, J., Li, W., Borek, D., Otwinowski, Z., & Grishin, N. V. (2017). The first complete genomes of Metalmarks and the classification of butterfly families. Genomics, 109(5–6), 485–493. doi:10.1016/j.ygeno.2017.07.006. https://www.sciencedirect.com/science/article/pii/S0888754317300642
35
Логика случая. О природе и происхождении биологической эволюции / Евгений Кунин со ссылкой на Ragan M.A. On surrogate methods for detecting lateral gene transfer. FEMS Microbiol Lett. 2001 Jul 24; 201(2):187–91. doi: 10.1111/j.1574–6968.2001.tb10755.x. PMID: 11470360. https://pubmed.ncbi.nlm.nih.gov/11470360/
36
Организмов, имеющих клеточное ядро. К ним относимся, например, мы с вами, кактус на окошке или плесневые грибы Penicillium camemberti, используемые для производства моего любимого сыра камамбера. И не относятся, например, бактерии – такие как любимая «рабочая лошадка» генетиков Escherichia coli.