Добавить в цитаты Настройки чтения

Страница 29 из 46

Из таблицы видно, что при последовательном переходе от серии из 26 гаплотипов до 2000 гаплотипов, и при увеличении числа мутаций в них в двести с лишним раз расчетное время до общего предка этих гаплотипов, в данном случае проживавшего на Русской равнине около пяти тысяч лет назад, получается практически одинаковым, в пределах погрешности расчетов. Это значит, что гаплотипы гаплогруппы R1a на пост-советском пространстве перемешаны достаточно хорошо, и все выборки вполне репрезентативны.

Конечно, могут быть и другие ситуации. Например, в горах в каждой долине состав гаплотипов (и гаплогрупп/субкладов) может заметно различаться, в отличие от того, что может наблюдаться на равнине, где гаплотипы более перемешаны за тысячелетия. Но в любом случае расчеты и выводы по гаплотипам относятся только к той конкретной выборке, которая рассматривалась, и только сопоставление разных выборок может показать, насколько система «перемешана», и решить вопрос об обобщении результатов расчетов и выводов на всю популяцию региона, или только ее конкретную часть. Но пока репрезентативность разных выборок наблюдается и в горах. Например, разные выборки осетин и карачаево-балкарцев дают воспроизводимые результаты для каждого из этих этносов. Перемешивание между ними обнаружено, но очень незначительное, практически не влияющее на результаты расчетов.

В большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они устойчивы к статистическим вариациям, если популяция достаточно перемешана и выборка произведена неупорядочено. Размер выборки увеличивает точность, и то только до определенных пределов. Это, повторяем, относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.

Вопрос 41: Что такое «деревья гаплотипов» в ДНК-генеалогии?

По ходу изложения мы будем показывать деревья гаплотипов, которые отражают ДНК-картину этносов, родов, племен. Это вовсе не значит, что гаплотипы определяют этнос. Но они его в определенной степени описывают, каждый этнос по-разному. Человеку непривычному эти деревья представляются некими абстрактными образованиями, но в них на самом деле заключен большой смысл и в их графическом виде дается большой объем информации. Для того чтобы сделать деревья в этой книге более понятными и осмысленными, приведем несколько вводных, «модельных» примеров.

Рис. 7. Дерево, состоящее из 68 гаплотипов гаплогруппы R1a в их 6-маркерном формате. Базовый гаплотип здесь 13 25 15 11 12 11 (в системе DYS 393, 390, 19, 391, 388, 392). Базовые гаплотипы образуют «гребенку» на дереве.

На рисунке выше приведено дерево реальной выборки из 68 гаплотипов гаплогруппы R1a. Гаплотипы простенькие, 6-маркерные, общий предок всех жил всего 625 лет назад, так что мутаций в гаплотипах набежало мало. Можно даже заранее посчитать, сколько. Это дерево гаплотипов потомков Джона, Лорда Британских островов, который жил в 14-м веке и умер в 1386 году. Его потомки – известный шотландский клан Мак-Доналдов (один из Мак-Доналдов был маршалом у Наполеона). Константа скорости мутации для 6-маркерных гаплотипов равна 0.0074 мутаций на гаплотип на условное поколение в 25 лет. Тогда за 625 лет (25 условных поколений) в каждом гаплотипе набежит 0.0074х25 = 0.185 мутаций, и на все 68 гаплотипов будет 0.185х68 = 13±4 мутаций. Погрешность рассчитывается по обычным правилам математической статистики.

Смотрим на дерево гаплотипов. Там – 15 мутаций, то есть в пределах погрешности. Можно посчитать самим, это все «вылезающие» из колеса спицы. А вылезают они в разных (и заранее непредсказуемых) местах, потому что мутации происходят неупорядоченно. 53 гаплотипа не мутированы, они образуют ровную гребенку, или «колесо» вокруг центральной части. Это – тот же самый гаплотип, что имел общий предок всех 68 человек, то есть Джон, Лорд Островов:

13 25 15 11 12 11

53 человека этот гаплотип полностью сохранили, потому что 625 лет – это относительно малое время, и 15 мутаций – это все отклонения от предкового гаплотипа, что за это время смогли произойти.

Показанные выше шесть чисел соответствуют шести участкам в Y-хромосоме ДНК, в которых повторяются выбранные исследователями короткие нуклеотидные последовательности. В первом участке – 13 повторов, во втором – 25 повторов, в третьем – 15 повторов и т. д. Мутация – это изменение числа повторов. Ошибся копирующий фермент при биологическом копировании Y-хромосомы, скопировал третий участок не 15 раз, как завещали предки, а 16 раз, получилось

13 25 16 11 12 11

Это – два идентичных гаплотипа, на дереве выше под номерами 054 и 060. С правой стороны – гаплотип 061, он имеет вид





14 25 15 11 12 11

У него мутация проскочила в первом участке, было 13 повторов, стало 14. То есть опять система копирования ошиблась в сторону завышения числа повторов. А вот в семерке идентичных гаплотипов под номерами 055–057, 062, 064, 066, 068 – мутация прошла во втором участке, на понижение (25 → 24) и получилось

13 24 15 11 12 11

Действительно, этот участок, или маркер, как их называют, один из самых подверженных мутациям. Теория подсказывает, что в первом участке на все гаплотипы произойдет только одна мутация, во втором – семь мутаций, в третьем – две мутации. Так и получилось на практике. То есть даже при такой малой статистике закономерности в целом выполняются. Более того, все остальные пять мутаций на дереве гаплотипов относятся к тому же (второму) быстрому маркеру. Гаплотипы под номерами 059, 063 и 065 имеют вид

13 26 15 11 12 11

то есть мутация прошла на единицу на повышение, 25 → 26. Последние две мутации, в гаплотипах под номерами 058 и 067, оказались двойными (25 → 23, 25 → 27):

13 23 15 11 12 11

13 27 15 11 12 11

Они и сидят по обе стороны «букета», потому что не происходят одна из другой. Заметьте, что длина «спицы» в двух последних случаях тоже двойная, по сравнению со всеми остальными. То есть по виду дерева гаплотипов можно сказать, какие мутации одиночные, какие – двойные или тройные.

Внешний вид «дерева» определяется настройками профессиональной компьютерной программы, которая строит его на основании вводимого списка гаплотипов. Она сортирует гаплотипы по ветвям, то есть по похожести гаплотипов, сортирует по тому, в каких маркерах произошли мутации, сколько мутаций произошло, и по тому, насколько ветви древние. Поэтому по виду дерева человек опытный сразу может понять, какова структура той или иной популяции, сколько в ней основных ветвей, каков относительный возраст ветвей, и далее по числу мутаций в ветвях рассчитать, когда жил общий предок каждой ветви. Таких компьютерных программ много, наиболее известная – PHYLIP, с преобразованием MEGA.

По виду базовых гаплотипов в разных регионах и по возрасту их ветвей можно устанавливать, откуда, куда и когда проходили древние миграции людей и где сейчас живут их потомки. То есть можно проводить ДНК-генеалогическое картирование регионов, материков, и всей планеты, как в пространстве, так и во времени. В этом – методология ДНК-генеалогии. А дальше идут интерпретации получаемых данных в терминах истории, языкознания, антропологии, стыковка их с известными данными (тогда это по сути «калибровка»), или с данными неустоявшимися, сомнительными, конфликтными – тогда это дополнительная «точка опоры», или, наконец, это введение в научный оборот совершенно новых данных, и открытие пути для их верификации, проверки, обсуждения, выдвижения новых гипотез и положений.