Страница 39 из 46
Вопрос 67: В примере выше вы приводили значения констант скоростей мутаций и для отдельных маркеров, как DYS393 и DYS390, так и для всего гаплотипа, от 6- до 111-маркерного, и даже до 409-маркерного. Как же все-таки нужно считать, по отдельным маркерам или по целым гаплотипам?
Это – хороший вопрос, он часто служит предметом путаницы. Считать можно и по отдельным маркерам, и по целым гаплотипам, и это определяется целесообразностью в каждом конкретном случае, удобством, экономией времени.
Приведем пример – серию из 27 гаплотипов в 12-маркерном формате. Это – реальная серия гаплотипов из одного из проектов (киргизского) FTDNA.
13 24 16 10 11 14 12 12 10 13 11 18
13 24 16 11 11 14 12 12 10 13 11 18
13 24 16 11 11 14 12 12 10 14 11 17
13 24 16 11 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 18
13 25 16 10 11 14 12 12 10 14 11 19
13 25 16 10 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 13 11 18
13 25 16 11 11 14 12 12 10 14 11 17
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 18
13 25 16 11 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 14 11 19
13 25 16 11 11 14 12 12 10 15 11 17
13 25 17 11 11 14 12 12 10 14 11 18
13 26 16 11 11 11 12 12 10 14 11 17
Девять из них идентичны друг другу, это – базовые, или предковые гаплотипы. Они не успели мутировать за время, прошедшее от их общего предка. На все 27 гаплотипов приходится 27 мутаций (отмечены жирным шрифтом). Иначе говоря, за время, прошедшее от их общего предка, девять 12-маркерных гаплотипов полностью сохранились, 18 гаплотипов приобрели мутации. Популяционный генетик рассчитал бы «коэффициент разнообразия» гаплотипов, который никому и никогда не нужен, и на этом бы свою работу закончил соответствующей публикацией, а рецензент в журнале, тоже, естественно, попгенетик, статью бы без вопросов пропустил в печать. То, что это фактически мусор, ему бы и в голову не пришло, там «наука» такая. На самом деле эта серия гаплотипов позволяет расчитать, когда жил общий предок этих гаплотипов, и далее, прослеживая подобные гаплотипы по территориям, и каждый раз рассчитывая времена жизни общих предков, можно понять, в какую сторону направлялись древние миграции, и сопоставляя полученные данные с археологическими и лингвистическими показателями, можно получать более содержательные картины прошлого.
Рис. 11. Расчет времени до общего предка для 27 гаплотипов в 12-маркерном формате из Киргизского проекта FTDNA. Поскольку гаплотипы 12-маркерные, то же расстояние до общего предка (TMRCA), 1304±283 лет, повторено в колонке для 225-, 37-, 67- и 111-маркерных гаплотипов. Колонка для 6-маркерных гаплотипов показывает 1425±453 лет до общего предка, что является тем же самым в пределах погрешности расчетов. Остальными колонками следует пренебречь.
Так вот, рассчитать время жизни общего предка можно разными способами. Можно – используя все 12 индивидуальных констант (k) скоростей мутаций, и считать по каждому маркеру, раздельно. Их величины приведены выше, в ответах на вопрос 65. Тогда результатом расчета будет набор из 12 «времен жизни до общего предка», который следует усреднить Это – очень непродуктивный метод расчета, и так вручную никто не считает (тем более всего для 27 гаплотипов, с крайне бедной статистикой). Но это – основа для машинных (компьютерных) расчетов, особенно для сотен и тысяч гаплотипов, и итоговое усреднение проводится по всему полю данных. Именно так работает калькулятор Килина-Клёсова[66], в который заложены значения констант скоростей для 111 маркеров, и расчет проводится по массиву данных до 10 тысяч гаплотипов практически в любом формате. Время расчета даже для 10 тысяч 111-маркерных гаплотипов занимает всего несколько секунд. В данном случае у шести маркеров из 12 мутаций нет, так что для них формальное «время до общего предка» равно нулю, но оно усредняется с результатами по шести оставшимся маркерам, и суммарно оно оказывается равно 1304±283 лет до общего предка (без округлений). Скриншот калькулятора с экрана компьютера приведен на рис 11.
Мы видим и сами гаплотипы, которые вводятся в соответствующие ячейки в формате Excel – или вручную, или копируются целиком из соответствующего файла, и число мутаций по каждому маркеру (третья строка снизу на сером фоне), сумма которых равна в данном случае 27. В формате Excel сумму их не обязательно подсчитывать вручную, можно просто все высветить курсором и прочитать сумму на экране. Программа также показывает базовые (предковые) значения аллелей (шестая строка снизу на сером фоне), и много другой важной информации. Датировка времени жизни общего предка читается в колонке LM12, что означает «линейный метод (расчета) по 12-маркерным гаплотипам». В колонках для 25-, 37-, 67- и 111-маркерных гаплотипов появляется то же самое число лет, что и для 12-маркерных гаплотипов, и странно было бы ожидать другого. В других колонках числа не являются правильными, потому что для них просчитывается только часть маркеров (колонки для 17-маркерных и 22-маркерных гаплотипов, и обозначенные ККК, то есть квадратичный расчет для 111- и 22-маркерных гаплотипов). Для проверки работы калькулятора можно разделить число мутаций на число гаплотипов и на константу скорости мутации для 12-маркерных гаплотипов, 27/27/0.02 = 50 условных поколений без введения поправки на возвратные мутации, которая равна 1.0433. Эта поправка рассчитывается, как показано в ответе на вопрос 61. В данном случае средняя величина числа мутаций на маркер равна 27/27/12 = 0.0833, и формула для расчета поправки приобретает вид
где величина поправочного коэффициента (1+e0.0833)/2 равна 1.0433, и вместо 50 условных поколений получаем 52.165, что соответствует 1304 годам до общего предка, то есть в точности то, что выдал калькулятор. Погрешность при 27 мутациях рассчитывается путем обратной величины квадратного корня из 27, что есть 0.19245, возведением полученной величины в квадрат и прибавлением 0.01 (10 %-й погрешности для константы скорости мутации), получая 0.0470, и после извлечения квадратного корня получаем общую погрешность в ±21.69 %. Окончательно записываем, что датировка общего предка рассмотренной серии из 27 гаплотипов равна 1304±283, в точности то, что рассчитал калькулятор, только в данном случае он рассчитал за долю секунды.
Надо заметить, что калькулятор выдает такую точность, которая не только бессмысленна, но и неправильна, потому что расстояние до общего предка с точностью до одного года не бывает, и погрешность с точностью до одного года не определяется. Поэтому полученную величину следует округлить, например, так: 1300±280 лет до общего предка.
Еще один способ расчета называется логарифмическим[67], в котором мутации даже не считаются. Поскольку в серии из 27 гаплотипов 9 базовых, то получаем [ln(27/9)]/0.02 = 55 → 58 условных поколений, то есть 1450±500 лет до общего предка. Как видно, это в пределах погрешности расчетов совпадает с величиной, полученной и линейным способом, и с помощью калькулятора Килина-Клёсова. Для концептуальных выводов это вполне приемлемо. Концептуальными здесь называются выводы (или результаты), которые ставят задачей расчеты с точностью, которая позволяет сделать принципиальные выводы, например, исторического характера. Как известно, историки и археологи часто оперируют концептуальными положениями, например, что скифы играли роль на исторической арене примерно с 7-го века до начала нашей эры, сарматы – с начала нашей эры до примерно 4-го века нашей эры, кельты – примерно с 4-го века до н. э., хотя есть варианты. Иначе говоря, в этих случаях датируются не конкретные события, а концептуальные. ДНК-генеалогия часто очень полезна в таких случаях. Например, что общий предок этнических русских гаплогруппы R1a и общий предок индийцев высших каст гаплогруппы R1a жил практически в одно и то же время. В пределах погрешности измерений, это был – концептуально – один и тот же общий предок. Никто не ожидает там датировку с точностью до года или около того. Речь – о концепции, а не о точной формальной датировке.
66
Клёсов, А.А., Килин, В.В. (2015) Калькулятор Килина-Клёсова для расчета времен до общих предков (TMRCA): новое издание. Вестник Академии ДНК-генеалогии, т. 8, № 3, стр. 321–375.
67
Klyosov, A.A. (2009) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186–216.