Страница 42 из 46
Таким образом можно проводить расчет констант скоростей мутаций, используя большие серии гаплотипов. Но работа на этом не заканчивается, потому что серии гаплотипов могут быть искаженными, включать примеси из других серий, с другим общим предком, включать другие субклады, с другим распределением аллелей по частотам, и так далее. Поэтому получаемые значения констант скоростей мутаций необходимо калибровать по известным документальным генеалогиям, опять желательно по нескольким. Как это делается, мы увидим в следующем разделе.
Вопрос 69: Насколько константы скоростей мутаций, определенные в разных регионах мира, надежны для проведений расчетов в ДНК-генеалогии? Что такое «калибровка» констант скоростей мутаций?
Приведу некоторую аналогию – а насколько надежны расчетные скорости (на самом деле – константы скоростей) радиоактивного распада соответствующих веществ? Влияют ли на них регионы планеты, где проводятся измерения? Любой образованный человек ответит – конечно, нет, не влияют. Скорость распада радиоактивных материалов определяется исключительно «внутренними» свойствами вещества, а не внешними воздействиями. Это – фундаментальные показатели. Вот так же должен отвечать каждый образованный человек на соответствующий вопрос о константах скоростей мутаций в гаплотипах. Это – фундаментальные показатели. Никакие регионы, питание, физические упражнения, национальность, гражданство или партийная принадлежность на них не влияют. Естественно, речь здесь идет о нормальных условиях, а не, скажем, в условиях солнечного ядра, или при смертельных уровнях радиации.
Итак, мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где n – число мутаций в серии из N гаплотипов, k – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации[75]. На сотнях и тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов. Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы рассмотрим ниже.
Теперь вопрос – насколько надежны величины констант скоростей мутации в соответствующих маркерах Y-хромосомы? Они надежны настолько, насколько надежно их определяют, калибруют, проверяют исследователи. Когда это делают популяционные генетики – совершенно ненадежны, они это показали последними двадцатью годами их так называемых «исследований». Они до сих пор так и не знают, какие значения эти константы имеют. Они до сих пор, в академических статьях 2015 года, продолжают использовать «скорости Животовского»[76]. Причем «на полном серьезе» обсуждают, что на временах до 5 тысяч лет эти «скорости» сильно завышают датировки, и вот на временах 40–60 тысяч лет подходят в самый раз. Они так и не поняли, что 23-маркерные гаплотипы на временах 40–60 тысяч лет вообще не применимы, там больше половины столь «быстрых констант скоростей», что они вообще не работают, потому что мечутся как белка в колесе. Это все равно, что секундомером измерять астрономические явления продолжительностью в тысячи и миллионы лет. И попгенетики этого так еще и не поняли!
Иногда принцип датировки «разбега» мутаций в гаплотипах с течением времени называют «принципом молекулярных часов». Смысл в этом есть, но примитивный. Дело не в том, что часы, а в том, чтобы правильно ходили. Любая реакция в химических или биологических системах, описываемая константой скорости первого порядка, есть «обычные молекулярные часы», поскольку связана с хронологией процесса на молекулярном уровне. Динамика любого такого процесса связана с временем согласно формуле с = с0е-kt, где c0 – исходное состояние системы (например, начальное количество или концентрация изучаемого вещества; количество гаплотипов Y-хромосомы в изучаемой выборке, и т. д.), с – состояние системы в определенный момент времени t (где t – время прошедшее с начала реакции, t-to), или количество базовых, то есть исходных гаплотипов в изучаемой выборке в настоящее время, спустя время t, прошедшее со времени жизни общего предка изучаемой серии гаплотипов), k – константа скорости реакции (мутаций, в данном случае). Эту же формулу можно переписать в виде ln(co/c) = kt, и она становится выражением логарифмического метода анализа выборок гаплотипов в ДНК-генеалогии. Берем, скажем, сто или тысячу гаплотипов, или любое другое их число, делим на число базовых (то есть одинаковых, идентичных друг другу гаплотипов, суть предковых гаплотипов, которые не успели мутировать за время t, прошедшее со времени жизни общего предка), берем натуральный логарифм (ln), и получаем произведение kt, то есть константу скорости мутации, помноженную на число лет, прошедшее со времени жизни общего предка, или на число условных поколений, опять же прошедших после общего предка – в зависимости от того, выражали константу скорости в годах, или в поколениях.
Логарифмический метод будет обсуждаться в следующем разделе, а пока обратим внимание, что результаты расчетов в ДНК-генеалогии обычно получаются в виде произведения kt. Это относится и к логарифмическому методу (см. выше), и к так называемому линейному методу, в котором считают число мутаций в серии гаплотипов, происходящих от одного общего предка, и делят их на число гаплотипов и на константу скорости мутаций в гаплотипе.
Отсюда уже видно, что неважно, сколько лет положить на условное поколение – 20, 25, 30, 35 или любое другое число лет, поскольку константа скорости мутации тут же подстроится, они завязаны друг на друга, произведение-то одно. В ДНК-генеалогии, как отмечалось выше, берется 25 лет на условное поколение, и, соответственно, константы скорости мутации приобретают определенные значения, получаемые по калибровке (см. ниже). Например -
для 12-маркерных гаплотипов константа равна 0.02 мутаций на гаплотип на условное поколение,
для 25-маркерных 0.046 мутаций на гаплотип на условное поколение,
для 37-маркерных – 0.09,
для 67-маркерных – 0.12,
для 111-маркерных – 0.198 мутаций на гаплотип на условное поколение.
Если это пересчитать в расчете не на гаплотип, а на маркер, то получим соответствующие константы скорости 0.00167, 0.00184, 0.00243, 0.00179, 0.00178 мутаций на маркер на условное поколение. Уже видно, что константы скорости разные для разных гаплотипов, и различаются, например, для 37-маркерных и 12-маркерных гаплотипов в 1.46 раз, то есть на 46 %. А если сравнить с 6-маркерными гаплотипами (константа скорости мутации на гаплотип равна 0.0074, на маркер 0.00123), то диапазон различий в константах в зависимости от длины маркера расходится на уже на 1.98, или на 98 %. Вывод – никак нельзя принимать константы скорости мутации на маркер за постоянные величины, одинаковые для всех гаплотипов, как делают в своих расчетах популяционные генетики. 98 % ошибки в расчетах только за это допущение – цена такого неумного (или неквалифицированного, или некомпетентного) предположения. Иначе говоря, иметь часы – дело нехитрое, но надо, чтобы они были отрегулированы. Это означает, что к ним должны прилагаться корректные константы скоростей мутаций, а корректные величины получаются корректной калибровкой.
75
Klyosov, A.A. (2009) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186–216; Klyosov, A.A. (2012) Ancient history of the Arbins, bearers of haplogroup R1b, from Central Asia to Europe, 16,000 to 1500 years before present. Advances in Anthropology, 2, No. 2, 87-105.
76
Karmin, M….Järve, M….Tishkoff, S…. Pocheshkhova, E., Sabitov, Z., Yepiskoposyan, L…. Behar, D., Balanovska, E., Derenko, M., Malyarchuk, B., Hammer, M., Balanovsky, O., Tyler-Smith, C., Underhill, P.A., Willerslev, E., Kivisild, T. (2015) Genome Research, doi/10.1101/gr.186684.114.