Добавить в цитаты Настройки чтения

Страница 9 из 17



Вопросы для самопроверки:

– Если  намного меньше , то откуда уверенность в том, что молекулярные часы не работают в эволюции, описанной деревом на рисунке 5.15?

Рисунок 5.16. Дерево с соседями  и .

Таким образом, выбор ближайших таксонов для присоединения ввел заблуждение; нужен более сложный критерий выбора таксонов для присоединения. Чтобы изобрести его, представьте себе дерево, в котором таксоны  и  являются соседями, соединенными в вершине , а  каким-то образом соединена с оставшимися таксонами , как показано на рисунке 5.16.

Если данные точно соответствуют этому метрическому дереву, то для каждого , дерево будет включать поддерево, подобное изображенному на рисунке 5.17.

Рисунок 5.17. Поддерево дерева на рисунке 5.16.

Но на этом рисунке видим, что , так как в сумму слева входят только длины четырех ребер, отходящих от листьев дерева, а в сумму справа – все они и, кроме того, удвоенная длина центрального ребра. Это неравенство называется 4-точечным условием для соседей. Если  и  являются соседями, то неравенство верно для любых значений  из диапазона от 3 до .

Условие 4-точек лежит в основе метода присоединения соседей, но предстоит еще много работы, чтобы перевести его в простую для применения форму. Для фиксированного  существует  возможных значения  удовлетворяющих условию  при . Если просуммировать 4-точечные неравенства по этим , то получим следующее неравенство, содержащее сумму расстояний .

Чтобы упростить это неравенство, определим общее расстояние от таксона  до всех других таксонов как , где расстояние  в сумме интерпретируется как 0, естественным образом. Затем, добавление  к каждой стороне исходного неравенства позволяет записать его в более простой форме следующим незамысловатым образом .



Вычитание  из частей неравенство придает ему ещё более симметричную форму .

Наконец, если рассмотреть эту последовательность действий для произвольных  и , а не только для  и , то можно ввести обозначение .

Тогда, если  и  являются соседями, то имеет место  для всех .

Это дает критерий, используемый в методе присоединения соседей: из данных расстояний , заполоняется новая таблица значений . Затем для соединения выбирается пара таксонов с наименьшим значением . Приведенный выше вывод формулы для вычисления  показывает, что если  и  являются соседями, то соответствующее им значение  будет наименьшим из значений в -й строке, -м столбце таблицы. Более глубокий анализ, который провели Штудер и Кеплер в 1988 году, показывает, что если данные идеально подходят к дереву, то наименьшая запись во всей таблице значений  будет указывать на пару таксонов, которые являются соседями.

Поскольку полный алгоритм присоединения соседей довольно сложен, приведём лишь краткое описание этого метода:

Шаг 1: Учитывая данные о расстоянии для  таксонов, вычислите новую таблицу значений . Выберите наименьшее значение, чтобы определить, к каким таксонам присоединиться. Это значение как правило оказывается отрицательным; в этом случае «наименьшее» означает отрицательное число с наибольшим значением по абсолютной величине.

Шаг 2: Если  и  должны быть соединены на новой вершине , временно сверните все остальные таксоны в одну группу  и определите длины рёбер от  и  до , используя 3-точечные формулы из предыдущего раздела для ,   и , как в FM-алгоритме.