Страница 19 из 23
Применяемые в таких исследованиях средства регистрации движений глаз регистрируют массивные объемы данных (траектории движения взора испытуемых на плоскости стимула), которые необходимо обрабатывать статистически для проверки выдвинутых гипотез. Исследователям-психологам в рамках разведочного анализа данных зачастую приходится сталкиваться с высокой степенью неопределенности, связанной с поиском релевантных количественных и качественных признаков глазодвигательной активности, отражающих изменчивость исследуемых факторов, будь то категории испытуемых или выраженность индивидуальных непрерывных свойств.
Для облегчения поиска подобных закономерностей разработано множество средств математического анализа, реализованных в соответствующих статистических пакетах. Однако в силу возрастания сложности и повышения размерности данных особо актуально использование автоматизированных средств, позволяющих сокращать размерность набора анализируемых переменных. При этом часто возникает необходимость дополнять набор традиционных интегральных характеристик глазодвигательной активности (таких как время прочтения текста, средняя длительность фиксаций, число фиксаций, прогрессивных и регрессивных саккад и подобных) показателями, отражающими пространственно-временные особенности процесса зрительного поиска, которые могут содержать дополнительную информацию об объекте изучения, улавливая интересующие исследователя паттерны переходов взора между областями интереса.
Примером подобного средства может послужить представленный далее подход к анализу траекторий взора, основанный на расчете информативных показателей глазодвигательной активности и последовательном применении современных математических методов анализа данных, таких, как метод главных компонент или факторный анализ, деревья решений, дискриминантные модели, регрессионные модели.
Расчет показателей глазодвигательной активности. В качестве базовых показателей глазодвигательной активности могут выступать как традиционные универсальные показатели (число и средняя продолжительность фиксаций, число саккад в различных направлениях, амплитуда и кривизна саккад, общая длительность испытания и т. п.), рассчитываемые, как правило, по выявленным окуломоторным событиям с помощью средств проприетарного программного обеспечения, поставляемого вместе с оборудованием (Барабанщиков, Жегалло, 2013). Такие показатели удобны тем, что они не привязаны к контексту задачи или стимульному материалу и могут вычисляться для любого набора выявленных окуломоторных событий. Однако универсальность подобных показателей может рассматриваться и как недостаток в силу невозможности учесть при их расчете специфику стимульного материала и невозможности отразить с их помощью динамические свойства изучаемого процесса зрительного поиска.
Для отражения динамических характеристик глазодвигательной активности целесообразно использовать в качестве дополнительных информативных признаков элементы матриц вероятностей переходов либо матриц представления преемника (Successor Representation matrix, SR-matrix – Dayan, 1993), рассчитываемых по последовательностям фиксаций взора в областях интереса стимульного материала. Указанные матрицы позволяют выявлять выраженные интегральные закономерности переходов взора из одной области интереса к другой как первого порядка (матрица вероятностей переходов), так и с учетом предыстории (матрица представления преемника).
Основы рассматриваемого подхода к анализу данных видео-окулографии с использованием матриц представления преемника, названного «Successor Representation Scanpath Analysis (SRSA)», заложены Алексом Петровым и Тейлором Хэйесом, сотрудниками лаборатории когнитивного моделирования и вычислительной когнитивной нейронауки Университета штата Огайо, США. Пример применения подхода проиллюстрирован в статье, посвященной анализу последовательностей фиксаций при выполнении теста интеллекта Равена (Hayeset al., 2011). Полученные результаты демонстрируют несомненную эффективность подхода. Например, построенная (по выборке значений главных компонент элементов матриц представления преемника) регрессионная модель объясняла 56 % дисперсии итогового балла по тесту Равена. Детали алгоритма расчета матрицы представления преемника приведены ниже.
Обязательным условием для расчета матриц является наличие пространственных областей интереса, выделяемых на стимульном материале автоматически или при участии экспериментатора-психолога.
Автоматическое выделение в простейшем случае подразумевает разделение плоскости стимула на нумерованные прямоугольные ячейки заданного размера, которые и рассматриваются как области интереса (см. пример на рисунке 1). Такой способ выделения областей интереса универсален и наиболее адекватен при отсутствии по различным причинам исходных предположений о вероятных «аттракторах внимания» в стимульном материале.
Рис. 1. Участок текстового стимула, автоматически размеченный вертикальными областями интереса, используемыми для обработки последовательностей позиций фиксаций и последующего анализа динамики горизонтальных движений взора испытуемых
Ручное выделение областей интереса подразумевает указание на стимуле именованных плоских фигур требуемых размеров (прямоугольников, многогранников, эллипсов и пр.). Итоговое расположение областей в данном случае, разумеется, зависит от стимульного материала и гипотез исследования, поскольку требует обоснованных предположений о том, какие именно области стимула действительно привлекают зрительное внимание исследуемых категорий испытуемых.
Рис. 2. Участок стимула задачи теста Равена, размеченный вручную областями интереса, используемыми для обработки последовательностей позиций фиксаций и последующего анализа динамики движений взора испытуемых между элементами матрицы задания и областью альтернатив ответа
Формирование последовательностей посещенных областей интереса. По позиционным данным выделенных областей интереса и зарегистрированным траекториям взора на плоскости стимула или последовательностям точек фиксаций взора строятся последовательности номеров «посещенных» областей, в которых пребывал взор испытуемых. Обычно в таких последовательностях повторные смежные пребывания в одной и той же области интереса «склеиваются», т. е. рассматриваются как единое событие. Сформированные последовательности подвергаются дальнейшему анализу: по ним строятся матрицы частот или вероятностей переходов между областями интереса, либо матрица представления преемника, алгоритмы построения которых представлены в следующем подразделе.
Вычисление матриц частотности переходов. По полученным последовательностям далее вычисляются матрица вероятностей переходов и матрица представления преемника. Расчет элементов матрицы вероятностей переходов между зонами интереса несложен и выполняется следующим образом:
– инициализируется (заполняется нулями) квадратная матрица, чьи размерности соответствуют количеству областей интереса;
– по очереди перебираются элементы последовательности посещенных областей интереса (исключая последнюю) – фиксируется текущий элемент последовательности (номер посещенной зоны, обозначаемый как i) и последующий элемент (номер зоны, в которую совершен переход, обозначаемый как j), а сама матрица обновляется: элемент с индексом (i, j) увеличивается на единицу;
– формируется матрица оценок вероятностей переходов, состоящая из элементов полученной на предыдущем шаге матрицы абсолютных частот переходов, поделенных на сумму всех ее элементов.