Страница 3 из 5
Хотя фильм «Груши» уже в течение 40 лет широко используется лингвистами для побуждения к речи, он обычно не применяется в клинических исследованиях. Мы выбрали фильм «Груши» в качестве стимула получения дискурса, чтобы интегрировать дискурсивные исследования патологической речи с анализом повествования в рамках общей лингвистики.
2.2. Рассказчики
Пациенты с афазией (40 человек, из них 17 женщин; возраст от 30 до 81 года, средний возраст 52,6 года; SD = 10,5) поступили в Центр патологии речи и нейрореабилитации (Москва), имея проблемы с речью после инсульта в левом полушарии, с диагнозом «хроническая афазия» (не менее 6 месяцев после инсульта), и были обследованы сертифицированным клиническим психологом по методу нейропсихологического обследования Лурии (Лурия, 1962; Akhutina, 2015). У каждого пациента из данной группы был диагностирован отдельный тип афазии. Корпус включает по 10 историй болезни на каждый тип афазии: эфферентная моторная афазия, динамическая афазия, акустико-амнестическая афазия и сенсорная афазия.
Рассказчики с повреждениями правого полушария (5 человек, из них 2 женщины; возраст от 41 до 56 лет, средний возраст 50 лет; SD = 12,3) были отобраны из числа пациентов стационаров реабилитационных центров г. Москвы. Все они перенесли инсульт не менее чем за 6 месяцев до исследования и не имели диагноза «афазия».
Рассказчики из группы неврологически здоровых людей (22 человека, из них 11 женщин; возраст от 25 до 84 лет, средний возраст 58 лет; SD = 13,9) не сообщили о каких-либо перенесенных неврологических заболеваниях или травмах головы.
Все участники исследования были правшами, носителями русского языка как родного, имели как минимум законченное среднее образование, нормальное или скорректированное зрение, нормальный слух. Информация обо всех рассказчиках содержится в таблице 1.
2.3. Процедура
Для создания корпуса Russian CliPS всех рассказчиков просили посмотреть фильм и подробно пересказать его человеку, который его никогда не видел (слушатель может присутствовать во время пересказа, либо экспериментатор сообщает испытуемому, что запись его пересказа будет прослушана позже).
Ни экспериментатор, ни слушатель не задают вопросов во время пересказа, но могут побуждать к продолжению рассказа с помощью таких реплик, как «И что случилось потом?» или «Вы хотите что-то добавить?». Пересказы записывались на аудионоситель. Видеозапись велась с согласия испытуемого (в контрольной группе было сделано 22 видеозаписи; в группе людей с афазией и с повреждениями правого полушария – 20).
Разметка корпуса осуществлена в программе ELAN (Wittenburg, Brugman, Russel, Klassma
3.1. Базовая часть
Основная часть содержит информацию, характерную для большинства речевых корпусов: расшифровку записи с указанием времени, леммы, анализ по частям речи и грамматическую информацию.
Квазифонетический слой (Transcript) скоординирован с аудио-/видеофайлами и содержит орфографическую транскрипцию записанной речи. Большинство слов в этом слое выступают в стандартном написании, однако в случае фонетической ошибки или специфического произношения транскрипция отражает эти отклонения от нормы. Например, русское слово сейчас в устной речи может выступать в своей полной форме либо в редуцированном варианте щас. При этом в письменной речи приемлем только полный вариант. В этом случае квазифонетическая транскрипция должна передать произношение, а не норму языка. Фонематические парафазии (ошибки), встречающиеся в речи людей с афазией, также отражаются в этом слое, например велосипел (правильно велосипед). Абсолютные (тишина) и заполненные (например, хм, ээ) паузы длиной более 70 мс также отмечены в транскрипте. Если какой-либо речевой отрывок неразборчив, используется пометка «Неразборчиво».
Квазифонетическая транскрипция позволяет отразить некоторые черты устной речи и фонематические парафазии, однако она затрудняет анализ лексического многообразия и лексической насыщенности. Слой лексической расшифровки (Transcript_lex) содержит ту же информацию, что квазифонетический слой, но со стандартным правописанием. Лексическая расшифровка используется при подсчете показателей лексического разнообразия (поскольку различные варианты произношения одной лексемы не считаются в этом слое различными словами), а также для целей исследования макроструктуры текста.
Слой лемм (Lemma) содержит все начальные формы слов, а слой англоязычных лемм (Lemma_eng) – перевод всех слов на английский язык. В сочетании с данными грамматического слоя это дает возможность использования данных корпуса Russian CliPS также нерусскоязычными исследователями.
Схемы маркировки частей речи и указания грамматических категорий даются по руководству Национального корпуса русского языка[3]. Каждая грамматическая категория указывается в отдельном слое программы ELAN (всего 13 слоев).
3.2. Деление на сегменты
3.2.1. ЭДЕ
В зависимости от подхода исследователи используют различные критерии при сегментации устных монологов. Они могут быть основаны на синтаксической структуре, семантике, просодии или на их сочетании. Деление происходит на «высказывания» (Marini et al., 2011), коммуникативные единицы (Armstrong et al., 2011), тематические единицы (Marini et al., 2005), вербализации (Glosser, Deser, 1990), элементарные дискурсивные единицы (ЭДЕ) (Carlson, Marcu, 2001; Kibrik, 1996; Ma
Спонтанная речь часто содержит множество прерываний, речевых ошибок, неполных и грамматически неверных предложений, пауз, фальстартов, повторов, что затрудняет сегментацию устного дискурса. Кроме того, в отношении речи испытуемых с афазией и с повреждениями правого полушария сложно применять синтаксические и просодические критерии, так как синтаксис и просодия у таких людей могут быть нарушены (Alexander, Hillis, 2008; Heilman, Leon, Rosenbek, 2004; Seddoh, 2004).
Мы используем грамматический, а не просодический (Кибрик, Подлесская, 2013) принцип деления повествования на ЭДЕ. ЭДЕ – это часть предложения со сказуемым или опущенным сказуемым (например, «мальчик на велосипеде к дереву»/the boy on the bike to the tree). Каждый финитный и нефинитный предикат (включая причастия и деепричастия) относится к отдельной ЭДЕ, кроме случаев повтора и поиска слов. Если синтаксической информации недостаточно для суждения о границах ЭДЕ, используются данные просодии.
3.2.2. Высказывания
Высказывание определяется как главное предложение вместе со всеми придаточными (Glosser, Deser, 1990). Соотношение между количеством высказываний и количеством главных и придаточных предложений может рассматриваться в клинической лингвистике как мера грамматической сложности (Andreetta et al., 2012).
3.2.3. Станзы
Разделение на сцены основано на семантическом критерии. Сцена (scene, или stanza) – это термин, используемый в основном при анализе повествования и обозначающий группу строк (ЭДЕ), объединенных общей темой (Gee, 1985).
3.3. Особые слои
Смех указывается в особом слое (Laughter) и соотносится со звуковой волной. Указание на смех позволяет анализировать его как маркер когнитивных затруднений, связанных с неспособностью найти нужное слово, как реакцию на события фильма, предъявляемого в качестве стимула, либо как маркер неудовлетворенности рассказчика качеством своего повествования в целом (Khudyakova, Bergelson, 2015).
3
http://www.ruscorpora.ru/en/corpora-morph.html.