Страница 9 из 25
Очевидно, в мозгу есть механизм, учитывающий информацию о повышении средних частот формант в связи с повышением основного тона голоса (высота голоса). Потому-то нам практически безразлично, на какой высоте основного тона голоса произносятся слова: произносит ли их мужской, женский или детский голос – разборчивость, понятность речи обеспечиваются.
Но перечисленные трудности – это лишь малая толика всех их, стоящих на пути обучения ЭВМ пониманию речи. Образно говоря, все виды речевой информации – лингвистической и экстралингвистической – как бы «растворены» в звуке голоса человека. Наш слух не испытывает затруднений в их разделении и учете, а машина «затрудняется». Поэтому можно надеяться, что изучение индивидуально-эмоциональных особенностей речи и механизмов, на которые опирается наш слух и мозг при их разделении, позволит наконец окончательно решить и проблему ее автоматического распознавания. Может быть, здесь пригодятся данные о том, что для восприятия и переработки логической и эмоциональной информации речи в мозгу человека имеются два специализированных и вместе с тем взаимодействующих отдела: левое полушарие мозга – для логики, правое – для эмоций. Кстати, в одной из работ под редакцией виднейшего американского специалиста по автоматическому распознаванию речи Уайна Ли описаны алгоритм и устройство распознавания речи, основанные на принципах работы правого полушария мозга (т. е. целостного, а не посегментного анализа, с учетом просодических и экстралингвистических характеристик речевого сигнала).
Взаимодействие человека с компьютером предполагает создание на базе ЭВМ говорящих роботов. Все, конечно, слышали по радио в научно-популярных передачах лишенный каких-либо эмоций голос робота. Безэмоциональность – характерное его свойство, которое и проявляется в голосе. А почему, собственно, робот и его голос должны быть безэмоциональными? Нельзя ли «оживить» его голос интонациями человеческой речи? Ведь эмоциональная окраска голоса делает его эстетически более приятным, психологически совместимым с восприятием человека, а кроме того, она отнюдь не бесполезный акустический аккомпанемент речи, а несет очень нужную информацию, например, о степени важности сообщения, грозящей опасности и т. п.
Вдохнуть эмоции в бездушный мозг робота – одна из задач кибернетической науки, связанная с выделением и формализацией инвариантных акустических признаков, ответственных за эмоциональную окраску звука.
Ясно, что «оживление» речи робота – одна из многих технических задач, решить которую нельзя без знания алфавита акустического языка эмоций. Но, чтобы заложить этот алфавит в электронный мозг робота, необходимо сначала выявить, потом формализовать признаки, ответственные за эмоциональность голоса.
Таким образом, решение проблемы полного взаимопонимания человека и ЭВМ требует эмоционализации компьютера. Необходимо, чтобы робот, так же как и человек, услышав, например, фразу «Я очень рад вас видеть!», произнесенную не нейтрально, а насмешливым голосом, мог бы не только четко воспринять слова (в чем он сейчас явно затрудняется), но и понять эмоциональную интонацию, отрицающую смысл слов. Робот должен понимать наш язык эмоций.
Трудно переоценить практическое значение такого рода автомата, например, для контроля психологического состояния космонавтов, летчиков-испытателей и многих других операторов, которые по характеру своей работы находятся в сложной экстремальной обстановке и от точности действий которых зависит успех дела. Уже есть попытки создания машины, реагирующей на эмоции в голосе человека. Одна из них на основе оценки темпо-ритмических характеристик речи принадлежит группе инженеров, работающих в содружестве с фонетистом Э. Л. Носенко, о чем они сообщили на симпозиуме «Речь, эмоции и личность». На аналогичное устройство, но на основе динамики основного тона получили авторское свидетельство ленинградские ученые (Галунов, Манёров, 1981). Под руководством П. В. Симонова и М. В. Фролова внедрено устройство для регистрации эмоций авиаторов и т. д.
Рис. 10. Проблема человека – проблема робота
Машину-автомат, безошибочно опознающую личность человека по его голосу, наверное, охотно возьмут на службу и криминалисты, ведь в ее беспристрастности и объективности трудно усомниться. Над теоретическими основами создания такой машины успешно трудится грузинский ученый Г. С. Рамишвили.
Заключение
В заключение отметим, что представленные в статье данные о восприятии человеком эмоциональной интонации голоса как одного из важнейших средств экстралингвистической коммуникации впервые получены нами с применением модели не только актерской, но и вокальной речи (пения). Комплекс этих исследований позволил выдвинуть представление об эмоциональном слухе как специфической системе обработки этого рода информации в мозгу человека, входящей в структуру экстралингвистической коммуникации и имеющей древнейшие основы. В ряде работ нами показано, что степень развитости эмоционального слуха может служить одним из объективных критериев принадлежности человека к художественному типу личности (по И. П. Павлову). Практической реализацией этих исследований явилось внедрение разработанных нами тестов и методик для профотбора лиц художественных профессий.
Представление о речевой коммуникации как о двухканальной системе является, несомненно, плодотворным в бионическом смысле, т. е. для создания новых, более совершенных систем автоматического анализа и синтеза речи с помощью ЭВМ. Можно с уверенностью сказать, что дальнейшие успехи в решении проблемы автоматического анализа и синтеза речи будут зависеть от того, насколько полно удастся техническими средствами смоделировать принцип парной работы полушарий головного мозга человека с учетом функциональной специализации каждого из них при восприятии и переработке (а также генерировании) разных видов речевой информации: собственно речевой (лингвистической) и экстралингвистической.
II. Вокальная речь как язык эмоций[3]
Экспериментальные исследования
1. Основные задачи
Акустический сигнал вокальной речи несет значительно больше эмоциональной информации по сравнению с обычной речью. Это обстоятельство предопределено самой природой вокальной речи и не требует особых доказательств. В этой связи вокальная речь представляется исключительно удобным объектом для изучения эмоционально-выразительных средств голоса человека.
Акустические средства выражения эмоций в обычной речи в последнее время начинают привлекать внимание исследователей во все большей и большей степени (Sedlaček, Sychra, 1962; Попов и др., 1966; Williams, Stevens, 1972; Бондарко и др., 1975; Галунов и др., 1975; Курашвили и др., 1975). В ноябре 1974 г. в Ленинграде состоялся 1-й Всесоюзный симпозиум «Речь и эмоции», привлекший многих специалистов разных профилей. Вместе с тем акустические средства выражения эмоций в пении не изучены, и нами сделаны лишь самые первые шаги в этом направлении (Котляр, Морозов, 1975а, 1975б, 1976; Морозов, 1976б).
Основными задачами главы являются: 1) разработка метода количественной оценки эмоциональной выразительности пения разных исполнителей; 2) количественная оценка способностей слушателей к восприятию эмоциональной выразительности вокальной речи; 3) анализ акустических признаков вокально-речевого сигнала, обусловливающих передачу слушателю эмоционального содержания пения.
Выделение любых акустических коррелят эмоциональной выразительности речевого сигнала встречает определенные методические трудности: сложность получения исходного материала, большая вариабельность акустических средств выражения эмоций, зависимость этих средств от лексического материала и т. п.
3
По тексту кн.: Морозов В. П. Биофизические основы вокальной речи. М.: Наука, 1977. С. 159–225 (с сокр.).