Страница 20 из 25
Наши исследования интегральных спектров голосов разных исполнителей выявили специфичность частотных максимумов основных формантных областей голоса басов, баритонов, теноров, а также женских голосов (Морозов, 1977а, гл. 1). На этом основании путем избирательной коррекции частотной характеристики тракта можно, например, произвольно изменять звучание мужского голоса, придавая ему более теноровый или, наоборот, более басовый тембр, сглаживать недостатки и т. п.
3.3. К проблеме «певец и акустика зала»
Исследования по влиянию различного рода искажений обратной акустической связи на голос певца (Морозов, 1977а, гл. 8) имеют практическое значение в связи с проблемой взаимодействия певца с акустикой зала. Известно, что певец по-разному воспринимает тембр, силу и временные характеристики собственного голоса, в зависимости от акустических свойств помещения, в котором он поет (реверберация и т. п.). Это неизбежно сказывается на его голосе как результат описанных нами эффектов (эффект Ломбарда, эффект ЗОАС, эффект Томатиса). Многие певцы испытывают затруднения при пении в концертных залах с «плохой акустикой», а в той или иной степени к этому фактору чувствительны все. Особую важность этот вопрос приобретает в связи с распространением массовых средств электроакустического усиления голоса певца на сцене и – часто низким качеством усилительных систем, транслирующих звук в зрительный зал с искажениями.
На основе разработанных нами методов представляется возможным решение ряда важных задач: 1) определение степени устойчивости того или иного певца к различного рода искажениям обратной акустической связи с целью их профориентации; 2) осуществление тренировки певцов к различным акустическим условиям путем имитации этих условий при помощи изменений обратной электро-акустической связи; 3) выяснение оптимальных характеристик обратной акустической связи для певцов с целью обеспечения этих характеристик в новых строящихся концертных залах и театрах, а в особенности – с электроакустическими системами их озвучивания.
3.4. Исследования вокальной речи и проблема автоматического распознавания речи. Распознавание эмоционального состояния человека, а также личности по голосу
В качестве актуальных задач научно-технический прогресс выдвинул ряд проблем «общения» человека и машины (Ломов, 1966), и в частности – проблему устного ввода команд. Однако, несмотря на огромные усилия, которые затрачиваются учеными многих стран, проблема, например, автоматического распознавания речи до настоящего времени не решена удовлетворительно. По крайней мере, не создан автомат, способный распознавать (воспринимать и правильно фиксировать) человеческую звуковую речь во всем ее многообразии (включая видоизменения в связи с индивидуальными, половыми, возрастными особенностями дикторов, эмоциональным состоянием говорящего, наличием шумов, искажений и т. п.) с такой легкостью и надежностью, как это производит слуховой анализатор человека.
Вокальная речь мастеров, как нами показано, имеет достаточно высокую степень разборчивости, несмотря на весьма значительные отличия в акустическом строении от обычной речи, и в особенности по спектральным и временным характеристикам. Как нам представляется, это уже дает основание для того, чтобы пересмотреть значение этих характеристик для автоматического распознавания речи, по крайней мере, в той части, которая касается выделения инвариантов этих характеристик для разработки системы автоматического распознавания.
В последнее время самостоятельное прикладное значение начинает приобретать проблема автоматического распознавания эмоционального состояния человека по звуку его голоса. Как показало обсуждение этого вопроса на первом симпозиуме «Речь и эмоции» (Ленинград, 1974 г.), проблема эта имеет много прикладных аспектов и не меньшее число трудностей на пути своего удовлетворительного решения.
Мы позволяем себе надеяться, что наши исследования по выделению инвариантных характеристик эмоций в пении (Морозов, 1977а, гл. 10) могут способствовать решению этой проблемы. Эта надежда основана на нашем убеждении, что акустические средства выражения эмоций в речи и пении в основе своей едины, подобно тому как един фонетический код для речи и пения, несмотря на всю специфичность вокальной речи по сравнению с обычной разговорной речью.
III. Проблемы дикции вокальной речи в свете экспериментальных исследований[10]
Многие певцы, к сожалению, пренебрегают хорошей дикцией; слушатели часто не понимают языка, на котором поют певцы на сцене, и довольствуются лишь тем, что знают в общих чертах содержание представления.
Эмоционально-эстетическое воздействие вокальной речи на слушателя обуславливается не только ее невербальными средствами (интонационно-тембровыми особенностями голоса певца, музыкой, зрительным восприятием поющего и др.), но и смысловым (вербальным) содержанием произведения (песни, романса, оперы), созданного композитором, как правило, на слова поэта.
В этой связи важной составной частью языка эмоций в пении является дикция, т. е. особенности произношения певцом вокальной речи, обуславливающие ее разборчивость и, следовательно, доступность для понимания и сопереживания слушателями.
В данной работе нами впервые был применен метод оценки (измерения) разборчивости вокальной речи с помощью слоговых артикуляционных таблиц ГОСТ 7153-61 (Морозов, 1961, 1963а, 1963б, 1964г), применяемый инженерами-акустиками для оценки качества телефонной связи (Покровский, 1962).
Проблема дикции
Известно, что вокальная речь многих певцов отличается весьма неудовлетворительной разборчивостью. Характерны в этом отношении высказывания известного оперного певца Э. Карузо (см. эпиграф). Низкая разборчивость вокальной речи породила, по-видимому, обычай печатать в программе спектакля краткое содержание оперы.
В вокальном искусстве и искусстве сценической речи разборчивость обычно обозначается термином дикция (Станиславский, 1955). Вместе с тем термин дикция включает в себя более широкое понятие, чем термин разборчивость, так как связан и с художественно-эстетическими особенностями произношения.
Для улучшения разборчивости обычно даются советы в различных руководствах по пению (Садовников, 1958; Виноградов, 1967), однако советы эти касаются лишь отдельных, частных сторон произношения и не вскрывают общих закономерностей этого явления. Недостаток этот вызван, главным образом, отсутствием точных количественных методов исследования разборчивости вокальной речи: последняя обычно оценивается лишь приблизительно, в качественных терминах (хорошая, плохая).
Начиная с 1960 г. мы предприняли ряд исследований (Морозов, 1961, 1963 а, 1963б, 1964г, 1969, 1970а, 1970б) с целью изучения причин плохой разборчивости речи в пении. В этих исследованиях нами был разработан и применен метод количественного измерения разборчивости вокальной речи.
Метод измерения разборчивости вокальной речи
За основу этого метода нами был взят метод слоговой разборчивости (или слоговой артикуляции), обычно применяемый инженерами связи для оценки качества речи, передаваемой по линиям радиосвязи (Покровский, 1962). Как известно, сущность данного метода состоит в том, что диктор читает артикуляционные таблицы, а группа слушателей (артикуляционная бригада) слушает и записывает то, что слышит. Число правильно записанных слушателями слов (или слогов), выраженное в процентах по отношению ко всем словам, прочитанным диктором, и составляет количественную меру разборчивости речи данного диктора в данных условиях передачи[11]. В теории и практике разборчивости речи находят применение методы фразовой, словесной, слоговой и звуковой артикуляции, между которыми существуют определенные количественные соотношения (Покровский, 1962), позволяющие расчетным путем определить фразовую разборчивость на основании разборчивости другого вида.
10
По материалам ст.: Морозов В. П. Разборчивость вокальной речи как функция высоты основного тона голоса // Акустический журнал. 1964. Т. 10. Вып. 3. С. 376–380. Англ. перевод: Morozov V. P. Intelligibility In Singing as a Function of Fundamental Voice Pitch // Soviet Phisics-Acoustics. 1966. № 10/3. Р. 395–410.
11
Как правило, таким методом оценивается не качество речи диктора, а качество тракта связи, при этом предполагается, что речь диктора обладает нормальной разборчивостью, а слушатели – нормальным слухом. В известной мере это предположение оправдывается соответствующим подбором и тренировкой диктора и слушателей.