Страница 4 из 23
Коротко смысл нашей концепции сводится к следующему. Со словом связано размытое поле смысловых значений. Можно говорить о том, что в сознании человека с некоторым словом μ связана априорная функция распределения р (μ) смыслового содержания слова. Это значит, что отдельные участки смыслового поля ассоциируются в нашем сознании со словом с некоторой заранее заданной вероятностью. В процессе чтения какой-то конкретной фразы у слова, составляющие эту фразу, сужают смысл слова μ и у нас в сознании возникает условная функция распределения р (у/μ), раскрывающая содержание фразы у при условии, что мы обращаем внимание на смысл слова μ. Окончательно наше восприятие смысла слова μ создается из смешивания ранее существовавшего знания о смысле слова с вновь полученным. Пользуясь теоремой Бейеса, мы можем написать:
Здесь р (μ/у) – апостериорная функция распределения, раскрывающая смысл слова μ при чтении фразы у; k – константа, находимая из условия нормировки.
Развивая эту концепцию, мы должны признать, что логические конструкции строятся над смысловым дискретом – знаком, являющимся инвариантом всего смыслового содержания размытого поля значений. Осмысление логических конструкций – их декодирование – происходит на континуальном уровне: из континуального сознания берется априорное представление о распределении смыслового содержания слова и к континуальному сознанию оказывается обращенной апостериорная функция распределения суженного – селективно ориентированного – смыслового содержания слова после осмысления его в тексте фразы. Слова можно объяснять только через слова. Некоторое представление о размытости слов дают словари – толковые и двуязычные. Ниже на рис. 1 даны функции распределения11, показывающие, как распределены заглавные слова по числу объясняющих их слов в трех словарях:
1. Англо-русский словарь (20 000 слов). Под ред. О.С. Ахмановой. М.: Сов. энцикл., 1970.
2. Большой англо-русский словарь в 2-х т. (150 000 слов). Под ред. И.Р. Гальперина. М.: Сов. энцикл., 1972.
3. Webster’s New World Dictionary of the American Language (ed. D.B. Guralnik). Cleveland, N.Y.: The World Publ. Co. (over 1000000 entries, 896 pp., over 600 illustrations).
Мы видим, что в двуязычных словарях имеется острый максимум, лежащий где-то между 5 и 10 разъясняющими словами.
Основная масса слов – кодов одного языка – хотя и неоднозначно, но не очень многословно разъясняется через такие же знаки другого языка. В толковом словаре, где делается попытка расширенного толкования слова в словах того же языка, максимум оказывается уже значительно более размытым и смещенным вправо примерно слов на десять. Интересны хвостовые части кривых. У малого двуязычного словаря максимальное число поясняющих слов 87, у большого двуязычного словаря – 1362, у толкового словаря – 471. Сравнение двуязычных словарей показывает, что переход от малого к большому словарю включает в себя два процесса:
Первый – это обогащение легко объясняющимися словами-именами. В большом словаре появляются, скажем, такие слова-имена, как:
feather-mail – одежда из перьев (у мексиканских индейцев),
feather-man – торговец пером,
feather meal – мука из перьев (корм).
Рис. 1. Распределение входных слов словарей по числу объясняющих слов:
● – большой 2-томный англо-русский словарь, ∆ – малый англо-русский словарь, □ – словарь Вебстера
Этих слов нет в малом словаре.
Второй – это расширение толкования слов, включенных в малый словарь. Вот один из примеров – set, одно из самых страшных слов английского языка; в малом словаре оно разъясняется 96 словами, в большом – уже 1816 словами.
Интересно, что при переходе от малого словаря к большому число заглавных слов увеличивается в 7,5 раза, а число печатных листов – в 13,4 раза. Первый из упомянутых выше процессов приводит к тому, что и у большого словаря сохраняется острый пик, второй – к образованию длинного хвоста. Мы видим, что углубленное проникновение в язык сопровождается, с одной стороны, обогащением словами типа имен собственных, с другой стороны – расширением смыслового толкования сложно осмысливаемых слов12.
И все же любой сколь угодно большой словарь не охватывает всего потенциально возможного многообразия смыслового содержания слов. Иллюстрируем это здесь тремя примерами.
Первый пример. Представьте себе, что русскому человеку, от рождения хорошо владеющему родным языком, но давно живущему где-то на чужбине, показывают карикатуру, на которой изображен забулдыжного вида человек, стоящий у прилавка москательной лавки и грустно смотрящий на объявление: «Политура продается после одиннадцати». Смысл этой карикатуры мы понимаем мгновенно. Но оторвавшийся от своей среды русский человек понять ее не сможет. И никакие словари ему не помогут. Точно так же мы, изучающие заочно английский язык, не понимаем и половины карикатур, печатающихся, скажем, в таком журнале, как The New Yorker. Оказывается, что в поле смыслового содержания слов входит весь наш жизненный опыт. И этот опыт нельзя освоить иначе, как пережив его.
Второй пример. В вагоне поезда молодой человек, возвращающийся из поездки в Сибирь, рассказывает о том, как хорошо он провел время, как многому порадовался. Одна из его фраз прозвучала так: «Там я хорошо прошелся по пельменям». И, наверное, все немедленно поняли смысл этой предельно сжатой фразы. В моем сознании она интерпретируется примерно так: «Молодой человек много ходил по гостям, и его везде неизменно угощали пельменями, разными, хорошими, вкусными, что произвело впечатление и запомнилось». Возможность такой интерпретации создается не только и не столько самой этой фразой, сколько тем полем, которое сформировано его предыдущими высказываниями о Сибири. Интересно, как эту фразу могла бы осмыслить ЭВМ? Совсем глупая машина, наверное, восприняла бы ее в ее буквальном смысле – человек зачем-то ходил по пельменям, где-то кем-то рассыпанным. Умная машина, используя механизм ассоциативных связей слова «пройтись», возможно, смогла бы осмыслить эту фразу как сообщение о том, что молодой человек пошел и купил (или «достал» где-то) пельмени. Вряд ли можно представить себе ЭВМ, которая была бы запрограммирована так, чтобы могла извлечь из этой фразы ее человеческую интерпретацию. В сознании человека смысл слова «прошелся» настолько широк, что поле предварительных высказываний позволяет выявить тот смысл, который мы ему приписали.
Третий пример. Однажды, идя по улице, я случайно услышал обрывок разговора. Одна девушка говорила другой: «Вчера он пришел и опять начал мне пудрить мозги». Раньше я не слышал этого словосочетания, но сразу же понял его смысл. «Пудрить мозги» – значит постараться изменить течение мыслей и систему представлений другого человека, делая нечто похожее на то, что делает женщина, когда она, пудрясь, старается скрыть что-то на своем лице, как-то изменить, смягчить или приукрасить его выражение… Априорная функция распределения смыслового содержания слова «пудрить», несмотря на всю его кажущуюся простоту, имеет богатое наполнение, раскрывающееся только в сочетании с другими словами. Словари, даже самые подробные, в состоянии охватить только такие словосочетания, которые стали стандартными – превратились в языковые клише. При переводе текста с иностранного языка мы постоянно сталкиваемся с необходимостью решать ребусы. Даже самые большие словари не дают нам того знания априорной функции распределения смыслового содержания слова, которое необходимо для понимания всех возможных словосочетаний данного языка13.
11
Функции распределения составлены по случайным выборкам, каждая объемом 1000 слов. Подсчеты производила Г.А. Батулова.
12
Уже после того, как эта работа была закончена, мы познакомились со статьей С.Л. Вишняковой [1976], также посвященной статистическому анализу многозначности слов в английском языке. В ее статье исследовался тезаурус Роже.
13
Школа И.А. Мельчука пытается максимально использовать возможности дискретных аспектов языка. Это, конечно, очень ценно, но нас интересует то, что выходит за эти рамки.