Страница 8 из 48

Диалог с компьютером

Журавлев Александр

Ореол содержательности звучания, или ф о-н о с е м а н т и ч е с к и й ореол, есть у любого слова, только чаще всего мы его не замечаем. И тогда нужны специальные приборы, хитроумные приемы, чтобы тайное сделать явным.

Мы еще вернемся к этому неуловимому явлению и попытаемся увидеть невидимку. А пока подумаем о взаимосвязи всех аспектов значения слова. Дереву необходима почва, но и без воздуха оно жить не сможет. Оно дышит воздухом, пьет влагу, пропитавшую почву, и само способствует формированию атмосферы. Так же неразрывно связаны между собой разные аспекты значения: понятийное ядро формирует ореол признаков, но и само формируется под воздействием этого ореола, звукосодержательный ореол тоже формирует признаковую оценку слова, воздействует и на понятие, но и сам получает ответные импульсы.

Так что это только кажется, будто значение слова — простая штука: загляни в словарь — вот и вся недолга. Нет, словарь и человека-то не всегда выручает, а уж машине с ним никак не разобраться. И если мы хотим, чтобы компьютер понимал нас и сам говорил с нами на нашем языке, то нужно научить его именно этому, полноценному, живому человеческому языку.

Здесь могут мне возразить и, казалось бы, резонно. Могут сказать, что на первых порах нужно как раз очистить язык от всего сугубо человеческого и дать машине лишь выжимки, «сухой остаток» языка в виде его основы. А поскольку основа семантики — понятийное значение, то именно понятийными ядрами слов и нужно загружать машинный разум.

На это отвечу так: истребите в Сахаре последние следы влаги, откачайте над ней еще и воздух, а потом попробуйте вырастить на этой почве хотя бы одну былинку. Точно так же, если содрать с понятийного ядра его ореолы — значит лишить слово жизни. Наивно думать, что разные аспекты языкового значения могут существовать отдельно друг от друга, хоть в естественном языке, хоть в имитации его для машины. Для того и пишется эта книжка, чтобы показать, как неразрывно слиты, сплавлены, переплетены эти аспекты в едином живом слове. И не только в слове. В языке информативно, пропитано значением все — звучание речи, отдельные слова и их сочетания, способы соединения слов, устройство предложений, композиция текстов — все от мельчайших звуков до сложной архитектуры всего здания языка.

Конечно, можно и на полностью безжизненной почве пустыни укрепить искусственные цветы и деревья, придать им форму, цвет, фактуру живых растений. Такая задача выполнима и для имитации интеллекта, то есть при обучении компьютера человеческому языку придется имитировать не только понятийные ядра значений, но и их ореолы. А чтобы имитировать, нужно их знать, изучить до тонкостей и суметь «объяснить» компьютеру на его языке строгих чисел и точных мер. А как же иначе: другого языка компьютер не поймет. Так что хотим мы или не хотим, нравится нам или нет, а придется как-то измерять значения в числе, и не только более или менее определенную его часть — понятийное ядро, но и зыбкий мир ореолов.

Поставьте такую задачу перед филологами, и большинство из них в один голос скажут, что это невозможно. Но вот один из парадоксов науки. Казалось бы, если уж пытаться подходить со строгими мерками к языковому значению, то нужно начинать с понятийного ядра — его мы осознаем, можем худо-бедно истолковать, объяснить, ну и, наконец, в словарях оно зафиксировано. Да и заманчиво научить машину оперировать с понятиями — это основа нашего мышления и языка. Поэтому-то все лингвисты кибернетической ориентации, так сказать, «кибер-лингвисты» бьются именно с логико-понятийной основой значения. А она не поддается. Не удается экономно и точно ее описать, не удается обучить понятиям машину, хотя малый ребенок, не прожив еще и года, еще и на ноги не встав, уже спокойно осваивает языковые значения, в том числе и понятийный их аспект.

И вдруг оказывается, что те аспекты значения, те ускользающие от жестких определений ореолы, которые мы едва-едва осознаем, а то и совсем не замечаем, поддаются строгому и достаточно точному числовому измерению, и компьютер свободно оперирует ими, создавая поразительную имитацию понимания тончайших их оттенков и сложных переливов.

Такое кажется невероятным, непостижимым, но это так.

Читайте дальше и вы увидите, как это происходит.

Компьютер изучает основы семантики

Не так давно, в 1982 году, вышел из печати «Русский семантический словарь», составленный... компьютером. Авторы-то у словаря есть. Это даже целая группа под руководством члена-корреспондента АН СССР Ю. Караулова. Но они скорее авторы программы для ЭВМ. А составляла словарь и даже писала его все же машина. И добро бы это был обратный словарь, или частотный, или по длине слов, а то ведь семантический!

Немудрено, что вокруг словаря сразу разгорелись страсти. Одни считали, что это новое слово в семантике, первый шаг к постижению языкового значения компьютером, другие были шокированы и даже возмущены тем, что машине доверили такое тонкое и сложное дело, как обнаружение семантических сходств и различий между словами.

Многие посмеивались над компьютером — кто добродушно, кто злорадно — вот, мол, смотрите-ка, в одной группе оказались слова зерно и женщина. Ничего себе, семантическое сходство — в огороде бузина, а в Киеве дядька. Но других те же самые результаты восхищали: ай да компьютер — собрал в одну группу все злаковые, сюда же включил и овощи, да не все, а только с зернышками (огурец, помидор, тыква), про хлеб не забыл, глагол кормить тоже здесь оказался, и даже женщину вспомнил. А как же — она ведь кормилица! И снова споры, снова дискуссии.

Что ж, новое должно доказать свою жизнеспособность в борьбе мнений, должно пробить себе дорогу. А это было не просто новое, это было никогда раньше не виданное и не слыханное: компьютер делал первые шаги к постижению понятийного ядра значения. Пусть даже, как и положено на первых шагах, его вел за руку человек: компьютер, разумеется, значений слов не понимал, он сравнивал по разным словарям описания значений слов людьми — составителями словарей, а найдя сходство в описаниях, относил слова к одной группе, то есть считал слова сходными по значению.

Пока еще не все у компьютера получается гладко, не со всеми его решениями можно согласиться, но главное в том, что оказалось принципиально возможным обучить машину имитации понимания понятийного ядра — основы значения слова.

Скажем, в одну группу со словом бабочка компьютер отнес и слово хоккей. Что-либо общего в значениях этих слов трудно отыскать, не правда ли? Они оказались в одной группе на том основании, что в словарных описаниях и того и другого значений есть слово поле, а откуда машине знать, что хоккейное поле вовсе не тот лужок, над которым порхают мотыльки. Зато другие слова в соседи к бабочке компьютер подобрал с явным «пониманием» их значения: цветок, пыльца, пестик, крыло, птица и т. п.

Получается, что программа, по которой составлялся «Русский семантический словарь», является как бы автоматическим понятийным классификатором слов, распределяющим слова по группам в зависимости от сходств их понятийных ядер.

В целом машина неплохо освоила понятийную семантику почти десяти тысяч русских слов, распределив их по семантическим группам так, что непосвященному человеку и в голову не придет подозревать в этой явно интеллектуальной работе компьютер.

Вот, к примеру, такая группа: архитектура, архитектор, кремль, крепость, башня, пирамида, колокольня, дворец, здание, портал и т. п. Можно ли сомневаться в семантической общности этих слов? Конечно, нет. А ведь их подобрал компьютер, который действительно не понимает их значений. Просто трудно поверить, что машина не знает смысла слов, когда объединяет такую «театральную» лексику: спектакль, актер, балкон, кукла, отделение, премьера, самодеятельность, темп, афиша, кино, опера, постановка, программа, сцена, уборная, балет, кинотеатр, оркестр, представление, пьеса, театр, цирк.