Страница 32 из 38
Глава 1.
Суть проблемы представления знаний
Проблема представления знаний является тем ключевым пунктом, через который проходят пути к достижению успеха, пожалуй, во всех направлениях исследований по искусственному интеллекту, начиная от проблем понимания естественного языка и кончая проблемами машинного восприятия зрительных образов и речи.
Очевидная первопричина сложности создания машинной модели реального мира кроется в бесконечном многообразии этого мира.
Действительно, представим себе, что такую модель необходимо создать для робота, предназначенного для выполнения неограниченного набора приказов человека и функционирующего в среде неограниченной вариативности. Если попытаться решить задачу "в лоб", путем представления модели мира в виде набора программ. каждая из которых соответствует последовательности возможных действий робота при выполнении одного из приказов, осуществляемых с учетом конкретных условий внешнего мира робота (состояния внешней среды), то возникают по крайней мере две непреодолимые трудности, обусловленные бесконечным многообразием реального мира. (Под условиями внешнего мира понимается не только мир, воссоздаваемый сенсорами робота, но и априорные знания о закономерностях реального мира).
Первая из них связана с необходимостью наличия в памяти ЭВМ неограниченного набора программ, каждая из которых рассчитана на выполнение приказа при определенном состоянии внешней среды.
Вторая трудность порождена необходимостью соотнести данный приказ оператора и состояние внешней среды робота с конкретной программой из этого неограниченного набора, ответственной за выполнение данного приказа в конкретной внешней ситуации, и выбрать эту программу из памяти за приемлемое весьма ограниченное время.
Иными словами, речь идет о машинном "понимании" за ограниченные отрезки времени языка приказов и "языка сенсоров", с помощью которых воспринимаются те особенности внешнего мира, которые важны для выполнения приказа. И если в отношении "понимания" языка приказов можно несколько уменьшить трудности за счет, например, использования приказов однозначного толкования, то в отношении понимания "языка" сенсоров это сделать невозможно.
Приведенные трудности объясняют нереальность создания модели реального мира таким путем. Несмотря на это, такой подход всё же несет одно ценное свойство. По крайней мере, на интуитивны уровне ясно, что каждую из программ, ответственную за выполнение данного приказа, можно построить так, чтобы учесть все необходимые для выполнения приказа особенности внешнего мира робота, причем реального внешнего мира со всем его многообразием и сложностью, что невозможно при использовании известных подходов из-за принципиальной ограниченности средств описания внешнего мира, характерных для этих подходов.
Конечно, ограниченность машинной памяти не позволит иметь большого количества таких программ, но в случае маловариативных сред и невысоких требований к диапазону функциональных возможностей робота реально получение приемлемых технических решений.
Очевидный путь, позволяющий, по-видимому, несколько уменьшить трудности создания машинной модели реального мира, лежит через кардинальное уменьшение числа входящих в модель программ при сохранении общего объема знаний о мире, содержащихся в этой модели.
Это можно было бы осуществить, если бы удалось определенным образом упорядочить, структурировать программы, образующие модель.
С этой целью, во-первых, полезно найти и выделить в разнообразных возможных действиях общие универсальные фрагменты, с помощью которых можно компоновать эти действия. Очевидно, из т таких универсальных фрагментов в пределе можно скомпоновать (1!+2!+3!+:+ m!) разнообразных действий. Если даже ограничить число используемых для описания действия фрагментов величиной m , т.е. имеет место колоссальный выигрыш в использовании памяти, тем больший, чем больше т.
Во-вторых, необходимо стремиться так построить программы, входящие в модель реального мира для робота, чтобы каждая из них была способна формировать широкий набор (в пределе бесконечный) разнообразных действий, варьируемых, например, в зависимости от характера информации, собираемой определенной группой сенсоров, или от модификации приказов.
Глава 2.
Характерные особенности фрейм-подхода к проблеме представления знаний
Одним из возможных новых путей организации машинной модели реального мира является подход, развиваемый М.Минским. В соответствии с этим подходом знания о мире - машинная модель реального мира - должны быть представлены в памяти ЭВМ в виде достаточно большой совокупности определенным образом структурированных данных, представляющих собой стереотипные ситуации. Эти структуры запомненных данных получили название "фреймы". В случае возникновения конкретной ситуации, например, необходимости совершить роботом, управляемым ЭВМ, определённое действие, воспринять с помощью сенсоров, связанных с ЭВМ, какой-то зрительный образ и т.д., из памяти ЭВМ должен быть выбран фрейм, соответствующий данному классу ситуаций и согласован с рассматриваемой конкретной ситуацией из этого класса путем изменения подробностей, т.е. путем конкретизации данных из набора, которые могут удовлетворить выбранный фрейм.
Так как фрейм можно представить себе в виде сети, состоящей из узлов и связей между ними, то каждый узел должен быть заполнен своим "заданием", представляющим собой те или иные характерные черты ситуации, которой он соответствует. В общем случае во фрейме можно выделить несколько уровней, иерархически связанных друг с другом. Узлы фрейма, принадлежащие к верхним уровням, представляют собой более общие вещи, которые всегда справедливы в отношении предполагаемой ситуации. Эти узлы уже заполнены своими заданиями. Например, узел самого верхнего уровня фрейма обычно заполнен названием ситуации, т. е. названием зрительного образа (это может быть, например, "куб"), названием действия (например, "уборка комнаты"). Узлы нижних уровней по большей части не заполнены своими заданиями. Такие незаполненные узлы называют терминалами. Они должны быть заполнены конкретными данными, представляющими собой их возможные задания в процессе приспособления фрейма к конкретной ситуации, из того класса ситуаций, который представляет данный фрейм. Каждый терминал может устанавливать условия, которым должны отвечать его задания. Простые условия устанавливаются "маркерами", которые могут потребовать, например, чтобы заданием терминала было какое-то лицо, какой-то предмет достаточной величины, какое-то элементарное действие или "указатель" на какой-то другой фрейм, представляющий собой другую, обычно более частную ситуацию и называемый субфреймом. Более сложные условия могут устанавливать связи между заданиями для нескольких терминалов.
Группа фреймов может объединяться в систему фреймов. Результаты характерных действий отражаются с помощью трансформаций между фреймами системы. Они используются, чтобы ускорить вычисления определенных видов при представлении типичных изменений одной и той же ситуации.
В случае зрительного образа различные фреймы системы описывают картину с различных точек наблюдения, а трансформация одного фрейма в другой отражают результаты перемещения из одного места в другое. Для фреймов певизуальных видов различия между фреймами системы могут отражать действия, причинно-следственные связи и изменения понятийной точки зрения. Различные фреймы системы используют одни и те же терминалы. Это важное обстоятельство, благодаря которому, в частности, экономится объем памяти ЭВМ, используемой для построения модели реального мира. Характерной чертой описываемого подхода является возможность использования различных видов прогнозов, ожиданий, предположений. В соответствии с этим терминалы фрейма, выбираемого для представления ситуации, обычно уже заполнены заданиями, которые наиболее вероятны в данной ситуации. Эти задания называются "заданиями отсутствия".