Страница 21 из 29

Сообщество разума

Минский Марвин

7.4. Решение задач

В принципе мы можем использовать метод генерации и тестирования, то есть метод проб и ошибок, для решения любых потенциально решаемых задач. Но на практике даже самому мощному компьютеру потребуется немало времени для перебора достаточного количества возможных решений. Элементарная сборка простого игрушечного дома из дюжины деревянных кубиков обернется анализом количества возможностей, превышающего то, какие ребенок мог бы перебрать за всю свою жизнь. Вот один из способов улучшить этой «слепой» поиск методом проб и ошибок.

Принцип прогресса: Всякий процесс исчерпывающего поиска может быть значительно упрощен, если мы каким-то образом сможем выявлять достижение «прогресса». Далее мы сможем проследить путь к решению, как человек может подняться на незнакомый холм в темноте, ощупывая землю перед собой, чтобы придерживаться верного направления.

Многие простые задачи возможно разрешить этим способом, но для трудных задач распознать «прогресс» может оказаться ничуть не легче, чем решить саму задачу. Не имея перед собой общей картины, наш «скалолаз» может навсегда застрять на каком-то промежуточном холме и никогда не добраться до искомой вершины. Надежного способа избежать этой опасности не существует.

Цели и подцели: Наилучший способ выявления методов решения трудных задач заключается в поиске метода, который позволит разделить задачу на несколько более простых, чтобы решать каждую из них по отдельности.

Многие исследования в области так называемого искусственного интеллекта связаны с поиском методов, которыми машины смогут разделять задачи на малые фрагменты, а затем, при необходимости, делить их на еще более мелкие фрагменты. В следующих нескольких разделах настоящей книги мы обсудим, как это можно сделать посредством постановки задач в качестве «целей».

Использование «знания»: Самый эффективный способ решить задачу – это знать заранее, как она решается. В таком случае поиск решения не потребуется.

Соответственно другое направление в изучении искусственного интеллекта нацелено на поиск способов передачи знаний машинам. Сама эта проблема состоит из нескольких частей: мы должны узнать, как получить необходимые знания, должны научиться корректно репрезентировать эти знания, должны наконец разработать процессы, которые позволят эффективно использовать полученные знания. Чтобы добиться этого, наши воспоминания должны предоставлять не обилие мелких подробностей, а, прежде всего, те взаимосвязи между ними, которые помогут нам добиться цели. Подобные исследования привели к созданию множества практически ориентированных «основанных на знаниях» систем решения задач. Некоторые из них нередко называют «экспертными системами», поскольку они основаны на подражании методам людей-экспертов.

Кроме того, эти исследования дали еще один любопытный результат. Зачастую, как выяснилось, куда проще запрограммировать машины на решение специализированных задач, которые кажутся трудными образованным людям (например, игре в шахматы или доказательству теоремы в логике и геометрии), чем заставить их делать то, что большинству людей видится простым – например, строить игрушечные домики из детских кубиков. Вот почему я уделяю так много внимания «простым» задачам на страницах этой книги.

7.5. Обучение и память

Распространенное убеждение гласит, будто мы учимся лишь тому, за что нас вознаграждают. Некоторые психологи утверждают, что человеческое обучение как таковое основано исключительно на «подкреплении» наградой: даже когда учимся без каких-либо внешних побуждений, мы действуем как бы в предвкушении вознаграждения, только в форме сигналов от внутреннего «я». Но нельзя опираться на довод, который изначально допускает то, что он призван доказывать; вдобавок при попытках использовать эту идею для объяснения того, как люди учатся решать трудные задачи, мы сталкиваемся с фатальной цикличностью. Вы должны уметь что-то делать, прежде чем получите награду за свои действия!

Эта цикличность не казалась серьезным препятствием в те времена, когда Иван Павлов столетие назад изучал условные рефлексы, поскольку в его экспериментах животным не приходилось демонстрировать новые виды поведения; от них требовалось лишь увязывать новые стимулы с прежним поведением. Спустя несколько десятилетий исследования Павлова были дополнены гарвардским психологом Б. Ф. Скиннером, который установил, что высшие животные действительно порой демонстрируют новые формы поведения – «операнты» в его терминологии. Эксперименты Скиннера подтвердили, что, когда за каким-либо оперантом следует вознаграждение, эта форма поведения, скорее всего, будет повторяться впоследствии. Скиннер также обнаружил, что подобное обучение куда действеннее, если животное не может догадаться, получит оно награду или нет. Под определениями «оперантное обусловливание» и «модификация поведения» открытия Скиннера оказали заметное влияние на психологию и образование, однако так и не объяснили, как возникают новые операнты. Кроме того, лишь отдельные эксперименты на животных способны пролить свет на принципы, по которым люди учатся составлять и выполнять свои сложные планы; проблема в том, что другие животные едва ли в состоянии научиться хоть чему-то. Сходство концепций награды / успеха и наказания / неудачи не дает внятного представления о том, как люди учатся порождать новые идеи, позволяющие решать трудные задачи, которые в противном случае могли бы быть решены только посредством продолжительного и малоэффективного процесса проб и ошибок.

Ответ должен лежать в изучении наилучших способов обучения. Чтобы обсудить данный вопрос, следует начать с употребления многих обычных слов, таких как «цель», «награда», «обучение», «мышление», «признание», «симпатия», «желание», «воображение» и «запоминание» (все они восходят к древним, смутно осознаваемым понятиям). Мы обнаруживаем, что большинство этих слов нужно заменить новыми описаниями и идеями. Тем не менее у них есть нечто общее: для решения любой трудной задачи надлежит использовать различные виды воспоминаний. В каждый момент времени мы должны следить за тем, что только что сделали, или нам придется повторять те же шаги снова и снова. Еще мы вынуждены придерживаться поставленных целей, иначе мы придем к тому, что начнем совершать бессмысленные поступки. Наконец, едва задача будет решена, нам понадобится запомнить, как это было сделано, чтобы использовать это знание впоследствии, когда снова возникнет подобная задача.

Бо́льшая часть настоящей книги посвящена памяти, то есть ментальной фиксации прошлого. Почему, когда и как осуществляется такая фиксация? Когда человеческий разум решает трудную задачу, он задействует миллионы агентов и процессов. Какие агенты оказываются достаточно мудрыми для того, чтобы догадаться о необходимых изменениях? Высокоуровневые агенты не могут знать об этом; они едва ли ведают о существовании процессов нижнего уровня. А низкоуровневые агенты тоже не знают, какие из их действий помогают нам добиваться наших целей на высоких уровнях; они едва ли подозревают о наличии целей более высокого уровня. Агентам, которые управляют ногами, все равно, идем ли мы домой или на работу; агенты же, делающие выбор между домом и работой, ничего не знают об управлении конкретными группами мышц. Где в разуме хранятся сведения о том, какие агенты заслуживают награды или наказания?

7.6. Фиксация и награда

Чтобы обучение состоялось, каждый шаг в игре должен приносить намного больше информации. Это достигается за счет разделения задачи на фрагменты. Измерителем успеха служит достижение цели. Если цель достигнута, подцели фиксируются; если нет, они стираются.