Страница 4 из 20

Дрессировка без наказания. Пять недель, которые сделают вашу собаку лучшей в мире

Сильвия-Стасиевич Дон

У меня был еще один клиент по имени Нэт: его песочный лабрадор-ретривер Зак часто гостил у меня. У них была такая тесная связь, что Зак уже знал, когда Нэт приедет, чтобы забрать его. Зак в такие моменты начинал вышагивать и крутиться возле холла, а иногда даже брал свой рюкзак и относил его к двери. И всегда, как по часам, примерно пять минут спустя раздавался звонок в дверь, и на пороге стоял Нэт. Тогда я начала проверять Зака, желая убедиться в том, можно ли его сбить с толку. Я выставляла его рюкзак раньше обычного, словно уже знала, что настало время возвращаться домой. Но Зак никогда не велся на мои уловки. Я, бывало, просила Нэта менять свое время прихода вечером, но и это тоже не срабатывало. Зак всегда знал. Не понимаю, как ему это удавалось, но точно знаю, что иметь возможность наслаждаться подобными крепкими отношениями собаки и человека это ни с чем несравнимый, бесценный опыт.

Идея о том, что собаки могут – и должны – быть обучаемы с помощью методики положительного подкрепления, а не аверсивного наказания, была впервые формально разработана Яном Данбаром, ветеринаром с докторской степенью, изучающим поведение животных. Как он объясняет, наказание не обязательно должно быть неприятным, пугающим или болезненным. И если в нем нет нужды, тогда и не следует к нему прибегать. Для собак лишение их лакомства уже является достаточным наказанием, и, на самом деле, оно гораздо эффективнее, чем физическое воздействие.

Позвольте мне рассказать реальную историю, демонстрирующую то, как собаки обучаются, когда используют методику положительного подкрепления. Однажды у меня был клиент по имени Питер, который пришел ко мне на занятия в «Клуб мальчиков и девочек» в Джорджтауне, расстроенный из-за того, что его австралийская овчарка Уоллаби прыгает, не переставая. И сколько бы Питер ни выговаривал Уоллаби, ничего не помогало: собака просто любила прыгать. Так как Питера приучили использовать методику аверсивного наказания, он пытался остановить Уоллаби, ударяя его коленом в грудь, когда тот прыгал.

Но это не помогало. Уоллаби продолжал прыгать. Он не понимал, что это плохо: в конце концов, это собака, а некоторые собаки вполне естественно любят прыгать. Уоллаби воспринимал эти удары коленом как случайные проявления агрессии со стороны Питера.

Вместо того чтобы стимулировать Питера наказывать Уоллаби за плохое поведение, я хотела помочь ему научиться поощрять Уоллаби за хорошее поведение. Я начала работать с ними, следуя правилам метода положительного подкрепления, который, как оказалось, эффективно отучал собак прыгать. Сначала я попросила Питера приветствовать Уоллаби, только когда он сидит. Если Уоллаби прыгал, Питер должен был игнорировать его. Питер ничего не говорил, отворачивался и не обращал на Уоллаби никакого внимания. Но когда Уоллаби садился, он замечал, что происходит что-то удивительное. Он получал лакомство. И не просто лакомство, а его любимое – очень прочную резиновую игрушку с полым центром, который можно набить любыми видами лакомства. Когда Уоллаби прыгал, лакомства не было (так же как и не было толчков коленом в грудь). Спустя какое-то время Уоллаби понял, что формула проста: если он прыгает, то лишается лакомства. А если он сидел? О, джекпот! Обучение заняло примерно пять недель плюс терпеливые занятия Питера по этой методике дома. Но к концу курса обучения Уоллаби больше не прыгал.

Несколько недель спустя Питер вернулся на занятия снова расстроенный из-за того, что Уоллаби опять начал прыгать. Я спросила Питера, систематически ли он использовал прием с игрушкой, который мы отрабатывали. Питер колебался. «Ну, иногда…» Ага! Как вы поймете впоследствии, несистематические занятия – это наиболее частая причина того, что хорошее поведение собаки в итоге разваливается. Мы с Питером принялись отрабатывать другой прием: я просила его поощрять Уоллаби, когда он прыгал. Правильно: мы поощряли Уоллаби за его «плохое поведение», в котором он уже прилично поднаторел. Питер должен был заставлять Уоллаби прыгать, когда тот этого меньше всего ожидал, даже посредине занятия, когда мы отрабатывали что-то другое. Раз за разом Уоллаби поощряли щедрой похвалой и лакомством просто за то, что он прыгал, когда его просили. Если он прыгал, когда Питер его не просил, он не получал вознаграждения. Вместо этого Питер просто отворачивался.

А потом произошла забавная вещь. Уоллаби начал предугадывать, когда Питер попросит его прыгнуть, и ждал от него сигнала, зная, что будет вознагражден. И уже скоро Уоллаби просек, что получит лакомство, только когда Питер скомандует ему: «Уоллаби, кенгуру!» По мере того, как Питер учился контролировать прыжки своей собаки, он также учил Уоллаби самоконтролю и в итоге превратил его прежде плохое поведение в забавный трюк, которым они оба наслаждались!

История Питера наглядно демонстрирует, что наказание совсем не обязательно должно выражаться в физическом воздействии, вроде удара собаке коленом в грудь, который вообще легко может отбить у Зака желание приближаться к Питеру. Наказание также может выражаться в отсутствии поощрения, если оно ослабляет только что продемонстрированное поведение собаки, так что оно с малой долей вероятности случится в будущем. Другими словами: Питер наказал Уоллаби. Но как? Если Уоллаби прыгал, кода Питер его об этом не просил, он не хвалил Уоллаби или не давал лакомство, просто отворачивался и игнорировал его. Отсутствие поощрения становится наказанием. Мы называем это отрицательным наказанием, и для Уоллаби это означает, что он не получил никакого поощрения, которое было ценно для него (внимание Питера или лакомство). Отрицательное наказание подобно запрету родителей выходить из дома для ребенка постарше, перерыв в занятиях ребенка помладше или запрет смотреть телевизор вечером. Это лишение привилегии.

Положительным наказанием для Уоллаби было бы, если бы Питер сделал ему физическое внушение, скажем, коленом в грудь, когда тот попытался бы прыгнуть. В отношении ребенка положительным наказанием является окрик или шлепок. Если бы родители только шлепали ребенка, когда он не слушался, то единственной наградой для него было бы не получить шлепка – это называется отрицательным подкреплением.

Данное представление об отрицательном и положительном не имеет ничего общего с сопоставлением плохого и хорошего. Отрицательное означает забирать; положительное – давать. Таким образом, положительное подкрепление означает дать подкрепление или поощрение. Отрицательное подкрепление означает не дать этого поощрения.

Дрессировка собак с помощью методики положительного подкрепления ориентирована на получение поощрения. Вот почему мы используем одновременно и положительное подкрепление (когда поощряем) и отрицательное наказание (когда лишаем поощрения). Традиционные методы дрессировки ориентированы на наказание. Те, кто им следуют, стремятся выделить положительное наказание (производя физическую коррекцию в форме резкого окрика или рывка поводка со строгим ошейником) и отрицательное подкрепление (лишение наказания, например, не дергать поводок со строгим ошейником).

Это различие между отрицательным и положительным может вызвать некоторое недопонимание, поэтому вернемся к Питеру и Уоллаби. Питер использовал модель положительного подкрепления, чтобы изменить поведение Уоллаби, убедительно говоря ему: «Мне нравится, что ты прыгаешь; сделай это еще несколько раз». Поощрение подкрепляло положительное поведение Уоллаби. Питер наказывал Уоллаби с помощью метода отрицательного наказания: никакой похвалы или лакомства, если Уоллаби прыгал, когда Питер не просил его об этом, что означало: «Ты можешь прыгать весь день, но я тебя игнорирую. Делать так не имеет никакого смысла».

Давайте представим, что Питер продолжил использовать традиционную аверсивную модель дрессировки. Если бы Уоллаби прыгнул на Питера, тогда он вынужден был применить положительное наказание, физический или вербальный выговор. Этим положительным наказанием он должен был сказать Уоллаби: «Не прыгай». Когда Уоллаби не прыгал, Питер не делал ничего, что является отрицательным поощрением: Уоллаби не получал наказания. Иными словами, Питер пытался сказать Уоллаби: «Когда ты не прыгаешь, это не значит плохо». Отрицательным поощрением является попытка подкрепить положительное поведение Уоллаби (не прыгать).