Добавить в цитаты Настройки чтения

Страница 9 из 22

 Павлов совершил открытие условного рефлекса случайно, когда в ходе исследований по физиологии обнаружил, что у собаки появляется слюна ещё до того, как она могла почуять еду.

Оперантное обусловливание

Вдохновившись результатами, полученными Павловым, в США направлением бихевиоризма стал заниматься Беррес Скиннер.

 Беррес Фредерик Скиннер – самый популярный из бихевиористов, во многом благодаря своим книгам и опытам. Кроме него, конечно, были и многие другие. Отцом-основателем бихевиоризма считается Джон Бродес Уотсон.

Во время классического обусловливания (опыты Павлова) стимул возникает до события или целевого поведения, новое поведение при этом не формируется. Во время оперантного[17] обусловливания «подкрепление»[18] (награда, закрепляющая определенное поведение) появляется после действий испытуемого. На этом основан «закон эффекта», сформулированный Эдвардом Торндайком: поведение, ведущее к положительным для животного результатам, будет повторяться чаще, а вызывающее отрицательные последствия – постепенно угасать. В бихевиоризме с помощью оперантного обусловливания стремятся сформировать новое или закрепить старое целевое поведение.

 А вы знали, что стимул (лат. Stimulus) – это острый металлический наконечник на шесте или заострённый кол, которым римляне погоняли ослов, запряжённых в повозку?

С точки зрения бихевиоризма поведение формируется на основе реакций на безусловные стимулы. Джон Уотсон выяснил, что безусловный стимул, вызывающий страх у детей, – это потеря равновесия или громкие звуки. Если эти действия совмещать с изначально нейтральным стимулом (например, с появлением в поле зрения ребёнка белого кролика), через некоторое число повторений совмещения условного и безусловного стимула произойдёт обусловливание – кролик начнёт вызывать у ребёнка панический страх. Если затем сочетать появление условного стимула, вызывающего страх, и безусловного, вызывающего положительные эмоции, можно сгладить этот эффект, хотя последствия менее предсказуемы.

Интересная особенность психики человека в том, что реакция страха может распространиться и на другие объекты, обладающие схожими характеристиками (например, в случае, описанном выше, – на белый цвет). Ребёнок в будущем может начать бояться и бороды Деда Мороза, и белых листов бумаги. Такие страхи очень стойкие и легко переносятся на похожие ситуации, а вот погашение основных страхов на схожие ситуации не распространяется. Например, если человека отучить бояться учителей (основной страх), он продолжит бояться полицейских или начальников (вторичные страхи, сформировавшиеся под влиянием первичного страха). Со вторичными страхами приходится бороться отдельно. Более того, если такому человеку вновь попадётся строгий и злой учитель, страх легко может появиться вновь, иногда – с большей силой [24].

Так что трижды подумайте, прежде чем вводить наказания в своей игрофицированной системе – ведь страх может распространиться на всю организацию, применившую игрофикацию, и игрок станет её избегать.

Наверное, чаще всего отторжение самой «игры», и компании, которая её применила, происходит при введении рейтингов.

В одной организации, где мне довелось работать, ввели систему рейтингов для каждого отдела. Раз в неделю худший сотрудник каждого из отделов (компания была не очень большая) должен был отчитываться на общем собрании и обещать исправиться на следующей неделе. Эти собрания мы называли «двухминутка ненависти», хотя они и длились дольше часа. Я ненавидел эту процедуру независимо от того, предстояло мне выступление или нет, и до сих пор вспоминаю этот опыт с содроганием.

Есть доказательства, что у человека вызывает реакцию не звучание слова, а его значение. Например, в экспериментах у людей вызывали чувство голода и слюноотделение при произнесении нейтральных по отношению к пище слов (мороз, урна). Если затем этим людям показывали изображение мусорки или произносили слово «холод», у них начиналось слюноотделение. При произнесении похожих по звучанию слов слюноотделения не было – перенос реакции происходит по схожести смыслов [24].

Давайте рассмотрим оперантное обусловливание на примере социальной сети.

Допустим, человек испытывает удовольствие от того, что его хвалят. Он размещает посты в Facebook, за которые ему ставят «лайки» – хвалят. Если это происходит достаточно часто, человек будет получать удовольствие, размещая свои посты, просто от ожидания того, что кто-то его «лайкнет». Он может постоянно обновлять свою страничку в ожидании награды, и каждый новый «лайк» будет укреплять этот новый условный рефлекс.

Если достаточно большое количество постов не получит одобрения в виде лайков, произойдёт угасание условного рефлекса – мотивация к размещению таких постов снизится.

Конечно же, Facebook и другие соцсети не ограничиваются бихевиористским подходом, арсенал используемых ими инструментов намного шире. Подробнее об этом можно прочитать в седьмой главе.





Влияние частоты наград на повторяемость целевого поведения

Очень многие исследования в бихевиоризме посвящены тому, в какой момент и с какой частотой давать награды для достижения наибольшего эффекта.

Хуже всего с точки зрения повторяемости целевого поведения действуют награды через фиксированные промежутки времени (например, зарплата или награждение игрока за ежедневный вход). Причём чем больше проходит времени между такими наградами, тем меньше шансов добиться целевого поведения.

Рис. 16. Награды через фиксированные промежутки времени

Гораздо эффективнее действует схема, когда игроков регулярно награждают за целевое поведение. Это может быть, например, оплата, зависящая от количества и качества проделанной работы (сдельная зарплата) или фиксированная награда за действие в игре (за изготовление каждого снадобья можно получить по 10 монет).

Рис. 17. Награда за фиксированные действия

Ещё более эффективных и долгосрочных результатов можно добиться несистематическими наградами, выдаваемыми в случайном порядке. Животные способны очень долго продолжать действовать целевым образом в надежде на награду.

Рис. 18. Награда через случайные интервалы

Например, дельфины будут гораздо дольше, чем в ситуации с фиксированными вознаграждениями, заплывать в дальний угол бассейна (целевое поведение), если награду давать им случайным образом [23]. Они будут это делать ещё долго и после того, как вознаграждения прекратятся вовсе. Крысы в экспериментах Скиннера, когда нажатие на рычаг не гарантировало появление пищи, начинали нажимать на него чаще [26].

 Награда через случайные интервалы. Говорят, что Скиннер открыл эффект от несистематического награждения случайно [57]. Как-то раз у него кончились гранулы, которыми он подкармливал крыс. Чтобы не прекращать эксперименты, он решил давать им эти гранулы каждый десятый раз и обнаружил, что крысы ведут себя совершенно иначе. Это привело к открытию, оказавшему очень большое влияние на развитие многих сфер, в том числе и игр.

17

Оперант – класс различных действий (крыса может нажимать на кнопку разными лапами или любой другой частью тела), вызывающих одни и те же последствия в окружающей действительности.

18

Слово «подкрепление» (англ. reinforcement) даёт, кстати, удобную лазейку. Если какая-либо награда поведение не закрепляет, она не является (просто по определению) подкреплением. Очень многие свои промахи бихевиористы объясняют неудачным (неподкрепляющим) выбором наград.