Давайте поговорим о полезном элементе оперантного обусловливания под названием «эффект азарта», который позволяет нам уменьшать частоту поощрений без вреда для поведения, которого мы с таким трудом добились.
Эффект азарта
Явление под названием «эффект азарта» было открыто много лет назад. Это палка о двух концах, которая, с одной стороны, обеспечивает эффективную дрессировку, а с другой — приводит к привыканию человека. Давайте посмотрим, как это работает.
Угощения можно давать по-разному. Можно давать его собаке каждый раз, когда животное предлагает желаемое поведение. Вы подзываете собаку, она подходит, вы даете собаке печенье. В следующий раз, когда она приходит на подзыв, вы даете ей еще одно печенье. К этому вопросу можно подойти с другой стороны и иногда давать угощение, а иногда удерживать его при себе. Такой график подкрепления мы называем переменным.
Если просить собаку сесть и тотчас поощрять каждый раз, когда она это делает, вскоре она с большой вероятностью будет садиться. Мы называем это непрерывным графиком поощрения или подкрепления, и это хороший способ закрепить новое поведение на начальных этапах. Но что случится, если вы продолжаете поощрять собаку каждый раз, когда она садится, месяц за месяцем? Вы не только потратите огромное количество сыра и тостов, но и, что удивительно, со временем новое поведение вашей собаки может стать менее надежным. Итак, непрерывный график поощрения больше не эффективен в изменении или поддержании поведения. Он потерял свою силу. Как это произошло?
Привычка к подходу
Все дело в выживании в дикой природе. Если взять ту же собаку, что была у нас в вышеописанном примере, научить ее безотказно садиться тем же самым способом, а затем начать поощрять только раз от раза в непредсказуемой манере, вуаля — обучение по-прежнему действует безотказно! Причины такого поведения кроются в постоянно меняющемся окружении. В природе животным может понадобиться несколько попыток, чтобы добиться поощрения, и очень маловероятно, что они могут предсказать, когда получат его. Детеныш антилопы гну может не сразу переплыть реку вслед за мамой. Ему может понадобиться три или четыре попытки, прежде чем получить поощрение — снова оказаться в безопасности рядом с ней. Такое упорство для достижения периодических поощрений совершенно необходимо для выживания в дикой природе. Если животное отказывалось от всего, что не дает ему немедленного поощрения, оно долго бы не прожило. В итоге это сильное влечение к периодическим поощрениям было буквально запрограммировано в большинство высших животных, в том числе нас. К сожалению, у людей эффект азарта отвечает за некоторые пристрастия. Так азартные игры и пари часто дают игроку совершенно непредсказуемые и случайные поощрения, запуская тем самым эффект азарта и вызывая у человека пагубную привычку.
К счастью, мы можем использовать эффект азарта, чтобы выработать у собаки привычку подходить по команде.
Пара слов о подкупе
Инструкторы, выступающие против использования пищи в обучении собак, считают поощрение лакомствами подкупом. Никто не хочет думать, что собака ему подчиняется только потому, что ее подкупили.
Подкуп — это нечто предлагаемое в аванс для получения определенного поведения, чтобы увеличить его вероятность. Если вы протягиваете собаке кусочек еды, а потом просите сесть, вы ее подкупаете. Это вполне допустимо на очень ранних этапах обучения, особенно если вы хотите, чтобы собака заняла определенную позицию, но это не долговременное решение. Проблема подкупа в том, что дрессировщик не может контролировать собаку, когда ему нечего ей предложить. Это еще одна веская причина использовать переменный график подкрепления, описанный ранее. Переменный график подкрепления подразумевает, что собака не имеет представления, получит ли она поощрение за свое поведение или нет. Если вы забыли взять на прогулку угощение — ничего страшного, возьмите что-нибудь вкусненькое в следующий раз. Поощрение или другие виды подкрепления не являются подкупом. Вы же не подманиваете собаку, обещая ей угощение. Подкуп не позволяет обучить собаку. Эффективно обучать подходу можно только в том случае, если собака подходит к вам, не зная наверняка, что именно в данный момент получит поощрение, и только тогда, когда она подходит несколько раз подряд без получения награды. Съедобные поощрения следует прятать из поля зрения собаки — в сумку или карман — до тех пор, пока не будет выполнен успешный подход.