Понедельник, 25.11.2024, 12:16
Приветствую Вас Гость | RSS
Меню сайта
Категории раздела
Послушание собак [100]
Декоративные собаки [45]
Служебная собака [34]
ВАРИАЦИИ ОКРАСОВ Собак [30]
Лучшии друг человека [46]
Это собака
Перевоспитание собак [79]
Собака - проводник слепого [34]
Как научить собаку танцевать? [39]
Собака-спасатель [82]
Подготовка и обучение
Собаковод - любитель [37]
Читаемое
Привязь собаки на цепь — неэффективна
Отбраковка щенков
Кавказская овчарка
Прохождение трассы
Наш опрос
Какая собака у вас
Всего ответов: 176
Статистика

Онлайн всего: 20
Гостей: 20
Пользователей: 0
            
Форма входа

Главная » 2015 » Июнь » 15
14:01
Как действует положительное подкрепление


Прежде всего мы вообще должны забыть об упражнениях. Все, что нас интересует для начала — это первый шаг в нужном направлении. Представим себе, например, что мы хотим научить касатку выпрыгивать из воды. Мы даем свисток (команду) и ждем. Затем ждем еще немного, а зачастую бывает, что ждем еще и еще. Очевидно, сначала касатка не имеет представления о том, что от нее требуется, когда звучит свисток. Поэтому нам приходится ждать, чтобы она зачем-нибудь высунула нос из воды. Точно в этот миг мы снова свистим в свисток и даем ей рыбу. Когда она проплывает внизу, мы снова свистим и ждем. Процедура повторяется до тех пор, пока касатка не выйдет на уровень «ага!»: «Ага! Когда я слышу звук свистка, я получаю рыбу». Этот уровень понимания — уровень «ага!» — не может считаться закрепленным, до тех пор вы не добьетесь, чтобы происходило десять из десяти возможных немедленных реакций на свисток. Пока это не достигнуто, не следует переходить к следующему этапу дрессировки.
На первом ее этапе кажется, что прогресс не очень заметен, однако для успеха обучения крайне важно, чтобы каждый этап заканчивался достижением уровня полного понимания. Если вы этого добьетесь, то обнаружите, что, по мере перехода к каждому следующему этапу превращение первоначальной реакции в распознаваемую цепочку движений идет очень быстро. Теперь мы подходим к этапу дрессировки, который называется «формирование». Нам нужно заменить уже сложившуюся цепочку: «свисток — появление носа — обязательная рыбка», новой цепочкой: «свисток — касатка выпрыгивает из воды — рыбка дается иногда». Достигается это следующим образом. Формирование поведения означает, что мы делаем один маленький шаг в нужном направлении и продвигаемся к конечной цели, подкрепляя каждый сделанный шаг. Так мы обеспечиваем безусловное выполнение этой части цепочки, прежде чем двигаться дальше.
Здесь наблюдается интересное явление: выполнение определенных действий, надежно затренированное с помощью вознаграждения, можно сделать еще более четким, если вознаграждение задерживать. Предположим, затренирована такая реакция касатки: на десять свистков она десять раз немедленно высовывает нос из воды. На одиннадцатый раз говорим: «Недостаточно хорошо, рыбы ты не получишь». Можно предположить, что теперь касатка подумает: «Но я всегда получаю рыбку. Наверное, кто-то ее стащил раньше меня. В следующий раз надо живее пошевеливаться». И на двенадцатый раз вы получите более быструю и энергичную реакцию касатки: она высунет из воды всю голову целиком. За это безусловно полагается рыбка, но теперь и в дальнейшем — только за это.
Дальше будем формировать цепочку: «свисток — появление из воды всей головы целиком — при немедленной реакции рыбка в награду в десяти случаях из десяти». Лишь затем можно будет перейти к следующему этапу. Кажется, что обучаемый с каждым этапом все скорее понимает, что от него требуется и возникает эффект снежного кома.
Я намеренно воспользовался примером касатки чтобы подчеркнуть главное: весь процесс обучения может осуществляться без какого-либо физического воздействия. Сначала мы ждем верного шага в нужном направлении и вознаграждаем его, затем закрепляем и придаем законченную форму.
Хозяин: «Какая разница между всем этим и подкупом?» Я: «Подкуп — это использование награды в качестве соблазна, для того чтобы стимулировать движение. Подкрепление — это вознаграждение, получаемое за добровольное движение». Хозяин: «Всегда ли давать награду?» Я: «Прием действует лучше, если вы даете награду не всегда. Когда модель поведения сформирована, только самая быстрая, ярко выраженная и сильная реакция вознаграждается. Иногда ученику придется выполнить отработанную цепочку шесть или семь раз, прежде чем последует вознаграждение». Хозяин: «Обязательно ли давать в награду что-то съедобное?» Я: «Наградой может быть что-то другое, ради чего, с точки зрения ученика, стоит выполнять определенные действия. Было бы бессмысленно пытаться сформировать мое поведение с помощью тарелки капусты, если я терпеть не могу капусту!
Категория: Собака-спасатель | Просмотров: 1145 | Добавил: psi-na | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Поиск
Популярное
Термопанели - что это?
Собаки. Пемброк вельш корги были выведены в Британии.
Груминг мальтезе
Тренды на осень 2016
Инсинератор: переработка отходов при высокой температуре
Нервные расстройства
Колли: особенности породы
ВОСПИТАНИЕ ВОСПИТАТЕЛЕЙ
Календарь
«  Июнь 2015  »
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930
Архив записей
Занимательное
Хозяин (или дрессировщик)
Двигательная система мозга
Обморожения
Исследование системы органов пищеварения
Фото любимцев
Человек собаке друг psi-na.ru © 2024