Оперантное научение. методы и результаты

Оперантное научение (от лат. operatio – действие) – это научение, в ходе которого организм добивается полезного результата с помощью активного поведения. Имеются два основных похожих вида оперантного научения:

1.метод проб и ошибок 

2.инструментальный условный рефлекс.

Метод проб и ошибок является одним из способов индивидуального научения. Американский ученый Э.

Торндайк помещал голодных кошек в так называемые проблемные клетки, которые открывались в том случае, если кошка предпринимала какое-то определенное действие. Например, тянула за веревку, приподнимала запорный крючок и т.д.

Когда кошка выходила из клетки, она получала пищу. По мере повторения процедуры выхода из клетки, т.е. увеличения числа проб и ошибок, скорость выполнения задачи возрастала.

Инструментальный условный рефлекс – это научение действию с помощью вознаграждения (подкрепления) или наказания. Например, в опытах Скиннера крыса научается в ответ на световой сигнал нажимать на рычаг, чтобы получить пищу, т.е.

она использует какой-то инструмент. Отсюда и название этого вида научения. Дети быстро учатся говорить, когда родители одобряют их при правильном произношении отдельных звуков и слов.

Научение с помощью инструментального условного рефлекса происходит по сигналу, а научение методом проб и ошибок – без сигнала.

Есть некоторые отличия инструментальных рефлексов от классических рефлексов, которые изучал И.П. Павлов. Во-первых, инструментальные рефлексы образуются значительно быстрее – после 1–2 сочетаний, в то время как классические – после 6–10 и более сочетаний.

Во-вторых, в инструментальных условных рефлексах животное активно, оно должно «поработать», чтобы было подкрепление, в то время как в классических условных рефлексах животное пассивно, оно как бы «ждет» подкрепления, которое будет независимо от того, проявится условное слюноотделение или нет.

Если человек или высшие животные оказываются в ситуации, с которой они ранее не встречались, то они находят правильное решение в результате мышления, т.е. когнитивного научения. В когнитивном научении сначала происходит мышление, а затем – выполнение действия. Следовательно, такое научение целенаправленно.

  • К когнитивному научению относят также научение путем наблюдения. Различают два вида научения путем наблюдения:
  • 1) простое подражаниехарактерно для детей раннего возраста, которые, подражая взрослым, выполняют действия, не понимая, зачем это делается;
  • 2) викарное научение также осуществляется посредством наблюдения, но при этом результат действия оценивается. По мере взросления у маленьких детей викарное

С научением путем наблюдения тесно связаны экстраполяционные рефлексыу животных, описанные русским психологом Л.В. Крушинским.

Экстраполяционные рефлексы заключаются в способности животных определять направление дальнейшего перемещения значимого для него раздражителя, например, перемещения пищи, движущейся по прямой линии после исчезновения ее из поля зрения.

Способность к экстраполяции хорошо развита у птиц, хищных млекопитающих, дельфинов и, естественно, у человека.

Научение путем инсайта.

Научение путем инсайта, или озарения, – это внезапное нестандартное правильное решение задачи.

Иногда после отдельных проб и ошибок возникает идея результативного действия, которое может совершенствоваться в процессе достижения цели.

Этот вид научения является следствием объединения опыта, накопленного в памяти, с той информацией, которой располагает индивид при решении проблемы.

Научение путем инсайта было открыто В. Кёлеромв исследовании поведения шимпанзе в различных проблемных ситуациях. Например, находящаяся в клетке обезьяна пыталась достать банан, лежавший за решеткой клетки, сначала одной палкой в виде трубки, потом другой такой же.

Но обе палки были слишком короткие. Тогда она, прекратив свои попытки, стала разглядывать находящиеся возле нее предметы. Затем обезьяна вдруг быстро проделала логическую последовательность действий: схватила обе палки, вставила их одна в другую, просунула между прутьев клетки и достала банан.

Способность к инсайту зависит от прошлого опыта, уровня мотивации и других причин. Инсайт может приходить сам, но можно создать условия, когда он будет приходить чаще. Инсайту способствуют:

  1. 1) стадия предварительного исследования (накопления гипотез);
  2. 2) стадия отхода от прямых попыток решить задачу в лоб. В этом случае происходит поиск окольных путей, неожиданных и нестандартных вариантов, включается подсознание;
  3. 3) ресурсное состояние мозга, чему способствует хорошее настроение, ходьба и другая физическая активность;

4) моменты неподвижности. Резкие движения головой ослабляют продуктивность мозговой деятельности, и в моменты ощущения «сейчас соображу» нужно оказаться в неподвижном состоянии.

Нужно обязательно иметь в виду, что в конкретных ситуациях для достижения полезного приспособительного результата субъект чаще всего реализует не один, а несколько видов научения.

Частное научение, например, обучение работе на компьютере, вождению автомобиля по своей структуре всегда является комплексным, сложным.

Большинство форм научения, кроме пассивного и классических условных рефлексов, является сложной формой научения.

Источник: https://studopedia.net/7_8865_operantnoe-i-kognitivnoe-nauchenie.html

Активное научение. Оперантное обуславливание

Примером активного научения служит оперантное научение, которое по-другому называют еще инструментальным условным рефлексом. При оперантном научении награда (например, пища) следует не автоматически за сочетанием безусловного и условного стимула, а зависит от правильной реакции организма.

Ранние исследования оперантного научения проводились Э. Л. Торндайком. Он помещал кошку в особый «проблемный» ящик, из которого животное пыталось выбраться. Вне клетки помещалась рыба. Для того чтобы покинуть ящик, нужно было нажать на педаль, однако кошка не получала никаких «подсказок».

Активность кошки представляла собой образец действия методом проб и ошибок: сначала она беспорядочно металась по клетке и мяукала, пыталась достать приманку, просовывая лапу сквозь решетку, пока случайно не задевала педаль и дверца не распахивалась.

В результате многочисленных повторных процедур кошки постепенно переставали совершать лишние действия и сразу нажимали на педаль.

Торндайк назвал это научением путем проб и ошибок, поскольку перед тем, как животное научается совершать нужный акт, оно реализует множество ошибочных.

Наблюдая за кошками в проблемных ящиках, Торндайк вывел закон эффекта, гласящий, что реакция, за которой следует награда, закрепляется в поведении.

Другими словами, Торндайк считал, что научение основано на постепенном закреплении эффективных действий и отмирании неэффективных.

  • Р1 — мяукать Возможные реакции Р2 — царапаться (специфичные Р3 — кусаться
  • для данного вида): Р4 — прыгать на стенки
  • Р5 — нажать на педаль — НАГРАДА До научения: Вероятность Р1 = Вероятности Р2 = Вероятности Р3 = Вероятности Р4 = Вероятности Р5.
  • После научения: Вероятность Р5 > В Р2, В Р3, В Р4.
  • Согласно Торндайку, механизм научения заключается в установлении связей между стимулами и реакциями.

Концепция Торндайка была значительно развита Б. Ф. Скиннером, который подверг критике случайный характер нахождения верного решения в модели Торндайка (представим, что мы случайным образом гадаем, сколько будет пятью пять — скорее всего, мы никогда не отыщем правильный ответ).

Он предложил метод научения (формирования реакций) с помощью последовательных приближений. Этот метод заключается в том, что экспериментатор разбивает весь путь решения на несколько этапов. Тогда награда следует не за правильным решением, а за каждым шагом в верном направлении.

Например, Скиннер прово-

дил следующий эксперимент. Голубя сажают в клетку, в которой нет ничего, кроме кнопки и находящейся под ней кормушки. Голодная птица, попав в клетку, начинает все исследовать и в результате ударяет клювом по кнопке. Количество клеваний за полчаса условно принимают за исходный оперантный уровень.

Затем включают кормушку, и после каждого клевания по кнопке голубь получает по зернышку. Через некоторое время птица научается клевать кнопку, так как это действие подкрепляется. Чем больше она будет клевать кнопку, тем больше пищи получит.

Отсюда следует, что если птица клюет кнопку с высокой частотой, оперантный уровень будет высоким, если редко — то действие будет иметь низкий оперантный уровень.

В оперантном научении особую роль играет подкрепление. Подкреплением называется любой предмет или событие, которое значимо для организма и ради достижения которого им совершается определенное поведение.

Скиннер отмечал, что научение путем последовательных приближений спонтанно используется родителями при воспитании детей. Например, младенец произносит какие-то нечленораздельные звуки (это естественные реакции ребенка).

Случайно в его лепете родители слышат сочетание звуков «ме-ме», что вызывает у них бурный восторг. Младенец, воодушевленный вниманием старших (что в данном случае является подкреплением его действий), начинает повторять на разные лады это сочетание, пока случайно не произнесет «ма-ма».

Как только это происходит, «ме-ме» перестает вызывать интерес взрослых и они концентрируются на первом слове «мама».

Скиннер разработал метод программированного обучения в школе, в котором применительно к детям реализовывался данный подход.

Кроме того, Скиннер провел тщательную классификацию эффективных видов наград, которые являлись подкреплениями.

Главным в его концепции стало понятие социального подкрепления (одобрение окружающих, повышение оценки), в отличие от прямо физиологического подкрепления (пища, тепло).

В своей знаменитой книге «По ту сторону свободы и достоинства» (1973) Скиннер разработал утопическую модель идеального общества, в которой психологи-«планификаторы» будут жестко контролировать различные подкрепления, которые человек будет получать в течение своей жизни для того, чтобы сформировать из каждого полезного для общества гражданина.

Январь 24, 2019 Общая психология, психология личности, история психологии

Источник: https://psihologia.biz/psihologiya-psihologiya-obschaya_693/aktivnoe-nauchenie-operantnoe-39696.html

Научение, его формы и физиологическая сущность. Классификация форм научения

Научение – это  выработка в процессе онтогенеза  приспособительных форм поведения. Научение обеспечивает постоянное пополнение и изменение наших знаний, а также приобретение новых навыков и умений. Для научения необходима память, т.к.

она представляет механизм, с помощью которого накапливается прошлый опыт, который может стать источником адаптивного поведения.

Научение требует определённого времени и реализуется с помощью нейрофизиологических механизмов разного уровня: межклеточного, внутриклеточного, молекулярного.

Существует несколько классификаций научения. Все виды научения делят на две группы: неассоциативное и ассоциативное, кроме того, выделяют простое и сложное научение.  По критерию активности животного или человека в ходе научения выделяют 4 группы научения:

I.Пассивное (реактивное) научение  имеет место во всех случаях, когда организм, не прилагая целенаправленных усилий реагирует на какие-то внешние факторы и когда в нервной системе формируются новые следы памяти. Формами пассивного научения являются: привыкание, сенситизация, импринтинг и  классические условные рефлексы.

А) Привыкание (габитуация)  – выражается в ослаблении поведенческой реакции при повторных предъявлениях стимула. Примером поведенческого привыкания является угасание ориентировочного рефлекса в случае многократно повторяющегося раздражителя, не имеющего значения для организма.

Благодаря привыканию  мы можем игнорировать раздражители, не несущие никакой новизны и не имеющие для нас значения, сосредоточивая внимание на более важных явлениях. Привыкание  – это особый приспособительный нервный процесс, его не следует путать с утомлением и адаптацией анализаторов, т.к.

его можно вызвать изменением стимула.

Б) Сенситизация – усиление реакции организма на повторяющийся стимул, если он вызывает каждый раз неприятные ощущения (например,  жужжание мухи, писк комара).

В данном случае научение носит негативный характер.

В основе механизма этого вида научения лежит механизм синаптического облегчения (посттетанической потенциации), которое улучшает проведение в синапсах после короткого раздражения афферентных путей.

Читайте также:  Сепарация в психологии - условия здорового взросления

В) Импринтинг – запечатление в памяти новорождённого окружающей действительности. Это особая форма научения, основанная на врождённой предрасположенности к определённым сочетаниям раздражителей и возникающих ответных реакциях в ранний период развития организма.

В отличие от ассоциативного или инструментального обучения импринтинг может реализоваться только в определённый период онтогенеза, так называемый сенситивный (чувствительный)  период. Первые данные о наличии чувствительных периодов в раннем онтогенезе, при которых происходит запечатление, были получены Конрадом Лоренцом на выводковых птицах.

Учёный назвал такой тип обучения  импринтингом. Различают несколько форм проявления импринтинга:

  1. 1.        Запечатление образов и объектов: родителей, братьев, сестёр, вида пищи т.д.
  2. 2.        Усвоение поведенческих актов (дети повторяют действия родителей). Это так называемое имитационное поведение, разновидностью этого импринтинга является половой импринтинг – половое поведение особей внутри своего вида.
  3. 3.        Реакция следования –  автоматическое следование новорождённого за родителями. Реакция следования происходит не только  за запечатлённым объектом, но и за близкими ему по форме. При этом запечатляться может любой предмет.

Считают, что двигательным эквивалентом реакции следования животных у ребёнка является улыбка, смена мимики, реакция оживления уже на втором месяце жизни.

Импринтинг имеет сходство как с безусловными, так и условными  рефлексами:

  • также как и безусловные рефлексы эти реакции сохраняются, как правило,  в течение всей жизни.
  • являются врождёнными, однако для их проявления требуются определённые условия. Например, реакция следования является врождённой, но в процессе жизни превращается в приобретённую (если изолировать детёныша от родителей сразу после рождения на определённый промежуток времени, то реакция следования не формируется, т.е. конкретная реакция  по наследству не передаётся, имеется только готовность к её выполнению у новорождённого).

Импринтинг отличается  и от  безусловных, и от условных  рефлексов:

  • он проявляется в определённые критические  (сенситивные) периоды.
  • запечатление происходит очень быстро, иногда с первого раза.

Открытие сенситивных периодов в развитии головного мозга и поведения птиц явилось стимулом для проведения исследований на млекопитающих.

Наблюдение за развитием детей свидетельствует о том, что важную роль в нервно-психическом развитии ребёнка имеет импринтинг, влияющий на будущее поведение, предопределяя  его на долгие годы, По-видимому, в развитии  детей имеются критические периоды, но они сдвинуты на более поздние сроки, чем у животных. В частности, существует мнение, что возраст от 6 недель до  6 месяцев является критическим для формирования отношений ребёнка с матерью.

  1. Классические условные рефлексы по И.П.Павлову – положительные и отрицательные.

II. Оперантное научение (от лат. оperatio –действие) – это научение, в ходе которого организм добивается полезного результата с помощью активного поведения. Имеется три вида оперантного научения –  метод проб и ошибок, инструментальный условный рефлекс и самораздражение.

А) Метод проб и ошибокАмер. Уч. Э.Торндайк (один из основоположников бихевиоризма, от англ.

behavior – поведение) помещал кошек в проблемные клетки, которые открывались в том случае, если кошка предпринимала какие-либо действия. Когда кошка выходила из клетки, она получала пищу.

По мере повторения этой процедуры (увеличения числа проб и ошибок) скорость выполнения задачи возрастала.

Б) Инструментальный условный рефлекс – научение действию с помощью  вознаграждения (подкрепления).

Этот вид оперантного научения происходит по сигналу в отличие от  научения методом проб и ошибок, который осуществляется без сигнала.

Например, животное по световому сигналу нажимает на рычаг и выключает электрический ток, чтобы избежать раздражения, т.е. использует какой-то инструмент, отсюда и название этого вида научения.

В) Самораздражение структур мозга для получения удовольствия, положительных эмоций.

  Если крысе вживить раздражающий электрод в латеральную область гипоталамуса, поместить её в камеру Скиннера и предоставить ей возможность осуществлять самораздражение, нажимая на рычаг, крыса будет осуществлять самораздражение настолько интенсивно, что возникает опасность её гибели от истощения.

III. Когнитивное научение (рассудочное)основано на формировании функциональной структуры среды, т.е.

на извлечении законов связей между её отдельными компонентами. К когнитивному научению относится: научение путём наблюдения, рассудочная деятельность, психонервная деятельность.

Некоторые исследователи к этой форме научения относят вероятностное прогнозирование.

А) Научение путём наблюдения, в результате которого выполняются действия путём непосредственного наблюдения за действием других. Различают два вида этого научения: простое подражание и викарное научение.

  1. 1.       Простое подражание. Например, обезьяна в общении с исследователями научилась мыть банан перед едой, не понимая, зачем она это делает.
  2. 2.       Викарное научение. Осуществляется также  с помощью наблюдения, но при этом результат действия оценивается. Такое научение свойственно только человеку. Особенно часто используют научение путём наблюдения дети, причем в раннем детстве оно является преимущественно подражательным. С возрастом начинает преобладать викарное научение.

Б) Рассудочная деятельность. Представление о рассудочной деятельности животных ввёл в научный оборот в 1960 г. Л.В.Крушинский.

Наиболее характерное свойство элементарной рассудочной деятельности животных заключается в их способности улавливать простейшие эмпирические законы, связывающие предметы и явления окружающей среды, и возможность оперировать этими законами при построении программ поведения в новых ситуациях.

Рассудочная деятельность отличается от любых форм обучения тем, что она осуществляется при первой же встрече организма с необычной ситуацией, создавшейся в среде его обитания.         Наблюдения за поведением животных привели Л.В.

Крушинского к заключению о том, что их способность к экстраполяции направления движения раздражителя можно рассматривать как одно из элементарных проявлений рассудочной деятельности. Под экстраполяцией  понималась  способность животных определять направление дальнейшего перемещения значимого для него раздражителя.

Для исследования способности животных к экстраполяции (экстраполяционным рефлексам) в лаборатории Л.В.Крушинского проводился эксперимент, сущность которого  заключалась в следующем: перед животным помещалась ширма с щелью.

За ширмой располагали две кормушки, одна из которых пустая, а другая с пищей. После того, как животное  в течение нескольких секунд подкармливалось через щель, кормушки раздвигались в разные стороны.

Животное должно было определить направление движения кормушки с кормом и, обежав ширму, достичь её.

При исследовании способности к экстраполяции разных представителей животного мира, оказалось, что  первое место среди млекопитающих занимали волки и красные лисицы. У птиц самая высокая способность к экстраполяции наблюдается в семействе врановых птиц. Рептилии, в частности, ящерицы и крокодилы, решали задачу уже при первых её предъявлениях, тогда как рыбы и амфибии с ней не справлялись.

В лаборатории Л.В.Крушинского исследовался также вопрос о соотношении обучаемости и элементарной рассудочной деятельности.

Результаты показали, что доля правильных решений задачи при многократном её  предъявлении  уменьшается у тех видов животных, для которых был характерен высокий показатель при первом предъявлении, и наоборот – постепенное увеличение доли правильных решений у плохо экстраполирующих животных.

Таким образом был установлен парадоксальный результат: у животных с высоким уровнем рассудочной деятельности многократное предъявление экстраполяционной задачи ухудшает её решение.  По мнению Л.В.

Крушинского, это объясняется тем, что правильное решение вызывает резкое возбуждение головного мозга, что приводит при следующих предъявлениях к ухудшению решения задачи.

А у животных с невысоким уровнем рассудочной деятельности нарушений деятельности мозга не происходит, в результате обучению правильному решению задачи проходит успешно. Следовательно, степень развития рассудочной деятельности обусловливает тот исходный фон, с которого начинается формирование поведения при участии индивидуального опыта. Чем выше уровень элементарной рассудочной деятельности, тем пластичнее и адаптивнее поведение.

Таким образом сложное приспособительное поведение животных, с точки зрения Л.В.

Крушинского, строится из трёх основных компонентов ВНД: инстинктов, условных рефлексов и рассудочной деятельности, благодаря которой организм сразу вырабатывает программу адаптивного поведения в новых условиях, внезапно сложившихся ситуациях и способен выбрать наиболее адекватную тактику поведения в новой обстановке, прогнозируя развитие событий.

В) Психонервная деятельность (или образное поведение, или образная память). Психонервная деятельностьисследовалась И.С. Бериташвили в 1926 г.  Суть психонервной деятельности состоит в том, что у высших позвоночных животных при первом же восприятии конкретных явлений окружающей действительности (пищи, врага и т.д.) возникает определённый образ.

Этот образ сохраняется, и, каждый раз, когда он воспроизводится при восприятии данной среды или какого-либо его компонента, животное ведёт себя точно так же, как  и при непосредственном восприятии.  И.С. Бериташвили считал, что нервным субстратом психонервной деятельности является неокортекс.

 В отличие от условнорефлекторной деятельности психонервный образ

  • не требует повторяемости, а формируется сразу;
  • быстро перестаёт вызывать определённое поведение, если не сопровождается удовлетворением биологической потребности;
  • требует обязательного участия коры головного мозга, прежде всего её лобных отделов;
  • психонервная деятельность определяет включение и выключение условных и безусловных рефлексов, а также последовательность их протекания.

Индивидуальное поведение, первично направляемое психонервным образом, при повторной тренировке автоматизируется и осуществляется по всем закономерностям условнорефлекторной деятельности.

Г) Вероятностное прогнозирование, под которым понимается предвосхищение будущего, основанное на вероятностной структуре прошлого опыта и информации о наличной ситуации. Оба эти фактора являются основой для создания гипотез о предстоящем будущем.

В соответствии с таким прогнозом осуществляется подготовка к действиям в предстоящей ситуации, приводящим к наибольшей вероятности достижения цели. Высшие позвоночные и человек в своей деятельности постоянно опираются на вероятностное прогнозирование.

Например, когда человек переходит улицу, он прогнозирует ситуацию на проезжей части и интервал времени для безопасного пересечения дороги.

IV. Научение путём инсайта (озарения)– это внезапное нестандартное правильное решение задачи. Этот вид научения является следствием объединения опыта, накопленного в памяти, с той информацией, которой располагает индивид при решении проблемы.

В заключение необходимо отметить, что в конкретных ситуациях для достижения приспособительного результата индивид чаще всего использует не один, а несколько видов научения.

Источник: https://www.braintools.ru/article/9503

Оперантное обусловливание

Теория инструментального, или оперантного обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorndike) и Б. Ф. Скиннера (В. Е Skinner). Скиннер и Торндайк — виднейшие представители бихевиоризма — показали, что воздействие окружающей среды определяет поведение человека.

Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении.

На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперантное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий.

Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия.

В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее.

Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант.

В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) — это поведение, вызванное подкреплением, следующим за поведением.

Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение — стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном — следует за ней.

Читайте также:  Деструктивное поведение, что это такое

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание — ослабляет.

Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов.

То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение.

(Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий — уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй — как Sr (респондентный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:Классическое обусловливание S—R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение — поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R—S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение — поведение, вызванное подкреплением, за ним следующим.

Источник: https://psyera.ru/3247/operantnoe-obuslovlivanie

Условных рефлексов (оперантное научение)

Отцом инструментальной формы научения считается Э. Торндайк, который еще в конце прошлого века назвал такую форму научения обучением «методом проб, ошибок и случайного успеха».

Огромный вклад изучение закономерностей образования инструментальных условных рефлексов внес американский ученый Беррес Фредерик Скиннер.

Предложенное им определение оперантного научения и оперантного условного рефлекса сейчас наиболее употребимы при характеристике инструментальной формы научения.

Известно, что обстоятельства и ситуации в которые попадают животные вынуждают их совершать те или иные формы поведения, приспосабливаясь или активно сопротивляясь. Ученые назвали такое поведение оперантным (от латинского operatio — действие).

Действия животных приводят к каким-либо последствиям или результатам, от которых зависит, будут ли они повторять эти действия или избегать их. То есть инструментальные условные рефлексы строятся на основе активной целенаправленной деятельности животного.

Последовательность событий и результат их в данном случае, зависят не только от внешней сигнализации, но и от поведения самого животного. Таким образом, первое отличие инструментального условного рефлекса от классического заключается в активной, целенаправленной деятельности обучающегося животного.

Вторым отличием является то, что инструментальный рефлекс не воспроизводит лежащую в его основе безусловную реакцию, в то время как классический условный рефлекс частично или полностью воспроизводит ее.

Считается, что при образовании инструментального рефлекса выбор реакции животным определяется не вызывающим ее раздражителем, а установлением временной последовательности между реакцией, выполняемой животным в данной ситуации и подкрепляющим раздражителем.

При классических условных рефлексах связь устанавливается между стимулами и результатом, а при инструментальном научении, она возникает между реакцией и результатом.

Таким образом, действие животного приобретает сигнальную функцию по отношению к результату (подкреплению).

Эффективность научения в форме образования инструментальных условных рефлексов заключается не только в том, что животное само стремится совершить какое-либо действие, но и в том, что подкрепление — это не просто событие, связанное временной последовательностью с каким-либо сигналом, а всегда удовлетворение доминирующей потребности, поэтому и становится биологически важным, а действия приводящие к нему — биологически целесообразными.

Несмотря на кажущуюся близость инструментальных условных рефлексов двигательным классическим рефлексам, специальными исследованиями было доказано существование различий между ними.

В одном из них собака должна была до тех пор реагировать на первый раздражитель, пока не предъявлялся второй, за которым следовало пищевое подкрепление.

Оказалось, что первый раздражитель вызывал инструментальную реакцию, не сопровождающуюся слюноотделением, тогда как второй вызывал слюноотделение.

Но следует отметить, что хотя естественное поведение животных в основном инструментально, в формировании поведенческого акта трудно различить роль и участие того или иного вида условного рефлекса.

Этапы оперантного научения:

1. Создание состояния выраженной потребности у животного.

2. Первичная инициация нужного поведения (поведенческого акта) одним из способов дрессировки. При этом избегаются способы болевого воздействия (оборонительного поведения) и предпочитаются способы, основанные на отборе поведения.

3. Создание условий при которых животные самостоятельно воспроизводят первично инициированное поведение.

4. Введение стимула, санкционирующего данный поведенческий акт.

5. Использование свойств подкрепления и тренировочного процесса для закрепления поведенческого акта до навыка.

Оперантное научение может быть основано на любой потребности, выбор которой определяется задачами дрессировки и особенностями животного.

Как известно, потребность, вызывая мотивированное поведение, активизирует механизмы памяти, способствует сохранению внимания и достаточно долго поддерживает необходимое поведение и общую двигательную активность животного.

Инициировать нужное поведение можно любым способом, однако в оперантной дрессировке наиболее употребимы способы отбора поведения, усиления поведенческого акта или его элемента и наведения. Важно вовремя прекратить применение вспомогательных способов, добиваясь самостоятельности животного.

Введение команды можно осуществить как на втором этапе, так и после отработки необходимого действия.

При оперантном научении подкреплению придается особое значение, так как оно определяет скорость и эффективность научения. При этом учитывают знак, величину, режим и время подкрепления.

Имитационное научение

Имитационным научением или подражанием называют особую форму научения у животных в условиях общения, когда одно животное следует примеру другого.

Различают инстинктивное подражание у животных (взаимную стимуляцию), например, присоединение животных к кормящимся особям, бегство, реакцию следования и т.п.

Настоящее имитационное научение происходит тогда, когда расширяется и обогащается врожденный репертуар поведения путем заимствования чужого опыта, чаще всего подражания детенышей действиям взрослых особей.

Установлено, что животные с первых дней рождения копируют поведение матери по отношению к животным своей стаи, животным другого вида и человеку. Позднее происходит подражание пищедобывательному поведению и оборонительным реакциям.

Ученые давно обратили внимание на эту форму научения. Еще в школе Павлова В.Я. Кряжев (1935) впервые наблюдал условное слюноотделение у собак, после того как они многократно видели, как по сигналу кормят других собак. Сравнивая подражательные условные рефлексы у павианов и собак, М.П.

Штодин (1941) обнаружил, что внешнее торможение этих рефлексов менее выражено у собак, а у павианов больше случаев подражательного угашения рефлексов.

По его мнению подкреплением подражательных условных рефлексов служит вид натурального подкрепления другой особи и кинестезия от движения собственных мышц.

Чаще всего имитационное научение используют для натаски охотничьих собак. Такой способ считается наиболее легким, но замечено: хотя молодые собаки способны копировать все поведение, они легче усваивают отрицательные, с точки зрения человека, навыки. Хотя по свидетельству И.И.

Шидловского (он пишет об этом в своей книге “Cобака-ищейка и розыск с ней” Ленинград, Издание Леноблохотсоюза, 1931) в Саратове и служебных собак милиции “учили по способу «перенимания», заключающегося в том, то все упражнения сначала показывали на работе уже вполне обученных, образцовых собак и в течение недолгого времени обучавшиеся собаки, подражая уже ранее выдрессированным, усваивали первоначальные упражнения по общему послушанию”. Далее он приводит в качестве примера имитационный способ обучения собаки навыку подачи голоса, ссылаясь на известного немецкого дрессировщика того времени Р. Герсбаха: ”на глазах своей собаки подавать команду «голос» другой, уже выдрессированной и после каждой подачи ее хвалить и ласкать”. “Инстинкт подражания и самолюбия, говорит Р. Герсбах, очень скоро заставят вашу собаку дать голос”. Способ хороший, верный, но мы добавим на основании своей практики, что еще лучше и вернее будет, если мы на глазах дрессируемой собаки будем дрессированную за каждую подачу голоса награждать не похвалами и ласками, а какими-либо вкусными кусочками”.

Для обучения методом подражания используют хорошо отдрессированную послушную собаку. Лучшие результаты достигаются при использовании собаки более старшего возраста, живущей совместно с молодой, что связано с доминированием.

Используя эту форму научения при воспитании и дрессировке, в качестве примера подражания желательно использовать знакомую для щенка собаку, спокойную и доброжелательную по отношению к нему. Лучше, если щенок будет демонстрировать по отношению к ней позу подчинения.

Нельзя использовать приемы воздействия на показательную собаку и щенка, вызывающие болевые ощущения и оборонительную реакцию. Показательная собака (собака-актер), не должна демонстрировать страх при выполнении приемов.

Замечено, если “актер” за свой поступок получила поощрение, то ей подражают охотнее, чем в этом случае, если она была наказана. Особенно важно проводить занятия без отвлекающих раздражителей, мешающих наблюдению за показательной собакой и отвлекающих щенка.

Необходимо также, чтобы особь-зритель наблюдала не только последовательность действий, но и их результат (подкрепление), а потребность в получении такого же подкрепления должна быть очень выражена.



Источник: https://infopedia.su/9xd734.html

Методы научения в коммуникации

⇐ ПредыдущаяСтр 7 из 9Следующая ⇒

  • Цель: научиться использовать навыки научения в коммуникативном процессе
  • Учебные элементы: виды научения, классификация научения: реактивные, оперантные и когнитивные формы
  • Студент должен знать: основные виды научения, методы подкрепления
  • Студент должен уметь: применить на практике различные методы научения
  • БЛОК ИНФОРМАЦИИ
  • Научение — это психологический процесс, который раскрывает, как человек приобретает навыки, знания и умения.
  • Виды научения (по Ж.Годфруа)
  • Выработка реактивного поведения:
  • привыкание;
  • сенсибилизация;
  • импринтинг;
  • условный рефлекс.

Выработка оперантного поведения:

  • путем проб и ошибок;
  • формирование реакции;
  • научение путем наблюдения;
  • подражание;
  • викарное научение.

Когнитивные формы научения:

  • латентное научение;
  • обучение сложным навыкам;
  • путем инсайта;
  • путем рассуждения.

Данное занятие посвящено рассмотрению форм научения, которые свойственны как человеку, так и животным, т.е. не требуют участия сознания. К таковым относятся все вышеперечисленные виды кроме формирования сложных навыков и научения путем рассуждения, рассмотрение которых выносится в другие темы.

Виды научения

Три категории научения различаются по степени участия в них организма как целого.

1.Выработка реактивного поведения. При таком научении организм пассивно реагирует на внешние факторы. К этому типу научения относятся:

Читайте также:  Параноидная шизофрения: симптомы, признаки, лечение

а) привыкание (габитуация) – снижение восприимчивости к постоянному или часто повторяющемуся раздражителю. Организм как бы научается игнорировать стимул. Результатом привыкания является, например, то, что повторяющийся раздражитель перестает вызывать ориентировочную реакцию;

б) сенсибилизация – повышение чувствительности к повторяющемуся стимулу. Сенсибилизация участвует в возникновении так называемых «неврозов ожидания» — состояний, когда ожидание повтора раздражителя делает невозможной никакую другую деятельность;

в) импринтинг (запечатление) – установление связи между признаками объекта поведенческим актом.

Процесс импринтинга совершается чрезвычайно быстро (часто при первой же встрече с объектом) и без внешнего подкрепления.

Эта специфическая форма научения свойственна высшим позвоночным и происходит преимущественно на ранних этапах постнатального развития в течение ограниченного сенситивного периода;

г) условный рефлекс – связано с выработкой условных рефлексов при повторении раздражений.

2.Выработка оперантного поведения (оперантное научение). Если в случае реактивного поведения животный организм пассивен, то в случае оперантного (от лат.

оperatio – действие) он активно взаимодействует со средой.

При выработке оперантного поведения вначале имеет место некое действие или движение (направленное или случайное), а закрепление его будет зависеть от последствий этого действия для организма.

К оперантому научению можно отнести следующие разновидности. а) Научение путем проб и ошибок. Человек, столкнувшись с какой-либо проблемной ситуацией, пытается разрешить ее различными способами.

При этом большая часть действий носит случайный, хаотичный характер и является неэффективной. Если проблема оказывается в конце концов разрешена, то в случае повторения ситуации количество неэффективных действий сокращается, поиск решения приобретает более направленный характер.

Чем больше количество проб, тем меньше становится число ошибок.

б) Формирование реакций. Общая закономерность этой разновидности научения та же, что и для предыдущей. Отличие же заключается в том, что подкрепляется не результат поведения в целом, а каждая отдельная реакция, ведущая к нужной форме поведения. Поэтому соответствующий способ обучения носит название «формирование поведения путем последовательных приближений»;

в) Научение путем наблюдения. Этот вид научения может осуществляться путем:

  • подражание модели;
  • викарного научения.

Подражание – это способ научения, при котором субъект воспроизводит действия модели, не всегда понимая их значение. Следствием ранней формы научения является, в частности, перенятие ребенком от своих родителей эмоциональных реакций на некоторые ситуации или объекты.

Викарное научение (от лат. vikarius – заменяющий, замещающий) – усвоение формы поведения другой особи исходя из наблюдаемых последствий этого поведения.

Викарное научение облегчается, если «модель» является «доступной», т.е. моделью служит реальный знакомый или известный человек, и если осуществляемое им поведение представляется возможным повторить.

  1. Виды подкрепления
  2. Подкрепление – всякое воздействие, появление или исчезновение которого повышает вероятность повторения поведенческой реакции.
  3. Виды подкрепления:
  4. 1.а) положительное подкрепление – получение в результате поведения желаемого, приятного;
  5. б) отрицательное подкрепление – имеем место, когда в результате поведенческой реакции индивид имеет возможность избегать неприятного, нежелательного для себя.
  6. 2.а) безусловное (первичное) подкрепление – непосредственное удовлетворение потребности индивида;
  7. б) условное (вторичное) подкрепление – получение «награды», с помощью которой можно получить желаемое (например, денежный гонорар).

3. самоподкрепление, которое может быть положительным или отрицательным. Заключается в том, как сам человек реагирует на свое поведение, какую дает ему оценку. Примерами самоподкрепления могут служить чувство гордости в результате некоторого поступка, ощущение своей силы, компетентности или чувство облегчения при отказе от какой-либо деятельности.

3.Когнитивные формы научения. Осуществляются с участием познавательных процессов: здесь происходит не просто установление ассоциативной связи, но и обработка информации, оценка ситуации, принятие решения.

Виды когнитивного научения:

а) латентное научение представляет собой своеобразную форму научения без подкрепления.

Она заключается в приобретении знаний и навыков, которые до времени не актуализируются: информация просто укладывается в памяти (составляя так называемые «когнитивные карты») с тем, чтобы актуализироваться в случае необходимости.

Эффект этой формы научения сказывается, к примеру, в том, что человек лучше осваивает действие с каким-либо предметом (прибором, инструментом), если прежде ему приходилось манипулировать им (пусть даже без определенной цели).

б) научение путем инсайта. Инсайтом (от англ.

Insight – проникновение, постижение) называется внезапное и невыводимое из прошлого опыта понимание существенных отношений и структуры ситуации в целом, вследствие чего достигается решение проблемы.

Инсайт возможен тогда, когда отдельные элементы и структурные части проблемной ситуации уже знакомы субъекту, а новой является только их связь, комбинация.

в) обучение сложным навыкам. Навык – это действие, сформированное путем повторения, характеризующееся высшей степенью освоения и отсутствием поэтапной сознательной регуляции.

Иногда навыками называют автоматизированные действия, которые сформировались без участия сознания, путем прилаживания (например, навык ходьбы). Такие автоматизмы формируются посредством реактивных и оперантных форм научения.

К данному же виду научения относится осознанное овладение сложным навыком, требующим постановки цели, выработки плана действия и т.д.(формирование навыка подробно рассматривается в курсе педагогической психологии).

г) научение путем рассуждения – это, по сути дела, логическое мышление. Здесь человек исследует условия ситуации, строит гипотезы, усваивает новые понятия.

  • Занятие №7
  • Пcихология врача
  • Цель:дать основные понятия о качествах врача, уметь выделить трудности в профессии врача и методы их преодоления
  • Учебные элементы: личностные качества врача, основные качества врача, профессиональная деформация, адаптация, синдром эмоционального выгорания
  • Студент должен знать: основные качества врача, методы их развития, методы преодоления
  • Студент должен уметь: выявить и преодолеть синдром эмоционального выгорания
  • БЛОК ИНФОРМАЦИИ:

Проникновение в сферу медицинского обслуживания передовых технологий, широкое использование новейшей техники, а так же применение эффективных принципов управления настоятельно требуют учёта личностных факторов, как в процессе профессиональной подготовки, так и на протяжении всего профессионального пути человека во врачебной деятельности.Мотивацию выбора врачебной профессии опреде­лить достаточно трудно и не только потому, что мотива­ции весьма разнообразны.

⇐ Предыдущая123456789Следующая ⇒

Рекомендуемые страницы:

Источник: https://lektsia.com/2x6eb4.html

Научение в результате оперантного обуславливания

  • К оперантному научению можно отнести три разновидности:
  • · научение методом проб и ошибок,
  • · путем формирования реакции
  • · путем наблюдения.
  • Научение методом проб и ошибок
  • При научении методом проб и ошибок индивидуум, встретившись с каким-либо препятствием, совершает попытки преодолеть его и при этом, постепенно отказываясь от неэффективных действий, находит в конце концов решение задачи.

Такой тип научения был открыт Торндайком — одним из первых ученых, заинтересовавшихся процессами научения. В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек. Некоторые клетки открывались в том случае, если животное тянуло за веревку, а в других нужно было приподнять запорный крючок.

Наблюдая за животными, Торндайк заметил, что сначала их действия были чисто случайными, но в конце концов кошка «нечаянно» задевала веревку или крючок, освобождалась и получала вознаграждение. Однако по мере увеличения числа попыток действия животных все больше сосредоточивались вокруг «ключевого» участка клетки, и число ошибок, а также и время, проведенное в клетке, быстро сокращалось.

Торндайк представил эти результаты в виде кривых (рис. 7.4) и вывел закономерности, позволяющие объяснить эффективность такого метода «проб и ошибок».

Согласно важнейшей из этих закономерностей — закону эффекта,- в случае, если какое-то действие приводит к желательным результатам, вероятность его повторения возрастает, а если к нежелательным последствиям — снижается

Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое приобретение новых навыков людьми и домашними животными

Скиннер — признанный вождь американских бихевиористов в последние 30 лет -систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде формируется множество различных типов поведения. При этом Скиннер вскрыл принципы оперантного обусловливания и формирования реакций путем последовательных приближений.

Формирование реакций

С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом — нередко оно формируется в результате отбора под действием подкрепляющего фактора.

Таким фактором может быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление.

Это позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при этом будет подкрепляться.

Исходя из этих соображений, Скиннер разработал способ формирования поведения путем последовательных приближений, составляющий основу оперантного обусловливания.

Этот способ состоит в том, что весь путь от исходного поведения до конечной реакции, которую исследователь стремится выработать у животного, разбивается на несколько этапов.

В дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и таким образом подводить животное к нужной форме поведения. При таком способе обучения животное вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно

Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок.

Далее мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще и повернулся головой к стенке, на которой находится кружок.

На третьем этапе можно, например, давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить вознаграждение.

Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе.

По мнению Скиннера и других бихевиористов, именно так происходит выработка большинства поведенческих реакций у человека. Действительно, можно привести множество примеров, как будто бы частично подтверждающих это.

С позиций Скиннера можно объяснить очень быстрое обучение ребенка первым словам (не распространяя, однако, эту концепцию на освоение языка в целом).

Вначале, когда ребенок еще только начинает произносить какие-то членораздельные звуки, лепет «ме-ме-ме» уже вызывает восторг окружающих, и особенно счастливой мамы, которой уже кажется, что дитя зовет именно ее.

Однако вскоре энтузиазм родителей по поводу таких звуков остывает до тех пор, пока младенец ко всеобщей радости не выговорит «мо … мо». Потом и эти звуки перестают для новорожденного подкрепляться, пока не появится сравнительно членораздельное «мо-мо».

В свою очередь это слово по тем же причинам вскоре сменится сочетанием «мома», и наконец ребенок отчетливо выговорит свое первое слово-«мама». Все же остальные звуки будут восприниматься окружающими лишь как «детский лепет» в буквальном смысле слова, и они постепенно исчезнут из «лексикона» новорожденного.

Источник: https://cyberpedia.su/11x4c24.html

Ссылка на основную публикацию
Adblock
detector