Инструментальное, или оперантное, обусловливание
Не все виды научения можно объяснить классическим обусловливанием. При классическом обусловливании условный и безусловный стимулы предшествуют условной реакции. Но условные связи могут также возникать между реакциями и стимулами, которые следуют за ними, другими словами, между поведением и его последствиями. Например, собака научается «служить», чтобы получить угощение; ребенок научается говорить «пожалуйста», чтобы получить конфетку. Эти реакции являются инструментами для получения какой-то награды. Инструментальное обусловливание – это процедура научения, при которой реакции приводят к награждению или желаемому эффекту.
Принципы инструментального научения открыл американский психолог Э. Трондайк примерно в то время, когда И. П. Павлов проводил эксперименты в России. Животное, обычно голодная кошка, помещалась в специальную клетку, названную «загадкой», и должна была научиться какой-то реакции – например, наступить на маленький рычаг, для того чтобы открыть дверь и выйти наружу. Когда кошке это удавалось, она награждалась пищей и вновь возвращалась в ящик. После нескольких проб кошка спокойно подходила к рычагу, нажимала на него лапой, выходила через открытую дверь и ела.
Формирование реакции происходило путем проб и ошибок, как результат выбора нужного эталона поведения и последующего его закрепления. Научение, согласно Трондайку, управляется законом эффекта. Согласно этому закону, поведение контролируется его результатами и последствиями. Поведение, которое приводит к достижению положительного результата, удовлетворению, закрепляется, и наоборот: не приводящее к положительному результату стирается или ослабляется.
Спустя несколько десятилетий после опубликований работ Трондайка, другой американский психолог, Б. Скиннер, развил его идеи. Б. Скиннер подчеркивал, что при инструментальном обусловливании животное оперирует со средой, производит какое-нибудь движение, воздействует на среду. Поэтому процесс научения этим реакциям он назвал оперантным обусловливанием.
Для изучения оперантного обусловливания Б. Скиннер изобрел экспериментальную камеру, получившую название «скиннеровского ящика». Камера полностью контролируется. Она звуко– и светонепроницаема, в ней поддерживается постоянная температура. Она содержит приспособление, которым животное может оперировать, чтобы получить вознаграждение. Например, крыса, нажимая на рычаг, получает пищу из тонкой трубочки. Скиннеровский ящик позволил изучать отношения между реакцией и ее последствиями и анализировать, как эти последствия влияют на поведение.
Оперантное обусловливание подчеркивает, что поведение есть функция его последствий. Поведение усиливается позитивным или негативным подкреплением; оно ослабляется наказанием.
Позитивное подкрепление – это предъявление стимулов, которые усиливают реакцию. Иными словами, это – награждение. Примером может служить учитель, который хвалит ребенка за прилежную учебу.
Негативное подкрепление – это процесс усиления поведения путем изъятия, удаления негативных стимулов, таких, как боль, скука, избыток тепла или холода и т. п. Примером может служить прием таблетки анальгина при головной боли. Другой пример: пациент, испытывающий страх в метро, может избежать этого переживания, оставшись дома.
Наказание. И позитивное, и негативное подкрепление усиливает частоту реакции. Наказание уменьшает частоту реакции. Часто путают наказание и негативное подкрепление, они совершенно различны. Подкрепление усиливает поведение, а наказание ослабляет его. Если ток выключается, когда крыса нажимает на рычаг, – это негативное подкрепление; оно увеличивает вероятность того, что крыса нажмет на педаль, когда ток снова включат. Но если ток включается, когда крыса нажимает на рычаг, то это наказание; менее вероятно, что крыса снова нажмет на рычаг.
Дискриминационное научение имеет место тогда, когда реакция награждается (или наказывается) в одной ситуации, но не награждается (не наказывается) в другой. В таком случае говорят, что реакция (поведение) находится под «контролем стимула». Этот процесс особенно важен в объяснении гибкости поведения в различных социальных ситуациях. Дискриминация (различение) стимулов позволяет научиться тому, что является подходящим (подкрепляемым) и неподходящим (неподкрепляемым) в данной ситуации. Например, ворчливая жена вряд ли будет бранить мужа в присутствии гостей.
Генерализация состоит в том, что поведение обнаруживается в иных ситуациях, а не только в тех, в которых оно было приобретено. Например, терапевт может помочь пациенту стать более уверенным и экспрессивным во время терапии. Но цель терапии в том, чтобы пациент стал более уверенным в реальных жизненных ситуациях, другими словами, очень важно, чтобы произошла генерализация.
При сравнении классических и оперантных условных рефлексов видно, что, во-первых, классическое обусловливание требует повторного парного предъявления нейтрального стимула (звонок) и стимула, вызывающего врожденную, безусловную реакцию (пища). Обеспечение такого предъявления достигается участием экспериментатора. В экспериментах же с оперантным обусловливанием животное само осуществляет перебор стереотипов поведения, и выбор стереотипа, приводящего к достижению результата, протекает активнее. Во-вторых, оперантные рефлексы контролируются их результатом; в экспериментах же с классическим обусловливанием появление условной реакции контролируется предъявлением предшествующего стимула. В реальной жизни большая часть обучения осуществляется по законам формирования оперантных условных рефлексов.