Армирование - Reinforcement

Глоссарий по зависимости и зависимости
Глоссарий по зависимости и зависимости
	зависимость - биопсихосоциальное расстройство, характеризующееся постоянным употреблением наркотиков (включая алкоголь), несмотря на значительный вред и неблагоприятные последствия; наркотик, вызывающий привыкание - психоактивные вещества, которые при повторном употреблении связаны со значительно более высокими показателями расстройств, связанных с употреблением психоактивных веществ, в значительной степени из-за влияния препарата на системы вознаграждения мозга ; зависимость - адаптивное состояние, связанное с абстинентным синдромом после прекращения многократного воздействия раздражителя (например, приема лекарств); сенсибилизация к лекарствам или обратная толерантность - нарастающий эффект лекарственного средства в результате повторного введения в данной дозе; абстиненция - симптомы, возникающие после прекращения повторного употребления наркотиков; физическая зависимость - зависимость, которая включает стойкие физико- соматические симптомы отмены (например, усталость и алкогольный делирий ); психологическая зависимость - зависимость, которая включает эмоционально-мотивационные симптомы отмены (например, дисфорию и ангедонию ); подкрепляющие стимулы - стимулы, которые увеличивают вероятность повторения сочетанного с ними поведения; Вознаграждающие стимулы - стимулы, которые мозг интерпретирует как положительные и желательные или как нечто, к чему нужно приблизиться; сенсибилизация - усиленный ответ на раздражитель в результате многократного воздействия на него; расстройство, связанное с употреблением психоактивных веществ - состояние, при котором употребление психоактивных веществ приводит к клинически и функционально значимым нарушениям или недомоганию.; толерантность - уменьшение эффекта лекарственного средства в результате повторного приема в данной дозе;
	v; т; е;

Использование бокса Скиннера для изменения поведения испытуемой крысы

В поведенческой психологии , усиление является следствием применяется , что усилит поведение будущего организма всякий раз , когда такое поведение предшествует специфический предшествующее стимул . Этот усиливающий эффект может быть измерен как более высокая частота поведения (например, более частое нажатие на рычаг), более длительная (например, нажатие на рычаг в течение более длительных периодов времени), большая величина (например, нажатие на рычаг с большей силой), или более короткое время ожидания (например, более быстрое нажатие на рычаг после предшествующего стимула). Есть два типа подкрепления, известные как положительное подкрепление и отрицательное подкрепление; положительное - это когда вознаграждение предлагается за проявление желаемого поведения, а отрицательное - это устранение нежелательного элемента в окружении человека всякий раз, когда желаемое поведение достигается. Вознаграждающие стимулы , которые связаны с «желанием» и «симпатией» (желание и удовольствие, соответственно) и аппетитным поведением, действуют как положительные подкрепления ; Верно и обратное утверждение : положительные подкрепления обеспечивают желаемый стимул. Подкрепление не требует от человека сознательного восприятия эффекта, вызванного стимулом. Таким образом, подкрепление происходит только в том случае, если в поведении наблюдается заметное усиление. Однако существует и отрицательное подкрепление, которое характеризуется устранением нежелательного стимула. Смена чьей-либо работы может послужить отрицательным подкреплением для человека, страдающего проблемами со спиной, например, переход с рабочего места на офисную должность.

В большинстве случаев термин «подкрепление» относится к улучшению поведения, но этот термин также иногда используется для обозначения улучшения памяти; например, «подкрепление после тренировки» относится к предоставлению стимула (такого как еда) после учебного сеанса в попытке увеличить сохраняемую широту, детализацию и продолжительность отдельных воспоминаний или только что сформированной памяти в целом. Стимул, улучшающий память, также может быть стимулом, действие которого прямо, а не только косвенно, эмоционально, как в случае с феноменом « флэш-памяти », при котором эмоционально очень интенсивный стимул может стимулировать воспоминания о множестве обстоятельств ситуации, выходящих далеко за пределы подмножества. тех обстоятельств, которые вызвали эмоционально значимый стимул, например, когда люди соответствующего возраста могут вспомнить, где они были и что они делали, когда они узнали об убийстве Джона Ф. Кеннеди или террористических атаках 11 сентября 2001 года .

Подкрепление - важная часть оперантного или инструментального обусловливания .

Терминология

В науках о поведении термины «положительный» и «отрицательный», если они используются в их строгом техническом смысле, относятся к природе действия, выполняемого обусловливающим, а не к оценке этого действия и его последствий (я) отвечающим оперантом. «Положительные» действия - это те, которые добавляют фактор, приятный или неприятный, к окружающей среде, тогда как «отрицательные» действия - это те, которые удаляют или удерживают от окружающей среды фактор любого типа. В свою очередь, строгое значение «подкрепления» относится только к обусловливанию, основанному на вознаграждении; введение неприятных факторов и устранение или удержание приятных факторов вместо этого упоминается как «наказание», которое при использовании в его строгом смысле, таким образом, противоречит «подкреплению». Таким образом, «положительное подкрепление» относится к добавлению приятного фактора, «положительное наказание» относится к добавлению неприятного фактора, «отрицательное подкрепление» относится к устранению или сдерживанию неприятного фактора, а «отрицательное наказание» относится к устранение или удержание приятного фактора.

Такое использование противоречит некоторым нетехническим употреблениям четырех комбинаций терминов, особенно в случае термина «отрицательное подкрепление», которое часто используется для обозначения того, что технический язык описал бы как «положительное наказание» в том смысле, что неприменимое наказание. Техническое употребление интерпретирует «подкрепление» как включающее в себя вознаграждение и наказание, а «отрицательное» - как относящееся к оценке вводимого фактора отвечающим оперантом. Напротив, в технической терминологии используется термин «негативное подкрепление» для описания поощрения данного поведения путем создания сценария, в котором неприятный фактор присутствует или будет присутствовать, но участие в поведении приводит либо к уходу от этого фактора, либо к предотвращению его возникновения. , как в экспериментах Мартина Селигмана с участием собак в процессе обучения предотвращению поражения электрическим током .

Вступление

Б. Ф. Скиннер был известным и влиятельным исследователем, сформулировавшим многие теоретические конструкции подкрепления и бихевиоризма . Скиннер определил подкрепления в соответствии с изменением силы реакции (скорости реакции), а не более субъективными критериями, такими как то, что кому-то доставляет удовольствие или что ценно. Соответственно, действия, еда или предметы, которые считаются приятными или приятными, не обязательно могут быть подкрепляющими (потому что они не вызывают усиления предшествующей реакции). Стимулы, обстановка и действия подходят под определение подкрепления только в том случае, если поведение, которое непосредственно предшествует потенциальному подкреплению, усиливается в аналогичных ситуациях в будущем; например, ребенок, который получает файл cookie, когда он или она просит его. Если частота «запросов cookie» увеличивается, cookie может рассматриваться как усиливающее «поведение запроса cookie». Однако, если "поведение при запросе файлов cookie" не увеличивает, файл cookie не может считаться подкрепляющим.

Единственный критерий, определяющий, является ли стимул подкрепляющим, - это изменение вероятности поведения после введения этого потенциального подкрепления. Другие теории могут фокусироваться на дополнительных факторах, таких как то, ожидал ли человек, что поведение приведет к заданному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью реакции.

Изучение армирования дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральным понятием и процедурой в специальном обучении , прикладном анализе поведения и экспериментальном анализе поведения и является ключевым понятием в некоторых медицинских и психофармакологических моделях, особенно в зависимости , зависимости и принуждения .

Краткая история

Лабораторные исследования подкрепления обычно датируются работами Эдварда Торндайка , известного своими экспериментами с кошками, убегающими из ящиков-головоломок. Ряд других продолжили это исследование, в частности Б. Ф. Скиннер, который опубликовал свою основополагающую работу по этой теме в «Поведении организмов» в 1938 году и развил это исследование во многих последующих публикациях. Примечательно, что Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, говоря, что положительное подкрепление приводит к длительной модификации поведения (долгосрочной), тогда как наказание меняет поведение только временно (краткосрочно) и имеет множество пагубных побочных эффектов. Впоследствии многие исследователи расширили наше понимание подкрепления и поставили под сомнение некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «следствие поведения, которое снижает вероятность такого поведения в будущем», и некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны в изменении поведения. Исследования эффектов положительного подкрепления, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции являются фундаментальными для теории обучения и применимы ко многим практическим приложениям этой теории.

Оперантного кондиционирования

Вымирание

Подкрепление
Повышение поведения

Наказание
Снижение поведения

Положительное подкрепление
Добавьте аппетитный стимул
после правильного поведения

Отрицательное подкрепление

Положительное наказание
Добавить вредный стимул
вслед за поведением

Отрицательное наказание
Устранение аппетитного стимула
вслед за поведением

Побег
Устранение вредных стимулов при
правильном поведении

Активное избегание
Поведение избегает вредных раздражителей

Термин « оперантное кондиционирование» был введен Б. Ф. Скиннером, чтобы указать, что в его экспериментальной парадигме организм может свободно воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемый ответ; экспериментатор ждет ответа (который испускает организм), а затем доставляется потенциальное подкрепление. В классической парадигме обусловливания экспериментатор запускает (вызывает) желаемую реакцию, предъявляя вызывающий рефлекс стимул, Безусловный стимул (UCS), который он объединяет (предшествует) с нейтральным стимулом, Условным стимулом (CS).

Подкрепление - это основной термин оперантного обусловливания. О наказательном аспекте оперантного обусловливания - см. Наказание (психология) .

Положительное подкрепление

Положительное подкрепление происходит, когда желаемое событие или стимул представляется как следствие поведения, и вероятность того, что это поведение проявится в аналогичной среде, увеличивается.

Пример: всякий раз, когда крыса нажимает кнопку, она получает угощение. Если крыса начинает чаще нажимать кнопку, угощение усиливает такое поведение.
Пример: отец дает своей дочери конфеты, когда она убирает свои игрушки. Если частота сбора игрушек увеличивается, конфеты являются положительным стимулом (для усиления поведения уборки).
Пример: компания вводит программу вознаграждений, в которой сотрудники получают призы в зависимости от количества проданных товаров. Награды, которые получают сотрудники, - это положительное подкрепление, если они увеличивают продажи.
Пример: учитель хвалит своего ученика, когда он получает хорошую оценку. Похвала, которую получает ученик, - это положительное подкрепление в случае, если его оценки улучшаются.
Пример: руководитель назначает денежное вознаграждение сотруднику, который больше всего превосходит ожидания. Денежное вознаграждение - это положительное подкрепление хорошего поведения: превышение ожиданий.

Высокая вероятность Instruction (HPI) лечение является Бихевиорист психологического лечения основан на идее положительного подкрепления.

Отрицательное подкрепление

Отрицательное подкрепление возникает, когда скорость поведения увеличивается из-за того, что отталкивающее событие или стимул устранены или предотвращены.

Пример: ребенок убирает свою комнату, и после этого родитель перестает «ныть» или постоянно просит ребенка сделать это. Здесь ворчание отрицательно усиливает поведение при уборке, потому что ребенок хочет убрать этот отталкивающий стимул ворчания.
Пример: в компании действует политика, согласно которой, если сотрудник завершает назначенную ему работу к пятнице, у него может быть выходной в субботу. Рабочая суббота - неприятный стимул; у сотрудников есть стимул повышать производительность, чтобы избежать неприятных стимулов.
Пример: человек рано уходит на работу, чтобы избежать пробок и не опаздывать. Такое поведение заключается в том, что рано уходит на работу, а неприятный стимул, который человек хочет устранить, - это опоздание на работу.

Вымирание

Вымирание может быть преднамеренным или непреднамеренным и происходит, когда нежелательное поведение игнорируется.

Пример (предполагаемый): мальчик игнорирует хулиганов, высмеивающих его. Хулиганы не получают реакции от ребенка и теряют интерес к издевательствам над ним.
Пример (непреднамеренный): работник не получил никакого признания за его сверхурочную тяжелую работу. Затем он перестает так усердно работать.
Пример (предполагаемый): кошка продолжала мяукать в поисках еды ночью. Владельцы не стали кормить кошку, поэтому кошка перестала мяукать всю ночь.

Подкрепление против наказания

Усилители служат для усиления поведения, тогда как каратели служат для ослабления поведения; таким образом, положительные подкрепления - это стимулы, над достижением которых субъект будет стремиться, а отрицательные подкрепления - это стимулы, от которых субъект будет стремиться избавиться или закончить. В таблице ниже показано добавление и вычитание стимулов (приятных или отталкивающих) по отношению к подкреплению и наказанию.

	Вознаграждающий (приятный) стимул	Аверсивный (неприятный) раздражитель
Добавление / представление	Положительное подкрепление	Положительное наказание
Удаление / Унесение	Отрицательное наказание	Отрицательное подкрепление

Например, предложить ребенку конфеты, если он уберет свою комнату, - это положительное подкрепление. Шлепать ребенка, если он разбивает окно, - это положительное наказание. Отнятие детских игрушек за плохое поведение - это отрицательное наказание. Давать ребенку перерыв в работе, если он хорошо справляется с тестом, является отрицательным подкреплением. «Положительное и отрицательное» не несут в этом смысле значения «хорошее и плохое».

Дальнейшие идеи и концепции

Различить положительное и отрицательное бывает сложно и не всегда необходимо; сосредоточение внимания на том , что удаляется или добавляется и как это удаляется или добавляется, определит характер подкрепления.
Отрицательное подкрепление - это не наказание. Эти два, как объяснено выше, отличаются увеличением (отрицательное подкрепление) или уменьшением (наказание) будущей вероятности ответа. При отрицательном подкреплении стимул, удаляемый после реакции, является отталкивающим стимулом; если этот стимул был предъявлен в зависимости от ответа, он также может действовать как положительное наказание.
Форма стимула отличается от его функции с точки зрения того, будет ли он усиливать или наказывать поведение. Событие, которое может наказывать за поведение одних, может способствовать укреплению поведения других. Пример: ребенок неоднократно подвергался задержанию за поведение в школе, но частота плохого поведения увеличивается. Таким образом, задержание может быть подкреплением (может быть положительным или отрицательным); возможно, теперь ребенок получает индивидуальное внимание со стороны учителя или, возможно, он теперь избегает ходить домой, где с ним часто плохо обращаются.
Некоторое подкрепление может быть одновременно положительным и отрицательным, например, наркоман, принимающий лекарства для дополнительной эйфории (положительное чувство) и устранения симптомов отмены (что было бы отрицательным чувством). Или, в теплой комнате, поток внешнего воздуха служит положительным подкреплением, потому что он приятно прохладен, и отрицательным подкреплением, потому что он удаляет неприятный горячий воздух.
Подкрепление в деловом мире имеет важное значение для повышения производительности. Сотрудников постоянно мотивирует возможность получить положительный стимул, например повышение по службе или премию. Сотрудниками также движет отрицательное подкрепление. Это можно увидеть, когда сотрудникам предлагается выходной по субботам, если они завершают еженедельную рабочую нагрузку к пятнице.
Хотя отрицательное подкрепление имеет положительный эффект в краткосрочной перспективе для рабочего места (т. Е. Поощряет финансово выгодное действие), чрезмерная зависимость от отрицательного подкрепления препятствует способности работников действовать творчески, заинтересованно, обеспечивая рост в долгосрочной перспективе.
Как положительное, так и отрицательное подкрепление усиливают поведение. Большинство людей, особенно дети, научатся следовать инструкциям, сочетая положительное и отрицательное подкрепление.
Ограниченные ресурсы могут привести к тому, что человек не сможет обеспечить постоянное подкрепление.

Первичные подкрепления

Первичное подкрепление , иногда называемое безусловное подкреплением , является стимулом , который не требует сопряжений с другим стимулом для того , чтобы функционировать как подкрепление и , скорее всего , получил эту функцию через эволюцию и ее роль в выживании вида. Примеры основных подкреплений включают пищу, воду и секс. Некоторые первичные подкрепления, такие как определенные лекарства, могут имитировать эффекты других основных подкреплений. Хотя эти первичные подкрепления довольно стабильны на протяжении жизни и у разных людей, усиливающая ценность различных основных подкреплений варьируется в зависимости от множества факторов (например, генетики, опыта). Таким образом, один человек может предпочесть один вид пищи, а другой - избегать его. Или один человек может есть много еды, а другой - очень мало. Таким образом, несмотря на то, что пища является основным подкреплением для обоих людей, ценность пищи как подкрепления для них различается.

Вторичные арматуры

Вторичное подкрепление , иногда называют условное подкреплением , является стимулом или ситуация , которая приобрела свою функцию в качестве подкрепления после спаривания с стимулом , который функционирует как подкрепление. Этот стимул может быть основным или другим условным стимулом (например, деньгами). Примером вторичного подкрепления может быть звук кликера, который используется при обучении с помощью кликера . Звук кликера ассоциируется с похвалой или угощением, и впоследствии звук кликера может выступать в качестве поощрения. Другой распространенный пример - звук людей, хлопающих в ладоши - в том, чтобы слышать этот звук, нет ничего положительного, но мы узнали, что он связан с похвалой и вознаграждением.

Пытаясь различить первичные и вторичные подкрепления на примере людей, используйте «тест пещерного человека». Если стимул - это то, что пещерный человек естественным образом сочтет желательным (например, леденец), то он является основным подкреплением. Если, с другой стороны, пещерный человек не отреагирует на это (например, долларовая купюра), это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать удовлетворение и депривацию от вторичных подкреплений.

Прочие условия армирования

Обобщенное подкрепление - это условное подкрепление, которое приобрело подкрепляющую функцию в сочетании со многими другими подкрепляющими элементами и действует как подкрепление при большом разнообразии мотивирующих операций . (Одним из примеров этого являются деньги, потому что они сочетаются со многими другими подкреплениями).
При отборе проб подкрепления организму предъявляется потенциально подкрепляющий, но незнакомый стимул безотносительно к предыдущему поведению.
Социально-опосредованное подкрепление (прямое подкрепление) включает в себя предоставление подкрепления, которое требует поведения другого организма.
Принцип Премака - это частный случай подкрепления, разработанный Дэвидом Премаком , который утверждает, что наиболее предпочтительное действие может эффективно использоваться в качестве подкрепления для менее предпочтительного действия.
Иерархия подкрепления - это список действий, в котором от наиболее желательных до наименее желаемых последствий, которые могут служить подкреплением. Иерархия подкрепления может использоваться для определения относительной частоты и желательности различных действий и часто применяется при применении принципа Премака.
Условные результаты с большей вероятностью будут подкреплять поведение, чем непредвиденные реакции. Случайные результаты - это те, которые напрямую связаны с причинным поведением, например, включение света зависит от щелчка переключателя. Обратите внимание, что условные результаты не являются необходимыми для демонстрации подкрепления, но предполагаемые непредвиденные обстоятельства могут улучшить обучение.
Смежные стимулы - это стимулы, тесно связанные во времени и пространстве с определенным поведением. Они сокращают время, необходимое для изучения поведения, увеличивая его устойчивость к исчезновению . Если дать собаке кусок еды сразу после того, как она села, это больше связано с поведением (и, следовательно, с большей вероятностью подкрепит), чем задержка в несколько минут в доставке еды вслед за поведением.
Неконтролируемое подкрепление относится к независимой от ответа доставке стимулов, определенных как подкрепление для некоторых форм поведения этого организма. Однако это обычно влечет за собой доставку стимулов, определяемых как поддержание аберрантного поведения, на временной основе, что снижает скорость целевого поведения. Поскольку никакое измеряемое поведение не идентифицируется как подкрепляемое, существует разногласие по поводу использования термина «непредвиденное« подкрепление ».

Натуральный и искусственный

В своей работе 1967 года, произвольное и природное Армирование , Карл Ферстер предложил классификацию арматуры в событие, увеличение частота на оперантноге как естественное следствие самого поведения, а также события, которые предположительно влияет на частоту их потребности человеческого посредничества, например, в лексема экономика , где субъекты «вознаграждены» за определенное поведение с произвольным знаком оборотном значения.

В 1970 году Баер и Вольф придумали название для использования естественных усилителей, названных «ловушками поведения». Поведенческая ловушка требует только простой реакции, чтобы попасть в ловушку, но после попадания в ловушку невозможно сопротивляться, вызывая общее изменение поведения. Это использование поведенческой ловушки, которая увеличивает репертуар человека, подвергая его естественному усилению этого поведения. У поведенческих ловушек есть четыре характеристики:

Их «заманивают» практически непреодолимыми подкреплениями, которые «заманивают» ученика в ловушку.
Чтобы попасть в ловушку, необходим лишь легкий ответ, уже включенный в репертуар.
Взаимосвязанные обстоятельства подкрепления внутри ловушки мотивируют человека приобретать, расширять и поддерживать целевые академические / социальные навыки
Они могут оставаться эффективными в течение длительных периодов времени, потому что человек не проявляет почти никакого эффекта насыщения.

Как видно из вышеизложенного, искусственное подкрепление на самом деле создается для формирования или развития навыков, и, в общем, важно, чтобы либо вводилась поведенческая ловушка, чтобы «захватить» навык, либо использовать естественное подкрепление для его поддержания или повышения. . Эта поведенческая ловушка может быть просто социальной ситуацией, которая обычно возникает в результате определенного поведения, если оно соответствует определенному критерию (например, если вы используете съедобные подкрепления, чтобы научить человека здороваться и улыбаться людям, когда они их встречают, после этого навык, естественное подкрепление для других людей улыбаются, и более дружеское общение естественным образом укрепит навык, и еда может исчезнуть).

График прерывистого подкрепления

Большая часть поведения не подкрепляется каждый раз, когда оно испускается, и модель прерывистого подкрепления сильно влияет на то, как быстро изучается оперантный ответ, какова его скорость в любой момент времени и как долго она продолжается, когда подкрепление прекращается. Простейшие правила, управляющие подкреплением, - это непрерывное подкрепление, когда подкрепляется каждый ответ, и угашение, когда подкрепление отсутствует. Между этими крайностями более сложные «графики подкрепления» определяют правила, определяющие, как и когда за ответом последует подкрепление.

Определенные графики подкрепления надежно вызывают определенные паттерны реакции, независимо от исследуемых видов (включая людей в некоторых условиях). Однако количественные свойства поведения в рамках данного расписания зависят от параметров расписания, а иногда и от других факторов, не связанных с расписанием. Упорядоченность и предсказуемость поведения в соответствии с графиками подкрепления были доказательством утверждения Б. Ф. Скиннера о том, что, используя оперантное обусловливание, он мог получить «контроль над поведением», что сделало теоретические споры современной сравнительной психологии устаревшими. Надежность контроля расписания поддерживала идею о том, что радикальный бихевиористский экспериментальный анализ поведения может стать основой психологии, которая не имеет отношения к ментальным или когнитивным процессам. Надежность расписаний также привела к развитию прикладного анализа поведения как средства контроля или изменения поведения.

Многие из более простых возможностей и некоторые из более сложных были подробно исследованы Скиннером с использованием голубей , но новые расписания продолжают определяться и исследоваться.

Простые графики

Диаграмма, демонстрирующая различную скорость реакции четырех простых графиков подкрепления, каждая штриховка обозначает данное подкрепление.

График соотношения - подкрепление зависит только от количества ответов, которые совершил организм.
Непрерывное подкрепление (CRF) - график подкрепления, в котором за каждым появлением инструментальной реакции (желаемой реакции) следует подкрепление.
- Лабораторный пример: каждый раз, когда крыса нажимает на брусок, она получает шарик с кормом.
- Пример из реального мира: каждый раз, когда собака испражняется, хозяин угощает ее; Каждый раз, когда человек кладет 1 доллар в автомат с конфетами и нажимает кнопки, он получает шоколадный батончик.

В простых расписаниях есть одно правило, определяющее, когда один тип поощрения доставляется для определенного ответа.

Фиксированное соотношение (FR) - графики доставки подкрепления после каждого n- го ответа. Расписание FR 1 является синонимом расписания CRF.
- Пример: FR 2 = каждая секунда желаемого ответа, которую делает субъект, подкрепляется.
- Лабораторный пример: FR 5 = поведение крысы при нажатии на планку подкрепляется пищей после каждых 5 нажатий на планку в коробке Скиннера .
- Пример из реальной жизни: FR 10 = Продавец подержанных автомобилей получает бонус в размере 1000 долларов США за каждые 10 автомобилей, проданных на лоте.
График с переменным соотношением (VR) - усиливается в среднем каждый n- й ответ, но не всегда при n- м ответе.
- Лабораторный пример: VR 4 = первая таблетка доставляется на прессах с 2 барами, вторая таблетка доставляется на прессы с 6 барами, третья пеллета подается на прессы с 4 барами (2 + 6 + 4 = 12; 12/3 = прессы с 4 барами для приема пеллет).
- Пример из реальной жизни: игровые автоматы (поскольку, хотя вероятность выиграть джекпот постоянна, количество нажатий на рычаг, необходимое для того, чтобы сорвать джекпот, варьируется).
Фиксированный интервал (FI) - усиливается через n промежутков времени.
- Пример: FI 1-s = усиление предусмотрено для первого ответа через 1 секунду.
- Лабораторный пример: FI 15-s = поведение крысы при нажатии на стержень усиливается при первом нажатии на стержень через 15 секунд после последнего подкрепления.
- Реальный пример: FI 30 мин = 30-минутный цикл стиральной машины.
Переменный интервал (VI) - усиливается в среднем за n
периодов
времени, но не всегда точно за n
отрезков
времени.

Пример: VI 4-min = первая гранула доставлена через 2 минуты, вторая - через 6 минут, третья - через 4 минуты (2 + 6 + 4 = 12; 12/3 = 4). Армирование доставляется в среднем через 4 минуты.

Лабораторный пример: VI 10-s = поведение крысы при нажатии на планку усиливается при первом нажатии на планку после прохождения в среднем 10 секунд с момента последнего подкрепления.

Пример из реальной жизни: VI 30-min = Отправляясь на рыбалку - вы можете поймать рыбу через 10 минут, затем подождать час, а затем подождать 20 минут.
Фиксированное время (FT) - Обеспечивает подкрепляющий стимул в фиксированное время с момента последней доставки подкрепления, независимо от того, ответил субъект или нет. Другими словами, это безусловный график.
- Лабораторный пример: FT 5-s = крыса получает корм каждые 5 секунд независимо от поведения.
- Пример из реальной жизни: FT 30-d = человек получает аннуитетный чек каждый месяц независимо от поведения между чеками.
Переменное время (VT) - Обеспечивает подкрепление в среднем переменное время с момента последнего подкрепления, независимо от того, ответил субъект или нет.

Простые графики используются во многих процедурах дифференциального подкрепления:

Дифференциальное подкрепление альтернативного поведения (DRA) - процедура обуславливания, в которой нежелательная реакция снижается путем ее исчезновения или, что реже, условного наказания, одновременно обеспечивая подкрепление, зависящее от желаемой реакции. Примером может служить учитель, который обращается к ученику только тогда, когда он поднимает руку, и игнорирует ученика, когда он или она кричит.
Дифференциальное подкрепление другого поведения (DRO) - также известное как процедуры обучения бездействию, инструментальная процедура кондиционирования, в которой положительное подкрепление периодически доставляется только в том случае, если участник делает что-то, кроме целевой реакции. Примером может служить усиление любых действий руками, кроме ковыряния в носу.
Дифференциальное подкрепление несовместимого поведения (DRI) - используется для уменьшения частого поведения без наказания за счет усиления несовместимого ответа. Примером может служить усиление хлопков в ладоши, чтобы уменьшить ковыряние в носу.
Дифференциальное усиление низкой скорости ответа (DRL) - используется для поощрения низкой скорости ответа. Это похоже на расписание с интервалом, за исключением того, что преждевременные ответы сбрасывают время, необходимое между поведением.
- Лабораторный пример: DRL 10-s = крыса получает подкрепление для первого ответа через 10 секунд, но если крыса отвечает раньше, чем через 10 секунд, подкрепления нет, и крыса должна ждать 10 секунд после этого преждевременного ответа без другого ответа до бара нажатие приведет к армированию.
- Пример из реальной жизни: «Если вы попросите у меня картофельные чипсы не чаще, чем раз в 10 минут, я дам их вам. Если вы будете просить чаще, я не дам вам ничего».
Дифференциальное усиление высокой скорости (DRH) - используется для увеличения высокой скорости ответа. Это похоже на расписание с интервалом, за исключением того, что в интервале требуется минимальное количество ответов, чтобы получить подкрепление.
- Лабораторный пример: DRH 10-s / FR 15 = крыса должна нажать на гриф 15 раз с шагом в 10 секунд, чтобы получить подкрепление.
- Пример из реальной жизни: «Если Лэнс Армстронг собирается выиграть Тур де Франс, он должен крутить педали x раз за y- часовую гонку».

Эффекты разных типов простых графиков

Фиксированное соотношение: активность замедляется после доставки подкрепления, затем скорость реакции увеличивается до следующей доставки подкрепления (пауза после подкрепления).
Переменное соотношение: быстрое и устойчивое реагирование; наиболее устойчивы к исчезновению .
Фиксированный интервал: количество ответов увеличивается к концу интервала; плохая устойчивость к исчезновению.
Переменный интервал: стабильные результаты деятельности, хорошая устойчивость к исчезновению.
Графики соотношения дают более высокую скорость реагирования, чем графики интервалов, когда в остальном показатели подкрепления схожи.
Изменяющиеся графики дают более высокие показатели и большую сопротивляемость исчезновению, чем большинство фиксированных графиков. Это также известно как эффект угасания частичного подкрепления (PREE).
График с переменным соотношением дает как самую высокую скорость отклика, так и самое большое сопротивление вымиранию (например, поведение игроков на игровых автоматах ).
Фиксированные расписания создают «паузы после подкрепления» (PRP), когда ответы на короткое время прекращаются сразу после подкрепления, хотя пауза является функцией предстоящего требования ответа, а не предыдущего подкрепления.
- PRP расписания с фиксированным интервалом часто сопровождается ускоряющейся скоростью реакции «гребешком», в то время как расписания с фиксированным соотношением дают более «угловатую» реакцию.
  - гребешок с фиксированным интервалом: паттерн реагирования, развивающийся при фиксированном графике подкрепления с интервалом, производительность на фиксированном интервале отражает точность подсчета времени испытуемым.
Организмы, чьи графики подкрепления «истончены» (то есть требуют большего количества ответов или большего ожидания перед подкреплением), могут испытывать «относительную деформацию», если истончены слишком быстро. Это приводит к поведению, аналогичному тому, что было во время вымирания.
- Деформация соотношения: нарушение реакции, которое происходит, когда требование к реакции фиксированного соотношения увеличивается слишком быстро.
- Прогон соотношения: высокая и устойчивая скорость отклика, удовлетворяющая каждому требованию соотношения. Обычно требование более высокого соотношения вызывает более длительные паузы после армирования.
Графики частичного армирования более устойчивы к исчезновению, чем графики непрерывного армирования.
- Графики соотношений более устойчивы, чем графики интервалов, а графики переменных более устойчивы, чем фиксированные.
- Мгновенные изменения ценности подкрепления приводят к динамическим изменениям в поведении.

Составные графики

Составные расписания объединяют два или более разных простых расписания тем или иным образом с использованием одного и того же поощрения для одного и того же поведения. Есть много возможностей; среди наиболее часто используемых:

Альтернативные расписания - тип составного расписания, в котором действуют два или более простых расписания, и в зависимости от того, какое расписание будет выполнено первым, вы получите подкрепление.
Конъюнктивные расписания - сложный график подкрепления, в котором два или более простых расписания действуют независимо друг от друга, и для подкрепления должны выполняться требования ко всем простым расписаниям.
Множественные расписания - два или более расписания чередуются с течением времени, со стимулом, указывающим, какой из них действует. Подкрепление доставляется, если требование ответа выполнено, пока действует график.
- Пример: FR4 по свистку и FI6 по звонку.
Смешанные расписания - два или более расписания могут иметь место без каких-либо стимулов, указывающих на то, какой из них действует. Подкрепление доставляется, если требование ответа выполняется во время действия расписания.
- Пример: FI6, а затем VR3 без какого-либо стимула, предупреждающего об изменении расписания.
Одновременное администрирование двух графиков подкрепления

Параллельные графики - сложная процедура подкрепления, в которой участник может выбрать любой из двух или более простых графиков подкрепления, доступных одновременно. Организмы могут свободно переключаться между вариантами ответа в любое время.
- Пример из реальной жизни: переключение каналов на телевизоре.
График подкрепления в параллельной цепи - сложная процедура подкрепления, в которой участнику разрешается выбирать во время первого звена, какой из нескольких простых расписаний подкрепления будет действовать во втором звене. После того, как выбор сделан, отклоненные альтернативы становятся недоступными до начала следующего испытания.
Взаимосвязанные расписания - единое расписание с двумя компонентами, где прогресс в одном компоненте влияет на прогресс в другом компоненте. В блокирующем расписании FR 60 FI 120, например, каждый ответ вычитает время из компонента интервала, так что каждый ответ «равен» удалению двух секунд из расписания FI.
Связанные расписания - подкрепление происходит после того, как два или более последовательных расписания были выполнены, со стимулом, указывающим, когда одно расписание было завершено, а следующее началось.
- Пример: по расписанию FR 10 при наличии красного света голубь 10 раз клюет зеленый диск; затем желтый свет указывает на то, что расписание FR 3 активно; после того, как голубь 3 раза клюнет желтый диск, загорится зеленый свет, означающий, что действует 6-секундный график VI; если бы это было последнее расписание в цепочке, голубь был бы подкреплен за клевание зеленого диска по расписанию VI 6 с; однако все требования к расписанию в цепочке должны быть выполнены, прежде чем будет предоставлено подкрепление.
Тандемные расписания - подкрепление происходит, когда два или более последовательных требования расписания были выполнены, без каких-либо стимулов, указывающих, когда расписание было завершено и началось следующее.
- Пример: VR 10, после его завершения расписание изменяется без предупреждения на FR 10, после этого оно изменяется без предупреждения на FR 16 и т. Д. В конце серии расписаний, наконец, дается поощрение.
Графики высшего порядка - выполнение одного графика подкрепляется вторым графиком; например, в FR2 (FI10 секунд) два последовательных расписания с фиксированными интервалами требуют завершения, прежде чем ответ будет усилен.

Наложенные графики

Психологии термин наложенных графики армирования относится к структуре вознаграждения , где две или более простые графики арматур работают одновременно. Подкрепления могут быть положительными, отрицательными или и тем, и другим. Примером может служить человек, который приходит домой после долгого рабочего дня. Поведение при открытии входной двери награждается большим поцелуем в губы супругом человека и разрывом штанов от восторженно прыгающей семейной собаки. Другой пример наложенных графиков подкрепления - голубь в экспериментальной клетке, клюющий кнопку. Клевки доставляют зерно в бункер каждые 20 клевков, а доступ к воде - после каждых 200 клевков.

Наложенные графики армирования являются типом соединения графики , который эволюционировал от первоначальной работы на простых графиках подкрепления со стороны Б. Ф. Скиннером и его коллегами (Skinner и Ферстером, 1957). Они продемонстрировали, что подкрепления можно доставлять по расписанию, а также что организмы по-разному ведут себя в разных расписаниях. Вместо поощрения, такого как еда или вода, которое доставляется каждый раз в результате какого-либо поведения, поощрение может быть доставлено после более чем одного случая такого поведения. Например, от голубя может потребоваться десять раз клюнуть кнопочный выключатель, прежде чем появится еда. Это «график соотношений». Кроме того, поощрение может быть доставлено по прошествии определенного промежутка времени после целевого поведения. Примером может служить крыса , которой дают гранулу корма сразу после первой реакции, которая происходит по прошествии двух минут с момента последнего нажатия на рычаг. Это называется «интервальным расписанием».

Кроме того, графики соотношений могут обеспечивать подкрепление после фиксированного или переменного количества поведений отдельного организма. Точно так же интервальные графики могут обеспечивать подкрепление через фиксированные или переменные интервалы времени после единственной реакции организма. Индивидуальное поведение, как правило, вызывает частоту реакции, которая различается в зависимости от того, как создается график подкрепления. Многие последующие исследования, проведенные во многих лабораториях, изучали влияние на поведение подкреплений по расписанию.

Если организму предоставляется возможность выбирать между двумя или более простыми схемами подкрепления одновременно, структура подкрепления называется «параллельным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек , например, когда люди чрезмерно вылавливают свои промыслы или уничтожают свои тропические леса. Брехнер создал ситуацию, когда простые схемы подкрепления накладывались друг на друга. Другими словами, единичный ответ или группа ответов организма приводили к множеству последствий. Параллельные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили эту концепцию, чтобы описать, как наложенные графики и аналогию с социальной ловушкой можно использовать для анализа того, как энергия течет через системы .

Наложенные графики подкрепления имеют множество реальных применений в дополнение к созданию социальных ловушек . Можно создать множество различных человеческих индивидуальных и социальных ситуаций, наложив простые графики подкрепления. Например, человек может одновременно иметь табачную и алкогольную зависимость. Можно создать или смоделировать еще более сложные ситуации, наложив два или более параллельных расписания. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время у него есть выбор пойти в армию или военно-воздушные силы и одновременно выбрать работу в интернет-компании или работа в софтверной компании. Это структура армирования из трех наложенных параллельных графиков армирования.

Наложенные графики подкрепления могут создать три классические конфликтные ситуации (конфликт подхода-подхода, конфликт подхода-избегания и конфликт избегания-избегания), описанных Куртом Левином (1935), и могут операционализировать другие левинистские ситуации, проанализированные его анализом силового поля . Другими примерами использования наложенных графиков подкрепления в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам, связанным с контролем арендной платы (Brechner, 2003), и проблема сброса токсичных отходов в ливневую канализационную систему округа Лос-Анджелес (Brechner, 2010).

Параллельные расписания

В оперантном обусловливании параллельные графики подкрепления - это графики подкрепления, которые одновременно доступны животному-субъекту или участнику-человеку, так что субъект или участник могут реагировать по любому графику. Например, в задаче принудительного выбора с двумя альтернативами голубь в ящике Скиннера сталкивается с двумя клевыми ключами; Ответы клевания могут быть даны в любом случае, и пищевое подкрепление может последовать за клеванием в любом из них. Графики армирования клювов на два ключа могут быть разными. Они могут быть независимыми, или они могут быть связаны так, что поведение по одному ключу влияет на вероятность подкрепления по другому.

Нет необходимости, чтобы ответы на двух графиках были физически разными. В альтернативном способе организации параллельных расписаний, введенном Финдли в 1958 году, оба расписания располагаются на одной клавише или другом устройстве ответа, и субъект может реагировать на вторую клавишу, чтобы переключаться между расписаниями. В такой «параллельной» процедуре Финдли стимул (например, цвет основного ключа) сигнализирует о том, какое расписание действует.

Параллельные расписания часто вызывают быстрое переключение клавиш. Чтобы предотвратить это, обычно вводится «задержка переключения»: каждое расписание деактивируется на короткий период после того, как субъект переключается на него.

Когда оба параллельных расписания являются переменными интервалами , количественная связь, известная как закон соответствия, обнаруживается между относительной скоростью отклика в двух расписаниях и относительной скоростью подкрепления, которую они обеспечивают; это впервые наблюдал Р. Дж. Хернстайн в 1961 году. Закон соответствия - это правило инструментального поведения, которое гласит, что относительная скорость реакции на конкретную альтернативу реакции равна относительной скорости подкрепления для этой реакции (скорость поведения = скорость подкрепления). Животные и люди имеют тенденцию выбирать в расписании.

Формирование

Формирование - это усиление последовательных приближений к желаемому инструментальному отклику. Например, при обучении крысы нажимать на рычаг сначала усиливается простой поворот к рычагу. Тогда только поворот и шаг к нему усиливается. Результаты одного набора поведений запускают процесс формирования следующего набора поведений, а результаты этого набора подготавливают процесс формирования следующего набора и т. Д. По мере того, как обучение прогрессирует, усиленная реакция становится все более похожей на желаемое поведение; каждое последующее поведение становится более близким приближением к окончательному поведению.

Цепочка

Цепочка включает в себя соединение дискретных поведений в серию, так что каждый результат каждого поведения является как подкреплением (или следствием) для предыдущего поведения, так и стимулами (или антецедентом) для следующего поведения. Существует множество способов обучения цепочке, например прямая цепочка (начиная с первого поведения в цепочке), обратная цепочка (начиная с последнего поведения) и полная цепочка задач (при которой все поведение обучается от начала до конца, а точнее. чем как последовательность шагов). Пример - открытие запертой двери. Сначала вставляется ключ, потом поворачивается, потом открывается дверь.

Прямая цепочка научит субъекта сначала вставлять ключ. Как только эта задача будет освоена, их просят вставить ключ и учат его поворачивать. Как только эта задача будет освоена, их просят выполнить первые два, а затем учат открывать дверь. Обратная цепочка предполагает, что учитель сначала вставляет и поворачивает ключ, а затем испытуемого учат открывать дверь. Как только это усвоено, учитель вставляет ключ, и испытуемого учат его поворачивать, затем он открывает дверь в качестве следующего шага. Наконец, испытуемого учат вставлять ключ, и они поворачиваются и открывают дверь. Как только первый шаг освоен, вся задача усвоена. Полная цепочка задач предполагает обучение всей задаче как единой серии с подсказками на всех этапах. Подсказки блекнут (уменьшаются) на каждом шаге по мере освоения.

Убедительное общение и теория подкрепления

Убедительное общение: Убеждение влияет на то, как они думают, действуют и чувствуют. Навык убеждения говорит о том, как люди понимают заботу, положение и потребности людей. Убеждение можно разделить на неформальное убеждение и формальное убеждение.
Неформальное убеждение: Это говорит о том, как человек взаимодействует с коллегами и клиентами. Неформальное убеждение можно использовать в команде, в служебных записках, а также в электронных письмах.
Формальное убеждение: Этот тип убеждения используется при написании письма клиента, предложения, а также для формального представления любому клиенту или коллегам.
Процесс убеждения: Убеждение относится к тому, как вы влияете на людей своими навыками, опытом, знаниями, лидерскими качествами и возможностями команды. Убеждение - это интерактивный процесс, при котором работа выполняется другими. Вот примеры, для которых вы можете использовать навыки убеждения в реальном времени. Собеседование: вы сможете доказать свои лучшие таланты, навыки и знания. Клиенты: направлять ваших клиентов для достижения целей или задач. Заметки: чтобы выразить свои идеи и взгляды коллегам по улучшению работы. Идентификация сопротивления и позитивное отношение - жизненно важные роли убеждения.

Убеждение - это форма человеческого взаимодействия. Это происходит, когда один человек ожидает определенного ответа от одного или нескольких других лиц и намеренно стремится обеспечить ответ с помощью коммуникации. Коммуникатор должен понимать, что разные группы имеют разные ценности.

В ситуациях инструментального обучения, которые связаны с оперантным поведением, убедительный коммуникатор представляет свое сообщение, а затем ждет, пока получатель сделает правильный ответ. Как только получатель ответит, коммуникатор попытается исправить ответ соответствующим вознаграждением или подкреплением.

В условных обучающих ситуациях, когда есть поведение респондента, коммуникатор представляет свое сообщение так, чтобы вызвать желаемый ему ответ от получателя, и стимул, который первоначально служил для того, чтобы вызвать ответ, затем становится подкрепляющим или вознаграждающим элементом в обусловливании.

Математические модели

Проделана большая работа по построению математической модели армирования. Эта модель известна как MPR, сокращение от математических принципов армирования . Питер Киллин сделал ключевые открытия в этой области, изучая голубей.

Критика

Стандартное определение поведенческого подкрепления критиковалось как круговое , поскольку оно, по-видимому, утверждает, что сила реакции увеличивается за счет подкрепления, и определяет подкрепление как нечто, что увеличивает силу реакции (т. Е. Сила реакции увеличивается за счет вещей, которые увеличивают силу реакции). Однако правильное использование подкрепления состоит в том, что что-то является подкреплением из- за своего воздействия на поведение, а не наоборот. Он становится круговым, если кто-то говорит, что определенный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул оказывает такое влияние на поведение. Были предложены и другие определения, такие как «непревзойденное поведение, зависящее от реакции» Ф. Д. Шеффилда, но они не нашли широкого применения в психологии.

Понимание роли подкреплений все больше уходит от «усиливающего» эффекта к «сигнальному». То есть мнение, что подкрепления усиливают реакцию, потому что они сигнализируют о поведении, которое может привести к подкреплению. Хотя в большинстве практических приложений эффект любого данного подкрепления будет одинаковым, независимо от того, является ли подкрепление сигналом или укрепляющим, этот подход помогает объяснить ряд поведенческих явлений, включая шаблоны реагирования на периодические графики подкрепления (гребешки с фиксированным интервалом) и дифференциальный эффект результатов .

История терминов

В 1920-х годах русский физиолог Иван Павлов, возможно, был первым, кто использовал слово « подкрепление» в отношении поведения, но (согласно Динсмору ) он использовал его приблизительное русское родственное слово умеренно, и даже тогда оно относилось к усилению уже усвоенной, но ослабляющей реакции. . Он не использовал его, как сегодня, для выбора и укрепления новых моделей поведения. Введение Павлова слова « вымирание» примерно соответствует сегодняшнему психологическому употреблению.

В популярном использовании положительное подкрепление часто используется как синоним вознаграждения , при этом люди (а не поведение), таким образом, «подкрепляются», но это противоречит последовательному техническому использованию этого термина, поскольку это измерение поведения, а не человека. , который усилен. Негативное подкрепление часто используется непрофессионалами и даже социологами вне психологии как синоним наказания . Это противоречит современному техническому использованию, но именно Б. Ф. Скиннер впервые применил это в своей книге 1938 года. К 1953 году, однако, он вслед за другими использовал слово « наказание» и использовал отрицательное подкрепление для устранения отвратительных стимулов.

Есть некоторые в области анализа поведения, которые предположили, что термины «положительный» и «отрицательный» представляют собой ненужное различие при обсуждении подкрепления, поскольку часто неясно, удаляются ли стимулы или предъявляются. Например, Ивата задает вопрос: «... является ли изменение температуры более точным проявлением холода (тепла) или отводом тепла (холода)?» Таким образом, подкрепление можно концептуализировать как состояние до изменения, замененное условием после изменения, которое усиливает поведение, которое последовало за изменением условий стимула.

Приложения

Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены несколько примеров.

Зависимость и зависимость

Положительное и отрицательное подкрепление играют центральную роль в развитии и сохранении зависимости и наркотической зависимости . Наркотик, вызывающий привыкание, по своей сути полезен ; то есть он действует как основной положительный стимул к употреблению наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. Е. «Желательно» или «желательно»), так что по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком. Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу и может стать условным положительным подкреплением при продолжении употребления. Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимулов, вызывающего рецидив при виде стимулов, изображенных на плакатах.

У наркозависимых людей отрицательное подкрепление возникает, когда лекарство вводится самостоятельно , чтобы облегчить или «избежать» симптомов физической зависимости (например, тремора и потливости) и / или психологической зависимости (например, ангедонии , беспокойства, раздражительности и т. Д.). тревога), возникающие во время отмены препарата .

Дрессировка животных

Курица катается на скейтборде

Дрессировщики и владельцы домашних животных применяли принципы и практики оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ярких и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: наличие немедленного подкрепления (например, вездесущий мешок собачьих вкусняшек); случайность, гарантирующая, что подкрепление следует за желаемым поведением, а не за чем-то другим; использование вторичного подкрепления, например, при прозвонке кликера сразу после желаемого ответа; формирование, как в постепенном приучении собаки прыгать все выше и выше; периодическое подкрепление, уменьшающее частоту этих вкусняшек, чтобы вызвать стойкое поведение без насыщения; цепочка, где постепенно складывается сложное поведение.

Поведение ребенка - тренинг для родителей

Обеспечение положительного подкрепления правильного поведения ребенка является одним из основных направлений обучения родителей управлению. Как правило, родители учатся вознаграждать за соответствующее поведение социальными поощрениями (такими как похвала, улыбки и объятия), а также конкретными наградами (например, наклейками или указаниями на более крупное вознаграждение в рамках системы стимулов, созданной совместно с ребенком). Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»). Они также могут использовать косвенные вознаграждения, например, в виде диаграмм прогресса . Положительное подкрепление в классе может быть полезно для успеха учащихся. Применяя позитивное подкрепление к учащимся, очень важно сделать его индивидуальным для потребностей этого учащегося. Таким образом, ученик понимает, почему он получает похвалу, он может принять ее и, в конечном итоге, научиться продолжать действие, которое было заработано положительным подкреплением. Например, использование поощрений или дополнительных перерывов может относиться к некоторым студентам больше, в то время как другие могут согласиться с принуждением, получив стикеры или галочки, указывающие на похвалу.

Экономика

И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «эластичностью спроса по цене». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как на бензин и другие предметы первой необходимости изменения цен могут в меньшей степени повлиять. С точки зрения оперантного анализа, такие эффекты можно интерпретировать с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов.

Азартные игры - расписание с переменным соотношением

Как говорилось ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно обеспечивает быструю и настойчивую реакцию. Игровые автоматы рассчитываются по графику с переменным соотношением, и они вызывают у игроков именно такое упорное маневрирование. Поскольку автоматы запрограммированы на выплату меньше денег, чем они получают, постоянный пользователь игровых автоматов неизменно проигрывает в долгосрочной перспективе. Игровые автоматы и, следовательно, подкрепление с переменным соотношением сторон часто называют фактором, лежащим в основе зависимости от азартных игр.

Управление поведением в организациях

Альтернатива традиционным схемам поощрения за результативность, основанная на теории подкрепления, известная как OB Mod Approach, была предложена в качестве практического подхода к управлению поведением членов организации, связанным с производительностью. . OB Мод. эмпирически было показано, что его принцип «усиление в обмен на эффективность» приводит к повышению производительности как в производственных, так и в обслуживающих организациях, хотя улучшения варьировались в зависимости от типа подкрепления в обоих контекстах.

Теория подталкивания

Теория подталкивания (или подталкивания) - это концепция в поведенческой науке , политической теории и экономике, которая утверждает, что положительное подкрепление и косвенные внушения, чтобы попытаться добиться ненасильственного подчинения, могут влиять на мотивы, стимулы и принятие решений группами и отдельными лицами, по крайней мере, в той мере, в какой эффективно - если не более эффективно - чем прямое указание, законодательство или правоприменение.

Хвалить

Концепция похвалы как средства поощрения поведения людей уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, особенно в исследовании того, как учителя и родители используют похвалу в отношении ребенка для улучшения поведения и успеваемости, а также в исследовании производительности труда. Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Чтобы похвала повлияла на позитивное изменение поведения, она должна зависеть от позитивного поведения (т.е. вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренней и искренней. достоверно.

Признавая эффект похвалы как позитивной стратегии подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включали использование похвалы в свои протоколы. Стратегическое использование похвалы признано практикой, основанной на фактах, как в управлении классом, так и в программах обучения родителей, хотя в исследованиях вмешательства похвала часто относят к более широкой категории положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческие поощрения.

Манипуляции

Брайкер выделил следующие способы, которыми манипуляторы управляют своими жертвами:

Положительное подкрепление : включает похвалу, поверхностное обаяние , поверхностное сочувствие ( крокодиловы слезы ), чрезмерные извинения, деньги, одобрение, подарки, внимание, выражения лица, такие как принудительный смех или улыбка , и публичное признание.
Отрицательное подкрепление : может включать устранение одного из отрицательных ситуаций.
Прерывистое или частичное подкрепление : частичное или периодическое отрицательное подкрепление может создать эффективную атмосферу страха и сомнения. Частичное или периодическое положительное подкрепление может побудить жертву упорствовать - например, в большинстве форм азартных игр игрок, скорее всего, будет выигрывать время от времени, но в целом все равно теряет деньги.
Наказание : включает ворчание , крик, молчание , запугивание , угрозы, ругань , эмоциональный шантаж , чувство вины , дуться, плакать и изображать жертву .
Травмирующее однократное обучение: использование словесных оскорблений , взрывного гнева или другого устрашающего поведения для установления доминирования или превосходства; даже один случай такого поведения может обусловить или научить жертву избегать расстраивания, противостояния или противоречий манипулятору.

Травматическое соединение

Травматическая связь возникает в результате продолжающихся циклов жестокого обращения, в которых периодическое усиление вознаграждения и наказания создает сильные эмоциональные связи, устойчивые к изменениям.

Другой источник указал, что «Необходимыми условиями для травматической связи является то, что один человек должен доминировать над другим, и что уровень жестокого обращения хронически возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения со стороны доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает возможности жертвы, чтобы сохранить дисбаланс сил. Любая угроза балансу доминирования и подчинения может быть встречена нарастающим циклом наказания, начиная от бурного запугивания и заканчивая резкими вспышками насилия. Виктимизатор также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, снижает способность жертвы получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости ... Травматические последствия этих оскорбительных отношений может включать в себя нарушение способности жертвы к точной самооценке, ведущее к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии.

Видеоигры

Большинство видеоигр построены вокруг некоторого типа цикла принуждения, добавляя тип положительного подкрепления через график с переменной скоростью, чтобы игрок продолжал играть в игру, хотя это также может привести к зависимости от видеоигр .

В рамках тенденции монетизации видеоигр в 2010-х годах в некоторых играх предлагались «ящики с добычей» в качестве награды или покупаемые за реальные фонды, которые предлагали случайный выбор внутриигровых предметов, распределенных по редкости. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выдачи вознаграждений, поскольку она следует графику с переменной ставкой. В то время как общее мнение, что лутбоксы являются формой азартных игр, такая практика классифицируется только в некоторых странах как азартные игры и другие законные. Однако методы использования этих предметов в качестве виртуальной валюты для онлайн-азартных игр или торговли за реальные деньги привели к созданию рынка азартных игр со скинами, который проходит юридическую оценку.

Культура страха на рабочем месте

Эшфорт обсудил потенциально деструктивные стороны лидерства и определил то, что он называл мелкими тиранами : лидеры, которые придерживаются тиранического стиля управления, что создает атмосферу страха на рабочем месте. Частичное или периодическое негативное подкрепление может создать эффективную атмосферу страха и сомнений . Когда сотрудники понимают, что с хулиганами можно мириться, в результате может возникнуть атмосфера страха.

Индивидуальные различия в чувствительности к вознаграждению , наказанию и мотивации изучались в рамках теории чувствительности к подкреплению, а также применялись к производительности на рабочем месте .

Смотрите также

использованная литература

дальнейшее чтение

Брехнер К.С. (1974). Экспериментальный анализ социальных ловушек (кандидатская диссертация). Государственный университет Аризоны .
Брехнер К.С. (1977). «Экспериментальный анализ социальных ловушек». Журнал экспериментальной социальной психологии . 13 (6): 552–64. DOI : 10.1016 / 0022-1031 (77) 90054-3 .
Брехнер К.С. (1987). Социальные ловушки, индивидуальные ловушки и теория в социальной психологии . Бюллетень № 870001. Пасадена, Калифорния: Лаборатория Time River.
Брехнер К.С. (28 февраля 2003 г.). «Накладываемые графики применяются для контроля арендной платы». . В Levine DK, Pesendorfer W (ред.). Экономическая и игровая теория .
Брехнер К.С., Линдер Д.Е. (1981). «Анализ социальной ловушки в системах распределения энергии». В Baum A, Singer JE (ред.). Успехи в экологической психологии . 3 . Хиллсдейл, Нью-Джерси: Лоуренс Эрлбаум и партнеры.
Шанс П (2003). Обучение и поведение (5-е изд.). Торонто: Томсон-Уодсворт.
Cowie S (2019). «Некоторые слабые места в учете силы реакции для подкрепляющих эффектов». Европейский журнал анализа поведения . 21 (2): 1–16. DOI : 10.1080 / 15021149.2019.1685247 . S2CID 210503231 .
Динсмур Дж. А. (ноябрь 2004 г.). «Этимология основных понятий экспериментального анализа поведения» . Журнал экспериментального анализа поведения . 82 (3): 311–6. DOI : 10.1901 / jeab.2004.82-311 . PMC 1285013 . PMID 15693525 .
Ферстер С.Б. , Скиннер Б.Ф. (1957). Графики армирования . Нью-Йорк: Appleton-Century-Crofts. ISBN 0-13-792309-0.
Левин К. (1935). Динамическая теория личности: Избранные статьи . Нью-Йорк: Макгроу-Хилл. ISBN 9781447497134.
Скиннер Б.Ф. (1938). Поведение организмов . Нью-Йорк: Appleton-Century-Crofts. ISBN 9780996453905.
Скиннер Б.Ф. (1956). «История болезни в научном методе». Американский психолог . 11 (5): 221–33. DOI : 10.1037 / h0047662 .
Zeiler MD (июль 1968 г.). «Фиксированные и переменные графики подкрепления, не зависящие от реакции» . Журнал экспериментального анализа поведения . 11 (4): 405–14. DOI : 10.1901 / jeab.1968.11-405 . PMC 1338502 . PMID 5672249 .
«Словарь терминов по армированию» . Университет Айовы. Архивировано из оригинального 13 апреля 2007 года.
Хартер Дж. К., Шмидт Ф. Л., Киз С. Л. (2002). «Благополучие на рабочем месте и его связь с бизнес-результатами: обзор исследований Gallup». В Keyes CL, Haidt J (ред.). Расцвет: позитивный человек и хорошая жизнь . Вашингтон, округ Колумбия: Американская психологическая ассоциация. С. 205–224.

Глоссарий по зависимости и зависимости
зависимость - биопсихосоциальное расстройство, характеризующееся постоянным употреблением наркотиков (включая алкоголь), несмотря на значительный вред и неблагоприятные последствия наркотик, вызывающий привыкание - психоактивные вещества, которые при повторном употреблении связаны со значительно более высокими показателями расстройств, связанных с употреблением психоактивных веществ, в значительной степени из-за влияния препарата на системы вознаграждения мозга зависимость - адаптивное состояние, связанное с абстинентным синдромом после прекращения многократного воздействия раздражителя (например, приема лекарств) сенсибилизация к лекарствам или обратная толерантность - нарастающий эффект лекарственного средства в результате повторного введения в данной дозе абстиненция - симптомы, возникающие после прекращения повторного употребления наркотиков физическая зависимость - зависимость, которая включает стойкие физико- соматические симптомы отмены (например, усталость и алкогольный делирий ) психологическая зависимость - зависимость, которая включает эмоционально-мотивационные симптомы отмены (например, дисфорию и ангедонию ) подкрепляющие стимулы - стимулы, которые увеличивают вероятность повторения сочетанного с ними поведения Вознаграждающие стимулы - стимулы, которые мозг интерпретирует как положительные и желательные или как нечто, к чему нужно приблизиться сенсибилизация - усиленный ответ на раздражитель в результате многократного воздействия на него расстройство, связанное с употреблением психоактивных веществ - состояние, при котором употребление психоактивных веществ приводит к клинически и функционально значимым нарушениям или недомоганию. толерантность - уменьшение эффекта лекарственного средства в результате повторного приема в данной дозе
v т е

Languages

In other projects