操作/工具制約（Operant conditioning） @ 萬箭穿「心」-- 多元活動看穿心理

學習者會先採取行動，然後根據行動的後果去校正行為。在這類學習中，學習者學到的是一系列的行為模式，依據這種行為模式，他可以達到目標或獲致某種後果。（The process whereby a behavior becomes associated with its consequences）

由於這些學來的行為像是個工具，動物操作環境來改變環境才達成某種目的（獲得籌賞，逃避懲罰），因此，這類的學習被心理學家稱為工具性學習(instrumental learning)。

難題箱（T horndike’s puzzle box）

把一隻貓放在籠子內，如果貓找到打開門的方式就可以吃到放在門外的食物，貓雖然剛開始需要透過錯誤來學習，但一旦知道怎麼開門，之後就會直接開門。這樣的方式稱為效果律(law of effect)。可以比喻成進化論中的適者生存率。
效果律:行為是否持續出現，決定於它的效果。
學習是嘗試錯誤（trail-and-error）歷程。

Skinner Box

1. 完整的陳述了工具制約的概念
2. 用制約反應來解釋大多數的行為
3. 發展了Skinner box來提供增強物或懲罰物給動物，並紀錄其行為反應。

工具性制約的原則（Operant Conditioning: Principles）

刺激-反應連結（Stimulus-response）：必須學習刺激、刺激所引發的反應(行為)和後果間的聯結

1. 增強（Reinforcement）：學習是透過增強來達成的，如果一個行為一直都會帶來同樣的後果，則會增強行為。能夠造成強化效果的東西稱為強化物(reinforcer)，會有個別差異，所以要用對強化物。增強又可分成正增強與負增強，不論正強化或是負強化都會增加行為發生的頻率。

a. 正增強：愉悅刺激（Positive reinforcement(pleasant stimulus)）
     一個人或動物在進行某特定行為後獲得他們所喜歡的強化物
b. 負增強：移除不愉悅的刺激（Negative reinforcement (removal of a unpleasant stimulus)）
     一個人或動物在進行某特定行為後就移除一個他們不喜歡的人事物，有時候也被稱為逃脫制約(escape conditioning)
c. 增強物（reinforcers）
     增強物又可分成主要增強物（primary reinforcers）與次要增強物（secondary reinforcers），例如金錢與代幣制度（token system）都屬於次要增強物。

2. 懲罰（Punishment）

a. 正懲罰：提供不愉悅的事物（Positive punishment (unpleasant stimulus)）
     一個人或動物在進行某特定行為後會帶來一個他們不喜歡的後果
b. 負懲罰：移除愉悅的事物（Negative punishment (removal of a pleasant stimulus)）
     一個人或動物在進行某特定行為後，一個他們喜歡的人事物會被移除
c. 有效的懲罰（Effective Punishment）
     即時（swift）、一致（consistent）、適度的嫌惡效果（appropriately aversive）
d. 但處罰有可能會有一些狀況較難控制（Challenges）
     增加暴力攻擊行為的發生（Increase aggressive behaviors）
     行為頻率並未減少，反而是對施行處罰者心生恐懼（Fear the person who punishes）
e. 因此多數有效的行為改變，不能只仰賴處罰而已，同時還必須要有獎勵（Most effective when combined with reinforcement for desired behavior）

增強方式（Reinforcement Schedules）：反應出現時，增強給予的情況

1. 連續增強（Continuous）：每一次反應出現，便會給予增強
2. 部分增強（Partial）：並非每次反應出現時，都會給予增強。在此情形下學到的連結，會比較難消除。

a. 時距增強方式（Interval schedules）
     固定時距（Fixed interval）例如：固定時薪
     變動時距（Variable interval）例如：不定時給獎勵
b. 比例方式（Ratio schedules）
     固定比例（Fixed ratio）例如：按件計酬，這種方式可以得到很高的反應率。
     變動比例（Variable ratio）增強是要反應達到「某個量」，才會給予，但是「某個量」是變動的，他可能在上一次獲得增強後的第一個、第十個、第一百個反應出現後便獲得增強，前面的行為出現的次數不再是一個有效下一個增強給予的預測指標，因此個體的行為會不休息地一直出現，例如：吃角子老虎

Psychology101

萬箭穿「心」-- 多元活動看穿心理

Psychology101 發表在痞客邦留言(1) 人氣()

E-mail轉寄

«	四月 2024					»
日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

萬箭穿「心」-- 多元活動看穿心理

普通心理學教學網站

操作/工具制約（Operant conditioning）

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

文章分類

月曆

最新留言

參觀人氣

«	四月 2024					»
日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

«	四月 2024					»
日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

萬箭穿「心」-- 多元活動 看穿心理

普通心理學教學網站

操作/工具制約（Operant conditioning）

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

文章分類

月曆

最新留言

參觀人氣

萬箭穿「心」-- 多元活動看穿心理

«	四月 2024					»
日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30