close

 

學習者會先採取行動,然後根據行動的後果去校正行為。在這類學習中,學習者學到的是一系列的行為模式,依據這種行為模式,他可以達到目標或獲致某種後果。(The process whereby a behavior becomes associated with its consequences)

由於這些學來的行為像是個工具,動物操作環境來改變環境才達成某種目的(獲得籌賞,逃避懲罰),因此,這類的學習被心理學家稱為工具性學習(instrumental learning)。

難題箱(T horndike’s puzzle box)

把一隻貓放在籠子內,如果貓找到打開門的方式就可以吃到放在門外的食物,貓雖然剛開始需要透過錯誤來學習,但一旦知道怎麼開門,之後就會直接開門。這樣的方式稱為效果律(law of effect)。可以比喻成進化論中的適者生存率。
     效果律:行為是否持續出現,決定於它的效果。
     學習是嘗試錯誤(trail-and-error)歷程。

Skinner Box

1. 完整的陳述了工具制約的概念
2. 用制約反應來解釋大多數的行為
3. 發展了Skinner box來提供增強物或懲罰物給動物,並紀錄其行為反應。

工具性制約的原則(Operant Conditioning: Principles)

刺激-反應連結(Stimulus-response):必須學習刺激、刺激所引發的反應(行為)和後果間的聯結

1. 增強(Reinforcement):學習是透過增強來達成的,如果一個行為一直都會帶來同樣的後果,則會增強行為。能夠造成強化效果的東西稱為強化物(reinforcer),會有個別差異,所以要用對強化物。增強又可分成正增強與負增強,不論正強化或是負強化都會增加行為發生的頻率。

a. 正增強:愉悅刺激(Positive reinforcement(pleasant stimulus))
     一個人或動物在進行某特定行為後獲得他們所喜歡的強化物
b. 負增強:移除不愉悅的刺激(Negative reinforcement (removal of a unpleasant stimulus))
     一個人或動物在進行某特定行為後就移除一個他們不喜歡的人事物,有時候也被稱為逃脫制約(escape conditioning)  
c. 增強物(reinforcers)
     增強物又可分成主要增強物(primary reinforcers)與次要增強物(secondary reinforcers),例如金錢與代幣制度(token system)都屬於次要增強物。

2. 懲罰(Punishment)

a. 正懲罰:提供不愉悅的事物(Positive punishment (unpleasant stimulus))
     一個人或動物在進行某特定行為後會帶來一個他們不喜歡的後果
b. 負懲罰:移除愉悅的事物(Negative punishment (removal of a pleasant stimulus))
     一個人或動物在進行某特定行為後,一個他們喜歡的人事物會被移除
c. 有效的懲罰(Effective Punishment)
     即時(swift)、一致(consistent)、適度的嫌惡效果(appropriately aversive)
d. 但處罰有可能會有一些狀況較難控制(Challenges)
     增加暴力攻擊行為的發生(Increase aggressive behaviors)
     行為頻率並未減少,反而是對施行處罰者心生恐懼(Fear the person who punishes)
e. 因此多數有效的行為改變,不能只仰賴處罰而已,同時還必須要有獎勵(Most effective when combined with reinforcement for desired behavior)

增強方式(Reinforcement Schedules):反應出現時,增強給予的情況

1. 連續增強(Continuous):每一次反應出現,便會給予增強
2. 部分增強(Partial):並非每次反應出現時,都會給予增強。在此情形下學到的連結,會比較難消除。

a. 時距增強方式(Interval schedules)
     固定時距(Fixed interval) 例如:固定時薪
     變動時距(Variable interval) 例如:不定時給獎勵
b. 比例方式(Ratio schedules)
     固定比例(Fixed ratio) 例如:按件計酬,這種方式可以得到很高的反應率。
     變動比例(Variable ratio) 增強是要反應達到「某個量」,才會給予,但是「某個量」是變動的,他可能在上一次獲得增強後的第一個、第十個、第一百個反應出現後便獲得增強,前面的行為出現的次數不再是一個有效下一個增強給予的預測指標,因此個體的行為會不休息地一直出現,例如:吃角子老虎

 

 


arrow
arrow
    全站熱搜

    Psychology101 發表在 痞客邦 留言(1) 人氣()