《津巴多普通心理学》读书笔记11——我们如何通过操作性条件作用来学习新行为（二）

在操作性条件作用中，一个重要的概念的是强化。强化分为正强化和负强化。正强化是出现在反应后，能够增加相关行为再次发生可能性的刺激。负强化是消除令人不快或讨厌的刺激来达到强化作用。强化和惩罚不同，强化是加强行为，而惩罚是削弱行为。

假如您想让小狗学会一门技巧，比如一听到命令就坐直，那么在刚开始训练的时候，你最好在小狗每次做对动作后给予它一次奖励。心理学家称为连续强化。在学习的初始阶段，这种方法非常有用，因为对每次正确反应予以奖励，并忽视不正确的行为，会让被强化对象很快明白什么样的反应是受到鼓励的。此外，连续强化对于塑造复杂的新行为非常有用。塑造技巧常被用于训练动物，塑造者使用奖励(有时也用惩罚)塑造对象的行为不断接近目标行为。在学校里，老师在教学生阅读、写作或演奏乐器时会慢慢提高标准，他们就在使用塑造技巧。通过使用这一技巧，老师可以不断“抬高标杆”，也就是提高学生获得奖励所需的成绩标准。这一过程能让学生知道自己什么时候进步了。总之，我们可以说，连续强化是塑造新行为的最佳策略。

不过，连续强化的确存在一些不足之处。首先，只要有一次正确反应没有得到奖励，学习者就很容易认为自己的反应不正确。一致性是该方法获得成功的关键所在。其次，获得多次奖励后，生物体会变得餍足，这时，连续强化往往会失去激励效果。假如有人训练你罚篮，并在每次罚篮成功后奖励你一大块糖。第一块糖会让你感到非常满足，但几块糖下肚之后，其奖励价值就不复存在了。令人高兴的是，一旦目标行为已经形成(比如狗学会了坐直)，有效强化所需的模式就发生了变化。学者不再需要用奖励来区分正确和错误的反应。这时，我们就可以使用间歇强化（也叫作部分强化)，即对部分而非全部正确反应进行奖励。不太频繁的奖助——可能每3次正确反应奖励1次，依然会激助小狗一听到命令就坐直，同时又能避免让它感到餍足。总之，无论是对动物还是对人，间歇强化是维持已习得行为的最有效方法。在实践过程中，社会强化(抚摸)和有形奖助(如食物)的混合使用能让强化方式向间歇强化过渡变得更容易。

间歇强化的一大优点是它能有效阻止消退过程的发生。在操作性条件作用中，如果强化不再进行，那么消退就会发生，就像赌徒会停止继续向从不吐钱的老虎机投钱样。为何间歇强化能比连续强化更加有效地阻止消退呢?假如有两个赌徒和两台老虎机。一台机器不知为何每次都吐出硬币，而另一台机器比较正常，只会不可预期地间歇吐出硬币。如果两台老虎机都突然不吐硬币了。哪个赌徒会首先意识到出问题了?显然是那个每次都能获得硬币奖励(连续强化)的赌徒。而那个偶尔获得奖励(间歇强化)的赌徒则需要玩很长一段时间才会发现不对劲。

我们很容易理解为什么满足基本生理需求的刺激能够提供强化，比如食物可以强化饥饿的动物，水可以强化口渴的动物。与之类似，性爱可以成为性欲被唤起的生物体的强化物。心理学家将这类刺激称为初级强化物。

金钱或考试分数则提供了另一种强化。你不能吃它们或喝它们，它们也不能直接满足任何身体需要。那么为什么这类事物能够有力地强化行为呢?中性刺激，比如金钱或考试分数，需要通过与初级强化物联系起来才能发挥强化作用，因此它们就成为了操作性反应的条件强化物或次级强化物。表扬、赞许的微笑、商家使用的“回馈卡”以及各种社会地位的象征都属于这类强化物。事实上，通过与初级强化物联系起来，任何刺激都可以成为次级强化物或条件强化物。在强有力的条件作用下，诸如金钱、地位或奖品这些次级强化物甚至能够成为最终目标。

做喜欢的事情的机会也可以像食物、饮料或其他初级强化物一样，有效地强化行为。例如经常锻炼的人会把每天跑步或参加健身课程作为完成其他任务的奖励。类似地，老师发现如果年幼的孩子知道安静地坐好可以获得过一会儿到处跑闹的机会，他们就能学会安安静静地坐着。在这里发挥作用的原理是，参与喜欢的活动(玩要嬉闹)的机会可以被用来强化不太喜欢的行为(安静坐好听老师讲课)。心理学家称之为普雷马克原理它是以发现人的名字命名的。通过这种方式，父母可以用普雷马克原理让孩子收拾床或洗碗碟，比如孩子完成这些任务后，父母才允许他们和朋友们玩。

你会用什么喜欢的活动来强化自己的学习行为呢?