正增强训练——开启与宠物的沟通之旅

雅族专文

【雅族拉布拉多犬舍】正增强训练——开启与宠物的沟通之旅

发布时间: 2022-04-14 12:27:42 浏览量: 0

非常幸运，能够在Tan还小的时候就读了包括《别毙了那只狗》在内的许多优秀书籍，帮助了我从跌跌撞撞的新手主人过渡成为一个比较成熟的主人。

狗狗小的时候确实比较累人。纪律和规则意识的养成，社会化的训练等等，都需要在幼犬的黄金期内完成，而这个时候偏偏要尽的照顾责任又比较多：在狗狗学会定点排便之前收拾家里的狗屎狗尿，在狗狗肠胃功能发展完全之前不时出现的腹泻呕吐情况的处理…都够人忙活的，如果又是新手主人，那可真是手忙脚乱啊…

但幸运的是，现今的动物行为学和营养学领域并不是一片空白。诸多实验研究和理论成果必定能为主人和爱宠之间的良好互动提供有关宠物心理和生理方面知识的有力支持。《别毙了那只狗》就是动物行为学领域的成果之一。这本不算太厚的书却清楚明白的介绍了正增强训练（又叫正向训练，正强化训练）的基本知识。在我看来，这其实是一套人宠沟通密码。不仅主人可以借此向自己的宠物（不仅是狗狗）传达意愿，甚至宠物也可以获得一定的主控权，通过增强法学习获得食物或其他奖励，它们对环境具有了一定的控制力。这对于宠物的心理健康也具有重要意义。

这本书我反复读过多次。在跟Tan的互动中，除了切身感受到上述好处之外，书中提到的一些错误做法，还让我少走了很多弯路。4月13号满三岁的Tan是这样一个天使般的存在，不能不说与雅族犬舍优秀的基因，与科学知识的支持都是有关的。这篇文章是基于《别毙了那只狗》的部分内容而写。撰写此文，将有用的知识，好的书籍推荐给更多的主人，帮助更多主人与自己的宠物良好互动，就算是送给我Tan特别的三岁生日礼物吧！

《别毙了那只狗》作者简介

凯伦·布莱尔（Karen Pryor），是"行为心理学和海洋哺乳动物生理学专家。是响片训练的创立者和先驱"（维基百科）。著有包括《别毙了那只狗》在内的一系列书籍。

你是否曾经对你的狗狗这样做过？

真实案例1

狗友的狗有乱捡食的问题。每次被发现捡了垃圾吃，轻则被臭骂一顿，重则挨上好几巴掌。狗友的狗已经五六岁了。五六年来，狗友一如既往的重复着这个模式，狗的乱捡食问题没有丝毫改善，反倒学会了躲着主人偷偷吃垃圾，以及一旦被发现就迅速跑的远远的，让你打不着。

真实案例2

打开房门的时候，朋友的猫偶尔会跑到门外去，叫它回来叫了几次也不理。为了叫猫回来，朋友拿一根猫条，柔声唤，"快回来，回来就有猫条吃哟~"。猫咪果然乖乖的回来了。

但是现在，朋友的猫是打开房门必跑到门外去。而且，如果朋友万一没拿猫条，那是绝对，绝对，绝对叫不回来了。

两个案例中的情景养宠人应该都不陌生。两种做法，一种是处罚，一种是奖励，都对问题的解决无效。原因是什么？奖和罚都不可行，难道我们没有办法了吗？

处罚为何是无效的？

可能有的养宠人对于问题本身就不认同，认为处罚是有效的。甚至有一部分训犬师也仍在用厌恶刺激训犬。比如，暴力和体罚。

为何说处罚是无效的？

要回答这个问题，首先要明白什么是：增强、正增强、负增强、以及处罚。

先来看增强。

增强出现于行为发生期间或行为达成时，并会增加行为再出现的可能性。

行为与增强两个事件在时间上必须具有关联性，当行为引起增强时，这个行为发生的频率就会增加。

比如，狗坐下，这是行为。狗坐下之后得到了一颗零食。零食就是增强物。为了再次得到零食，狗会再次坐下，行为再出现的可能性增加。这就是一次增强。

增强的原理中，最重要的是时间关联性，也就是行为发生，接着出现增强物。"做对了，就是现在这样！"就在当下瞬间，就必须立刻出现增强物，这个时机把握的越准确，增强效果就越好。因为时机把握的越准确，就越能清楚明白的告诉学习者，是哪个行为获得了增强。增强物出现的过早或过晚，都不能获得最好的效果，甚至根本无法实现增强。（猜猜看，为什么案例2中，奖励是无效的？）

接下看什么是正增强和负增强。

用来增强的东西，可能是正面的，学习者喜欢的，想得到的；也有可能是负面的，学习者不喜欢的，想避开的。前者是正增强物，后者是负增强物。用正增强物实现的增强叫正增强，用负增强物实现的增强是负增强。正增强和负增强，只是增强物的性质不同，它们都能使行为再次发生的频率增加。

比如，为了鼓励主动系安全带的行为，每次小朋友主动系上安全带时，父母都予以夸奖。未来小朋友主动系安全带的行为会再次发生。增强物是父母的夸奖，这是正增强。

再比如，为了停止讨厌的"嘀嘀"的系安全带提示音，乘车人会主动系上安全带。提示音是乘车人不喜欢的，但它同样使系安全带的行为发生频率增加了。也就是，新行为使厌恶刺激停止出现，因而强化了新行为，这便是负增强。

最后我们来看处罚。

处罚和负增强，两者看起来都是在使用厌恶刺激，那么它们之间是什么关系？处罚是否等于负增强？

处罚和负增强有着本质的不同。区别在于：第一，厌恶刺激与旧行为的时间关联性；第二，是否导向新行为。

正如前文所述，增强物出现的时间点非常重要，它是关乎增强是否能实现的最关键的因素。越是能在行为完成的当下立刻出现增强物，越是能准确的把握这个时机，就越能清楚明白的传达信息，告诉学习者哪个行为是我们喜欢的。

就时间点来说，处罚往往是在行为结束很久之后才出现的。比如主人回到家之后发现宠物拆家了，随地大小便了，此时大喊大叫，胖揍宠物一顿，都对宠物的行为改进没有任何帮助。行为已经结束很久，宠物不可能知道是哪个行为让主人如此生气。处罚更像是一种报复和泄愤。

错误行为发生很久之后施以的厌恶刺激往往是一种报复和泄愤，对宠物的学习无益。此时宠物出现的害怕表情经常被主人误解成愧疚

同样的情况，如果在宠物随地大小便或者拆家的同时，主人一直施予厌恶刺激，在宠物停止坏行为的当下，立刻撤走厌恶刺激。宠物为了避开厌恶刺激，未来会避免出现拆家或者随地大小便的行为。这是负增强。

在时间点上，负增强物是在期望结果达成时立刻消失，通过厌恶刺激的消失标定行为，进而使新行为的未来发生频率增加。而处罚则完全不符合时机点和导向新行为的这两个特点。

然而，也存在一些处罚，它们发生的时间点更接近坏行为发生的当下，颇具迷惑性。比如实例1，发现狗子乱捡东西吃立刻大骂或大打出手。这究竟是处罚还是负增强呢？

如果说，在狗子乱捡东西时骂或打，但在狗子停止行为时立刻停止打骂，这是负增强。但实际生活中，我们经常看到的是，狗子不吃了，旁边的主人还在气呼呼的大骂不止。这就是处罚了，完全无助于建立新行为。这也是为什么实例1中的主人五六年如一日打骂不止，狗子也五六年如一日的捡垃圾吃不休的原因。

说到这里，我们再进一步：就算是符合标准的负增强，它对宠物的学习是有益的吗？比如一些训犬师采用体罚的方式训犬?

厌恶刺激训练法的副作用：

过度处罚可能会使学习者变得充满敌意或逃避，长期努力终止他人的不满，可能会变得胆怯、自我猜疑且焦虑不安。这些情绪对学习全无助益。

处罚下的学习者表现为被动顺从和减少主动性，也可能出现过度联想，对任何当时刚好在场的周遭事物（包括训练环境和训练者）出现厌恶感，而设法避开或甚至逃离。比如这本书的作者见到，处罚学习下的"许多表现一流的狗儿一脸闷闷不乐，不但不摇尾巴而且小心翼翼不敢乱动。"

受到处罚的动物学习到，能少出力就少出力，只要不会被处罚就好，很听话，但主动性很少。

很难每次动物有不良行为时都予以处罚，结果出现类似于拴着P链时表现很乖，一旦松开行为就极不稳定的情况。因为它们十分清楚什么情况下不会被处罚。

会让他们学习到设法别被逮到的行为，比如实例1中的狗子。

奖励为何有时也是无效的？

像实例2中的情况，奖励无效是因为出现的时间点不对。奖励早于行为出现了，这不是正增强，这是贿赂。这种期望自己获得好处而先给他人奖赏的方式有没有用，我们自己就深有体会——"她邀我到她的派对去只是想要我带份礼物给她，我真是讨厌她！""姑妈今天表现得特别和蔼可亲，不知道这个老太婆这次在盘算什么？"

凯伦·布莱尔在书中举了一个例子。美国布隆克斯动物园的管理员曾对大猩猩十分头疼，他们必须让它进入户外栏舍才能打扫室内栏舍，但是它老是喜欢坐在进出口。力大无穷的它可以挡住滑门，阻止门关上。当管理员把食物摆在户外或以香蕉引诱他时，大猩猩不是不加理会就是抢了食物再赶在门关上前回去挡门。他们请了动物园的一个训练师处理这个问题。这位训练师解释，挥舞香蕉以及丢入食物是企图以贿赂来增强一个尚未发生的行为，但真正有效的解决办法是当大猩猩坐着挡门时不予理会，但是只要它自己到户外时便给予食物奖励。问题就这么解决了！

灵长类动物有多聪明？2011年一个英国的摄影师到印度尼西亚拍摄。一只黑冠猕猴突然抢过了照相机进行了自拍。这些照片在网上疯传。这是其中的一张

正增强训练是好的刺激控制，更是一种真正的沟通

正增强训练才是最利于宠物学习的。它的训练要点可以用一句话概括：

合适的正增强物以一种合适的方式在合适的时机出现

说起来简单，其实又变化无穷。好的正增强训练师，一定是一个很有创造力的人。这方面，还请大家移步《别毙了那只狗》，进入到这颇具趣味的世界中。这里，我只简单截取几个例子。

合适的正增强物

增强物的性质是相对的而不是绝对的。雨对鸭子来说是正增强物，对猫来说却是负增强物。吃饱后，食物不再是正增强物。增强物必须是对方想要的东西。

有多种增强物可供选择将会很有帮助。包括但不限于食物、抚摸、社交关注、玩具等。不断变化增强物种类会让动物们觉得兴趣盎然。

但是对于拉布拉多来讲，"憋整没用的，有好吃的就足够了"

食物增强物越小越好。增强物越小，动物能越快吃掉它，不但可以减少训练者等待的时间，而且每次练习时还可以增加增强物的使用次数，不会让动物一下子吃饱吃腻了。一小口就足以让动物保持兴趣，如果是它特别喜爱的食物，份量甚至可以更少。但是如果是训练比较难的动作，则食物增强物不仅要更大份而且要更好，食物等级要更高。

b. 合适的方式

在动物学习的阶段，每次在动物做到行为时，都应该给予奖励。但在动物完成学习，保持行为的阶段，则应随机增强，偶尔给予奖励即可，这样更有利于保持行为。

作者在书中举了好几个例子来说明这一现象。

假设你的新车总是很容易发动，某天当你坐上车后把车钥匙一转，它却没发动，你可能会试着再发动几次，但是你很快就会判断这辆车出了问题而打电话给修车厂。由于转动车钥匙的行为没有立即带来期待的增强结果，这个转动钥匙发动车子的行为很快便会消失。相反的，如果这是台老旧的破车，几乎很少在第一次就发动，而且通常还得花很久时间发动，这时候你便可能花上半个小时不断试图启动，因为这个转动车钥匙的行为长期以来一直受到变化性增强，因而能稳定维持着这个行为。

作者在训练海豚时发现，如果海豚每次跳跃都一定有鱼吃，它跳跃的动作将很快变得马虎敷衍，过得去就好。然后要是不给鱼了，海豚跳跃的动作很快就会消失。不过，如果在它学会跳跃就有鱼吃的概念后，便开始随机增强它的跳跃动作，这个行为就会稳定维持下来，当动物没获得奖励时，它们反而会更常跳跃，期盼下次中奖的机会，而且跳跃时甚至可能变得更有活力。如此一来，训练者就能选择增强较具活力的跳跃动作。然后海豚的跳跃表现就会越来越好。

海豚也是一种智商非常高的动物

再比如，磨人功夫特别厉害的小孩往往是被家长训练出来的。小孩累了、饿了或不舒服的时候可能会像幼犬一样呻吟。那些自制力超强的父母，他们能够一直忍受这些哼哼唧唧，直到最后终于让步："好啦，我会给你那个该死的冰激凌，现在请你闭上嘴巴可以吗？"这个最后才出现的让步，使得这类行为得以维持，而增强物不定时出现的情形更使得行为非常耐得住考验。所以在另一本书，《狗班长的快乐狗指南》中，作者西萨·米兰指出，训练狗具有纪律观念，主人首先必须讲纪律。不允许狗上床上沙发，就永远不要允许，一次例外就可能让狗有侥幸心理，使得行为难以被纠正。

c. 合适的时机

奖励越能在行为完成的当下出现，越具有好的训练效果。但有些情况下，给食物不是那么方便的，有的时候要远距离训练，也没办法即时给食。这时，响片就引入训练了。做法是，先给动物在响片和食物等奖励间建立联系，让动物知道响片一响就有好事要发生。然后日常训练时，响片就可以代替食物等初级刺激来训练动物了，只须平时不时强化响片与初级刺激间的联结就好。

在购物平台上只要输入"响片"就会出现各色各样的响片。其实响片只是习得增强物的一种。比购入一个漂亮响片更重要的是理解背后的训练原理

其实不只是响片，习得增强物还可以是犬笛、哨音，主人的"good""好乖"等。只不过，相比人声，响片或哨音等不会夹杂情绪，更标准化，更易被动物识别。

到后来，响片已经不只是一种训练工具，它还可以是一种人和动物之间的沟通方式，它开启了通往动物心智的窗口！

作者在书中讲了这样一个故事。有一匹经过响片训练的马，名叫詹姆斯。有天詹姆斯的脚上长了个脓疮，兽医要求它必须定时泡脚。所以它的主人派翠西亚拿来一桶温水放在詹姆斯身旁，把它的脚放入水桶中，詹姆斯随即把脚抽了出来。她又把它的脚放进去，詹姆斯又抽了出来。詹姆斯是匹体型硕大的马，个头娇小的派翠西亚没办法施行强硬手段，她也几乎从来不骂它。这时该怎么办？她回到屋里找到了响片，重新回到谷仓里。她把詹姆斯的脚放入水桶中——并且按下响片，派翠西亚后来以比喻的说法描述它的反应："噢！你的意思是要我把脚放在水桶里啊，噢，好吧！"这次并不需要给它胡萝卜，詹姆斯刚才只是不明白派翠西亚要它做什么，在它理解之后它并不介意这么做。

"好的刺激控制就是一种真正的沟通。"

著名的"控制力实验"

1976年，心理学家兰格和罗丁在一家养老院做了一个实验，发现了控制力对人有着重要的影响。

兰格和罗丁的实验在一家叫做"阿登屋"的养老院进行。这家养老院属于最高端的疗养单位之一，它能提供高质量的医疗、娱乐和居住服务，这意味在这里住的老人都有很好的照顾。

在这个实验里，兰格和罗丁将刚进养老院的老人分成两组，一组住在4楼，而一组在2楼，所有的老人都能享受一切服务，但是有一点不同。（老人们都是不知情的）

他们在控制力上做了不同的处理。

4楼老人：1、可以决定自己房间的家具布置。2、可以自己选择一个小礼物。3、每周会放电影，老人可以自由选择哪一天看。

2楼老人：1、养老院已经给老人布置好房间，老人只用拎包入住即可。2、养老院赠送了统一的小礼物给老人。3、每周四或者周五会放电影，养老院会通知老人去看。

在3周后，实验人员通过收集护士对老人的评价（护士每天在老人身边，并且对这项实验不知情），发现有控制力的老人更积极，更愿意和身边的工作人员长时间交谈。

同时，实验人员通过举办活动和观察平时老人看电影的次数来判断老人的心态，发现被统一管理，失去控制力的老人看电影的次数变少了，同时，面对养老院的活动，也没有参加的欲望。

失去控制力，让人的生活态度变得消极。

实验并没有停止，在18个月后，医生对所有的老人进行健康评定。发现有控制力的老人的健康水平总体上有所上升，而另一组老人的健康水平稍微下降。拥有控制力不仅让我们更愉快，也让我们更健康。

这就是著名的"控制力实验"。疫情下的我们对此肯定深有体会——所在区域疫情一旦爆发，就会被封控，生活就会受到很大影响。而本地疫情是否爆发，个体往往无能为力。那种无力感、愤怒、焦虑、抑郁…就是人对环境失去控制力时的心理感受。

正增强训练就与控制力有关。在正增强训练中，增强就是资讯——这个资讯告知你哪个行为有用。如果我们拥有资讯，懂得如何让环境增强我们，我们便能控制环境，不再任它为所欲为。因此，训练对象喜欢透过增强法学习的原因并不是为了显而易见的理由——获得食物或其他奖励，而是因为它们能够实际获得一些控制环境的能力。从"控制力实验"中我们可以推导出，这对于宠物的心理健康具有重要意义。

除此之外，正增强训练还会增进训练对象和训练者的感情。成功的训练互动使得参与者彼此成为类化后的习得增强物：对训练对象而言，有趣、兴奋、有所回报、愉快满足的事件都源自训练者；而对训练者而言，训练对象的反应既有趣又有成就感，于是两者产生相互依附的真实情感，双方在生命过程中是共同作战的伙伴。

在正增强训练下，狗子变得神采奕奕、专注、兴高采烈、全力以赴。当看到它们眼中闪耀的光芒时，我相信每个宠物主人都会有这样一种感觉：这一切都是值得的。

快跟你的狗子一起，开启正增强训练的沟通之旅吧！

"At the end of the day, your feet should be dirty, your hair messy and your eyes sparkling"

一个有趣的小测试

答案就在《别毙了那只狗》（商周出版社2018年第二版）的101页和128页哦！

麦宠网

雅族专文

【雅族拉布拉多犬舍】正增强训练——开启与宠物的沟通之旅

相关资讯推荐