关于咔嗒器(或称响片器)训练的理论基础
关于咔嗒器(或称响片器)训练的理论基础
偶尔在国内一些网站上会看到一些谈咔嗒器和咔嗒器训练的帖子,我也把自己所了解的知识和大家分享一下。请指正。谢谢!
咔嗒器在动物训练(有人主张也可以用在人的行为塑造上)上的运用是基于巴甫洛夫的“古典(或称“经典”)条件化理论(Classical Conditioning Theory)”和斯金纳的“操作条件化理论(Operant Conditioning Theory)”。
巴甫洛夫(Ivan Pavlov,1849—1936)最著名的实验是"流口水的狗"。它讲的是通过一定的方法,一个第二性的刺激(比如铃声)可以获得犬只如同对本原性刺激(比如肉)一样的反应。把第二性刺激和本原性刺激联系在一起的过程叫做条件化。(为了和后来的操作条件化区别,人们称此为古典条件化。)对第二性刺激产生的如同对本原性刺激一样的反应叫做条件反射。(相对且区别于见光瞳孔收缩,敲膝盖下部位小腿弹起等无条件反射。饿狗见到食物流口水也是无条件反射。)进一步的实验还发现,引入第二刺激有助于动物的学习。动物训练里采用的标识(口头表扬、无声笛、咔嗒器)就是第二刺激。动物训练中引入第二刺激的另一个帮助是使得对行为的肯定和奖励可以分离开来(桥梁作用)。
斯金纳(Burrhus Frederic Skinner,1904—1990)将巴氏的理论称为古典条件化,将Thorndike的Instrumental Conditioning称为操作条件化。“斯金纳的盒子”是广为人知的。老鼠在盒子里自由的行动,它偶然发生的行为引起了不同的后果,有些后果令老鼠更愿意发生刚才引起这个后果的行为,这些后果称为强化(物);有些后果令老鼠发生引起后果的行为几率降低,这类后果称为惩罚(物)。后果如果是原本的环境里没有的,称为正面的;后果如果是环境里原本有的消失了,称为负面的。组合起来就有正面强化,负面强化,正面惩罚,负面惩罚四种后果。操作条件理论讲的是“后果跟随着行为,后果的性质会修正将来产生这些行为的倾向”。通过操控后果来获得期望行为(或令不理想的行为消失)就是这个理论的应用。
实验还发现了强化的频率和时间与对所强化的行为的关系。有四种不同的安排:
1〉定时,如每隔三分钟对理想行为强化一次。发现强化后发生率降低,到时间快到时升高。
2〉不定时,如三分钟奖励一次然后五分钟然后二分钟。30分钟里行为次数比1〉多,且没有1〉的“鱼鳞”状曲线。
3〉定比,如每发生三次理想行为强化一次,效果比2〉好,尤其在学习新的行为时很有效。(每次都强化也是定比。)
4〉不定比,如先是发生三次强化一次,然后五次奖一次,两次奖一次… 同样时间里发生理想行为的次数为四者中最多。对维持巳学会的行为尤其好。
塑形也是Skinner理论的一部分,是解答如何获得复杂行为这个问题的, 后被称为“连续渐近法塑造行为(Shaping by the Method of Successive Approximation)”。斯氏刚开始实验时就是通过此法逐步让老鼠去踩踏板的。动物训练中经常应用这个方法。即把一个目标行为细分成许多步,一步一步的训练,用一定的顺序(许多情况中用“反顺序”或“倒链子(Back-Chain)”)串连在一起。
咔嗒器或称响片器在训练中用作标识物(marker)是因为与其他方法如口头发声相比它便携、易用、声音的独特性和一致性以及通常与背景声的不同。它依据的是经典条件化理论和操作条件化理论,故在实际运用时亦要遵循这些原则,如第二性刺激的建立(条件反射),渐进塑形,强化的时间表,等等。
Dr. Keller Breland和Dr. Marian Breland夫妇两人均师从斯金纳并于1944年离开学校开办了第一家用操作条件化训练动物的公司Animal Behavior Enterprises。他们在1940中期推出咔嗒器(Clicker),但商业上并不成功。直到1960年代Karen Pryor出山,咔嗒器才得以广泛地被认可和使用。Karen Pryor著作中最有名的大概就是《别毙了那只狗》,台湾有出版中译本。(顺便讲一句,我对书中一些例子应该归为正面强化/惩罚还是负面强化/惩罚是有不同看法的。)
Karen Pryor认为在训练中使用咔嗒器和咔嗒器训练方法是完全不同的两回事。前者只是在传统的训练方法中用咔嗒器作为标识的工具,称为“跨界(Cross-Over)”训练师;而后者则是完全以正面强化为本的新一代的训练师。
[此贴子已经被作者于2008-2-22 7:54:18编辑过]

