
5 天前
1969年的一间实验室里,松鼠猴的举动推翻了当时行为科学的常识:它反复按下杠杆,而每一次按压都会提前触发电击——这相当于主动给自己找不痛快。在另一种规则下,按杠杆只会在固定时间后触发电击,猴子却几乎不碰。
这不是自虐,更不是实验误差。神经科学家艾琳·卡利帕里在研究生课上读到这份研究时,突然意识到学界信奉了几十年的假设站不住脚:我们一直以为动物(包括人类)的行为,无非是趋利避害——追着奖励跑,躲开惩罚走。
但这些猴子用行动证明,真正驱动它们的不是电击的痛感,也不是虚拟的奖励,而是一套看不见的规则。这背后的逻辑,彻底改变了卡利帕里的研究生涯,也让我们重新理解行为的本质。
要读懂猴子的反常行为,得先把两个被混为一谈的概念拆开:**奖赏(reward)是刺激带来的主观感受——比如食物的甜、电击的疼,是我们给体验贴的「好」或「坏」的标签;而强化(reinforcement)**是刺激对行为的实际影响——它能让某个动作重复出现,无论这个刺激本身是甜是疼。
你可以把奖赏比作一道菜的味道,强化则是你会不会再点这道菜。前者是主观感受,后者是行为结果——哪怕一道菜有点辣(负向感受),但吃了能让你出汗退烧(正向结果),你还是会再点。
Kelleher和Morse的实验把这个逻辑推到了极致:在「交错延迟规则」下,每按一次杠杆,电击就会提前一点到来,但猴子只要保持按压,就能精准控制电击的时间节奏;而在「固定延迟规则」下,按不按杠杆,电击都会在固定时间出现,猴子完全失去控制权。

猴子疯狂按压的不是「被电击」的结果,而是「能控制电击」的规则。这种行为模式,和它们为了获取食物而按压杠杆的节奏一模一样——此时的电击,已经从一个惩罚刺激,变成了维持行为的「强化物」。
猴子能读懂规则,是因为大脑的皮层早就进化出了一套「规则编码系统」——它不只是被动接收刺激,还会主动给刺激「贴标签」,而标签的内容完全由任务规则决定。
蒙古沙鼠的听觉皮层研究,把这套系统拆解得更清晰:当训练沙鼠区分两种音频,一开始「两种音频都能触发奖励」的规则下,听觉皮层的所有层级都只负责编码「声音来了」这个信息;而当规则变成「只有A音频能触发奖励」后,上层皮层立刻切换模式,开始编码「这是A还是B」的选择信息,深层皮层则负责把选择转化为行动。

简单说,大脑皮层像个分层的剧组:上层是编剧,负责解读任务规则,判断「该做什么」;下层是演员,负责执行动作,完成「怎么做」。而当规则改变时,编剧会立刻改剧本,演员也会跟着换动作——哪怕刺激本身没有任何变化。
更关键的是,这套编码系统还会被「强化历史」塑造。如果一只动物从小就在「按杠杆能控制结果」的环境中长大,它的皮层对规则的敏感度会显著提高,面对新任务时的适应速度也会更快;反之,长期处于「无论做什么都没用」环境中的动物,会出现「习得性无助」——哪怕规则变了,它也不会再尝试控制。
这套逻辑不只适用于实验室里的猴子和沙鼠,也能解释我们身边的很多行为。
比如训练实验用迷你猪时,用点击器训练(CT)的猪,比单纯用食物诱导的猪更愿意配合——因为点击器给了它们清晰的规则:「做对动作→听到响声→得到奖励」,它们能明确感知到「自己的行为能控制结果」;而食物诱导的猪,只会跟着食物走,一旦食物消失,就会停止行动。
再比如人类的拖延症:很多人不是不想完成任务,而是任务本身没有清晰的规则——「什么时候开始」「做到什么程度算完成」「完成了有什么具体结果」都模糊不清,大脑的皮层找不到可以编码的规则,自然就不会启动行为。
当然,这套规则驱动的行为模式也有局限。如果规则过于复杂,或者环境中的干扰刺激太多,大脑的编码系统会过载,导致行为混乱;而且一旦规则被打破,动物(包括人类)会出现强烈的应激反应——就像当你习惯了「红灯停绿灯行」,突然某天红绿灯乱闪,你会瞬间手足无措。
Kelleher和Morse的研究已经过去50多年,但它戳破的那个误区依然存在:我们还是习惯用「好」或「坏」去解释行为,用奖励和惩罚去驱动行为,却常常忽略了最核心的东西——规则。
行为的本质,从来不是趋利避害,而是寻找并遵循能让自己掌控环境的规则。
就像那些主动按杠杆的猴子,它们要的不是电击,也不是食物,而是「我能决定接下来发生什么」的掌控感。这种对规则的追求,刻在每一个动物的神经编码里,也藏在我们每一个人的日常选择中。
点击充电,成为大圆镜下一个视频选题!