
20 天前
你刷短视频停不下来的手,喝奶茶时冒起的愉悦泡泡,戒烟时抓心挠肝的渴望——过去30年,我们都被告知这是多巴胺在操控“快乐”。但今年5月,全球顶尖神经科学家要在西班牙开一场“多巴胺审判会”,核心议题是:我们对这种神经递质的认知,从根上就错了?
这场争论的靶心,是统治学界30年的“奖赏预测误差”理论——那个说多巴胺管的不是快乐,而是“对奖赏的预期”的经典结论。而现在,越来越多的实验正在把它的地基一点点掏空。
1997年的猴子实验,是这一切的起点。科学家给猴子喂果汁,意外发现:当果汁毫无预兆出现时,猴子大脑里的多巴胺神经元会疯狂放电;反复几次后,只要喂果汁前先开一盏灯,多巴胺的释放会提前到灯亮的瞬间——大脑学会了把灯光和“即将有甜水喝”绑定;如果灯亮了却没果汁,多巴胺会骤降,像一个记分员突然划掉了本该得的分。

这就是“奖赏预测误差(RPE)”假说的核心:多巴胺是大脑的奖惩调度员,它不管快乐本身,只负责给“做什么能拿到好处”这件事打分,教大脑形成条件反射。你可以把它理解成外卖平台的“猜你喜欢”——它不直接给你送吃的,只根据你的历史订单,提前把你可能想吃的推到首页。
这个理论太好用了:它能解释为什么刷短视频停不下来(永远猜不到下一个会不会更有意思,多巴胺持续释放),能解释戒烟难(抽烟的动作、场景都成了“尼古丁奖赏”的预告信号),甚至能解释多动症、精神分裂症的部分症状。它像一把万能钥匙,打开了神经科学里关于学习、成瘾、决策的无数扇门。
第一个裂缝出现在2021年。美国范德堡大学的艾琳·卡利帕里团队给小鼠的足部施加轻微电击,结果发现——小鼠大脑里的多巴胺居然大量释放了。
这完全推翻了“多巴胺只和奖赏绑定”的核心逻辑。审稿人逼着她补做各种和奖赏相关的实验,甚至有人因为这个结论大发雷霆。但后续的研究越来越多:多巴胺会对全新的、没见过的刺激有反应,会对危险的威胁信号有反应,这些都和“奖赏预测”毫无关系。
更关键的发现是,多巴胺管的远不止奖赏。科学家监测小鼠时发现,很多多巴胺神经元根本不关心有没有糖水,反而会对小鼠在迷宫里的位置、移动的速度,甚至它离目标还有多近做出反应。它还和注意力、工作记忆、社交行为息息相关——它更像是大脑里的“通用调度员”,不是只管某一件事的快递员,而是负责协调整个大脑的信息处理,让神经系统更高效地工作。
最颠覆的一击来自加州大学旧金山分校的南布迪里。他给完全没受过训练的小鼠随机喂糖水,按照经典理论,小鼠知道糖水随机出现后,多巴胺反应会下降;但实验结果恰恰相反,多巴胺释放越来越高。他提出了一个完全反向的理论:大脑的学习不是“先看到线索,再等奖赏”,而是“先得到奖赏,再回头找是什么带来了它”——多巴胺不是提前预测,而是事后回溯。
面对这些反例,经典理论没有立刻崩塌,反而像一个会变形的“移动靶”——每出现一个新发现,就有人给它打补丁,让它能继续解释新现象。
比如“多巴胺爬坡”现象:小鼠学会灯亮有糖水后,从听到铃声到走到糖水旁的过程中,多巴胺释放会一路上升。按照经典理论,多巴胺应该只在灯亮时释放,但很快就有学者修改模型:把“灯亮到喝糖水”看成一连串小步骤,越靠近糖水,奖赏的价值越高,多巴胺自然会爬坡。

这让经典理论变得越来越“万能”,无论出现什么新数据,都能通过调整前提来适配。学界因此分成了两派:一派说,不能把孩子和洗澡水一起倒掉,我们只需要继续完善它;另一派则认为,这个理论已经千疮百孔,是时候换一套全新的底层逻辑了。
而南布迪里的回溯理论,刚好能解释经典理论最头疼的问题:为什么戒烟的人看到别人抽烟,还是会忍不住想抽?按照回溯理论,多巴胺的作用是让大脑记住“抽烟带来过奖赏”,哪怕现在没烟抽,这个“事后回溯”的记忆依然存在——这才是成瘾复吸的核心动力。
这场关于多巴胺的争论,本质上是人类对自身大脑认知的一次自我修正。我们总习惯给复杂的生物系统找一个简单的“核心功能”,就像我们曾经以为心脏只是用来供血,却忘了它还会分泌激素影响情绪。
多巴胺不是快乐分子,也不是单纯的奖赏记分员,它是一个比我们想象中复杂得多的“大脑调度员”——它参与奖赏,也参与恐惧;它管学习,也管运动;它能提前预测,也能事后回溯。
大脑从不按我们的假设工作。 当我们以为找到了“标准答案”时,往往只是打开了下一层谜题的门。而这场即将到来的多巴胺审判会,不过是人类在探索自身边界时,又一次勇敢的“认错”。
点击充电,成为大圆镜下一个视频选题!