多巴胺的真正作用是什么?
多巴胺的真正作用是什么?
(视频)
重新定义多巴胺:当神经科学的“国王”面临退位
今年 5 月,当全球顶尖的神经科学家齐聚西班牙塞维利亚参加多巴胺学会(Dopamine Society)年会时,空气中除了安达卢西亚的暖意,还弥漫着一种山雨欲来的张力。所有的目光都聚焦在“第 31 节分会场”(Session 31)。这不只是一场常规的学术报告,而是一场旨在挑战神经科学界最神圣教条的公开辩论。
长期以来,多巴胺在流行文化中被简化为某种廉价的“快感指数”:它是刷到短视频时的多巴胺激增,是尼古丁带来的上头感。即便在学术界,多巴胺也被奉为衡量“奖励”的至高准绳。然而,随着 2025 年和 2026 年一系列挑战性研究的发表,支撑了该领域三十年的大厦开始出现裂缝。这场争论不仅关乎生物化学的定义,更关乎我们对多动症(ADHD)、精神分裂症及成瘾行为的根本理解——如果我们的基础模型从底层逻辑上就错了,那么现行的治疗路径是否也只是一场美丽的误会?
王座的建立:从冰淇淋铃声到数学奇迹
要理解这场动荡,必须先认识统治该领域的“老国王”:奖励预测误差(RPE)假设。
这一理论的根基可以追溯到 1997 年沃尔夫勒姆·舒尔茨(Wolfram Schultz)那个著名的猴子实验。当猴子意外获得果汁时,多巴胺神经元会剧烈放电。但如果实验者在给果汁前先亮起一盏灯,几次重复后,多巴胺的激增点会提前移动到“灯光”——即奖励的信号上。如果灯亮了却没给果汁,多巴胺水平则会像股市跳水一样骤降。
这就像孩子听到冰淇淋车的铃声:第一次听到时,吃到冰淇淋带来的意外惊喜让多巴胺爆发;但经过学习,仅仅是听到铃声(预测信号),大脑就会提前释放多巴胺。如果没有吃到冰淇淋,多巴胺的缺失便形成了“负面预测误差”,告诫大脑:这个信号不靠谱。
普林斯顿大学神经科学家纳撒尼尔·道(Nathaniel Daw)称这是计算神经科学的“高光时刻”。这一被称为“时序差分强化学习”(TDRL)的模型提供了一个完美的宏大叙事:它将微观的神经元放电、复杂的机器学习算法与宏观的行为习惯、乃至成瘾的病理机制完整地串联在了一起。在这个框架下,多巴胺不是“快乐”,而是大脑用来校准未来决策的“价值信号”。
动摇的“王座”:那些被修补的例外
“如果你想向国王发起挑战,你最好不要失手。”阿拉巴马大学伯明翰分校的神经科学家卡埃·科斯塔(Kauê Costa)这样评价当前的局势。
过去十年,技术的爆发(如基因编码传感器和光纤记录技术)让科学家能以前所未有的精度窥探大脑深处。然而,由此产生的数据开始不断撕裂旧模型的边缘。研究人员发现,多巴胺神经元竟然对动物在迷宫中的位置、移动速度,甚至是电击等压力刺激(Aversive stimuli)产生响应。
这些现象在 RPE 模型中显得格格不入。为了挽救旧模型,支持者们引入了各种复杂的修补。一个典型的例子是“多巴胺攀升”(Dopamine Ramps):当动物接近预期奖励时,多巴胺会持续稳步增长,而非仅仅在信号点爆发。为了让这符合 RPE 逻辑,科学家不得不假设大脑正在进行某种极其复杂的“瞬时价值计算”。
霍华德·休斯医学研究所的乔希·杜德曼(Josh Dudman)指出,这种不断叠加的补丁让人感到不安:“我们开始看到一堆例外情况,模型在这些地方不再那么奏效了。”
颠覆逻辑:向后看的“溯源学习”
在这一背景下,加州大学旧金山分校的维杰·莫汉·南布迪里(Vijay Mohan Namboodiri)提出了一个名为 ANCCR(经因果关系调整的净关联) 的新模型,直接将 RPE 的逻辑调转了 180 度。
RPE 模型是“向前看”的:看到信号,预测结果。而 ANCCR 则认为大脑是“向后看”的:当一个具有生物意义的事件(如获得糖水或遭遇电击)发生时,大脑会启动一次回溯搜索——“刚才发生了什么导致了这个结果?”
南布迪里的实验极具说服力:对于从未接受训练的小鼠,如果随机给予糖水,RPE 模型预测其多巴胺反应会随时间推移而下降(因为惊喜感消失);但实验结果截然相反,多巴胺反应反而增加了。这是因为在 ANCCR 逻辑中,多巴胺是在释放一个强烈的追溯信号:这件事很有意义,去寻找它的因果链接(Causal contingency)!这种“溯源学习”在面对复杂多变的自然环境时,显然比死板的概率预测更具生存优势。
成瘾与复发的深层真相:为何戒断无法抹去记忆?
这种模型认知的转变,为困扰医学界数十年的成瘾复发难题提供了残酷而精准的解释。
在传统的 RPE/TDRL 框架下,戒烟或戒毒应该是一个简单的“去学习”过程:如果你反复看到别人抽烟(信号)却不摄入尼古丁(无奖励),这种“负面预测误差”理论上应该逐渐削弱并最终抹除关联。然而现实中,即便戒断多年,老地方、老朋友这些环境线索依然能瞬间触发强烈的复吸欲望。
根据 ANCCR 模型,这是因为多巴胺形成的关联并非脆弱的预测,而是牢固的“因果溯源”。在成瘾者的大脑中,尼古丁作为一种极强的“意义信号”,会让大脑百分之百地认定其之前的环境线索就是“因”。这种基于回溯形成的因果链接几乎是不可逆的。只要“因”的记忆还在,单纯的戒断时间根本无法通过所谓的“预测误差”来修正这种根深蒂固的逻辑。
科学惯性:那个“大到不能倒”的模型
为什么一个千疮百孔的模型依然统治着学界?这涉及到了科学进步中残酷的人性冲突。
范德堡大学的艾琳·卡利帕里(Erin Calipari)曾经历过一段她称之为“来自地狱的反驳”的往事。当她提交关于多巴胺响应压力刺激(如足部电击)的研究时,遭遇了审稿人的集体抵制。学术界长期以来的偏见要求她必须将数据强行解释为“与奖励相关”。
在过去三十年里,RPE 已经不仅仅是一个数学模型,它已经演变成了一套庞大的科研范式和资助体系,变得“大到不能倒”。任何试图否认多巴胺“奖励属性”的尝试,都被视为是对整个领域基石的亵渎。
结语:超越数学模型的生命底色
这场发生在塞维利亚的学术风暴,其实质是对生命本质理解的跨越。
正如卡利帕里所言,多巴胺可能根本不是某种特定的“信号灯”,而是一种“系统优化器”。它在后台默默运作,让其他神经系统运作得更高效,帮助大脑在混沌的信息流中快速锁定任务重点。
这对临床治疗意味着巨大的分水岭。如果多巴胺不仅仅是奖励信号,那么治疗 ADHD 的药物(如利他林)的作用机理可能就需要重新评估——它可能不是在“补充快乐”,而是在通过多巴胺优化整个认知系统的处理效率。
或许,我们应该放弃寻找那个唯一的、全能的“快乐分子”,转而接受大脑是一个比数学模型更复杂、更灵活,也更具生存智慧的生命系统。正如这场科学博弈所揭示的:当我们承认自己可能对这个最熟悉的分子“全错了”的时候,我们才真正开始了通往真理的旅程。

共有 0 条评论