绕过VTA:丘脑对纹状体多巴胺的调节优先保障安全

《Nature Communications》:Bypassing the VTA: Thalamic modulation of striatal dopamine prioritizes safety

【字体: 时间:2026年06月05日 来源:Nature Communications 15.7

编辑推荐:

  在动态环境中生存需要进行不断的权衡,在此过程中,必须以快速压倒追求奖赏的行为,转而采取规避风险和寻求安全的行动。虽然中脑多巴胺(DA)神经元编码预测误差,使得外在奖赏能够塑造目标导向行为,但这种强化学习的经典观点无法解释内部目标(如安全)是如何被优先考虑的,也

  
在动态环境中生存需要进行不断的权衡,在此过程中,必须以快速压倒追求奖赏的行为,转而采取规避风险和寻求安全的行动。虽然中脑多巴胺(DA)神经元编码预测误差,使得外在奖赏能够塑造目标导向行为,但这种强化学习的经典观点无法解释内部目标(如安全)是如何被优先考虑的,也无法解释纹状体多巴胺释放如何被选择性调节以支持这一过程。 丘脑室旁核(PVT)已成为一个能够协调从奖赏导向转向安全导向行动的核心节点。PVT是一个独特的丘脑枢纽,在这里内部信号与情境和认知信息汇聚,从而产生强大的行为自上而下调控。令人信服的在体数据显示,PVT的活动具有高度的状态依赖性,因为PVT神经元会被应激源和厌恶事件强烈激活,但在主动的目标导向奖赏寻求和消费过程中其活动却被显著抑制。多项研究现已证实,PVT通过投射到伏隔核(NAc)来强力抑制奖赏寻求;然而,同一通路也被认为参与驱动安全导向行为,这表明PVT→NAc投射神经元既能抑制也能促进与生存相关的行为。 在此,Macdonald及其同事提供了一个关键的缺失环节,证明PVT→NAc神经元以一种比以往理解的更为复杂的方式,支持风险规避和安全寻求。虽然既往研究表明PVT可以通过激活伏隔核小清蛋白中间神经元(PV-INs)来抑制危险或不恰当的目标导向行动,但本研究揭示,PVT还可以通过募集伏隔核胆碱能中间神经元(CINs)来改变行为,使其转向风险规避和安全学习。令人印象深刻的是,研究人员发现PVT投射神经元募集伏隔核CINs,进而以一种脱离腹侧被盖区(VTA)胞体细胞体活动的方式驱动末梢多巴胺释放。 总体而言,这些发现表明PVT作为一种高效、双通道的生存机制发挥作用。PVT接收编码环境和内部状态需求的密集皮层和皮层下输入。PVT并未将这种整合后的信号分发到平行网络中,而是利用不同的纹状体微环路,同时抑制目标导向行动(通过PV-INs)并驱动规避和安全学习(通过CINs)。尽管这些输出看似对立,但最好将其理解为行为策略(即生存)的互补分支。至关重要的是,这种输出架构赋予了PVT异常强大的自上而下的控制力。通过同时作用于PV-INs和CINs,PVT在伏隔核的两个不同环路模块——即中型多棘神经元(MSNs)和多巴胺能轴突上,覆盖了中脑边缘多巴胺系统,而无需在平行网络中进行冗余的计算投入。 有趣的是,PVT还直接向伏隔核多巴胺D1受体(D1)和多巴胺D2受体(D2)表达的MSNs发送输入。然而,PVT如何通过伏隔核MSNs调节行为尚不完全清楚。越来越多的证据表明,阿片类药物的使用会增强PVT→NAcD2-MSN通路,从而驱动与戒断相关的厌恶状态,并通过增加对投射到下丘脑的D1-MSNs的抑制来促进复吸。进一步增加复杂性的是,据报道伏隔核D2-MSNs通过内源性大麻素信号逆向调节PVT→NAc末梢的活动,这表明该环路既参与奖赏寻求的启动也参与其终止,并进一步揭示了可调节该通路的各种神经调质范围。 PVT的分子结构使其成为神经调质系统的关键作用位点。具体而言,PVT→NAc投射富含μ-阿片受体、D2受体和大麻素受体;包含促肾上腺皮质激素释放激素(CRH)表达神经元;且PVT中的食欲素信号可以调节伏隔核活动。这种丰富的神经调质影响使得PVT→NAc投射成为适应性和生存动机行为的关键介导者,但也使其异常容易受到滥用药的影响。例如,急性或慢性暴露于阿片类药物会通过μ-阿片受体削弱对伏隔核PV-INs的突触支配,从而损害行为抑制,同时增强对伏隔核D2-MSNs的输入,促进厌恶性的戒断症状和复吸。阿片类药物或其他滥用药物是否同样会失调PVT→NAcCIN突触,导致安全学习和风险规避缺陷,只是本研究提出的众多引人注目的问题之一。 本文所述发现重构了我们对PVT调节行为方式的思考,并引发了与PVT→NAc环路相关的诸多引人关注的问题。例如,不同的刺激是否会分别激活PVT→NAcCIN(规避、安全)和PVT→NAcPV-IN(抑制奖赏寻求)环路,或者它们是同时被募集的?相同的PVT神经元是否投射到伏隔核中的PV-INs和CINs,以引导行为远离不当的奖赏寻求并转向规避?还是存在非重叠的平行环路?一种可能性是,基于奖赏寻求和规避/安全学习期间独特的计算动力学定义的独特PVT→NAc神经元群,对不同的下游靶标(即PV-INs与CINs)具有突触偏向性。虽然解决此类问题具有挑战性,但这些计算上不同的PVT→NAc群可能与转录组学上独特的细胞类型重叠;事实上,有证据支持PVT内基于基因表达的行为编码存在差异。因此,鉴于PVT→NAc微环路在适应性行为策略中发挥的关键作用,它们代表了治疗物质使用障碍等神经精神疾病的一个有前景的靶点,在这些疾病中,行为抑制和风险规避受到严重损害。

论文解读:绕过VTA的丘脑纹状体多巴胺调节与安全优先机制

研究背景与问题提出

在动态的自然环境中,生物体的生存依赖于奖赏导向行为与风险规避及安全寻求之间的精确平衡。传统的强化学习理论认为,中脑多巴胺(DA)神经元通过编码奖赏预测误差来塑造目标导向行为。然而,这一经典框架无法充分解释生物体如何将“安全”这一内部目标置于优先地位,亦无法阐明纹状体多巴胺释放如何被选择性调节以支持生存策略。因此,探索大脑中是否存在绕过经典中脑腹侧被盖区(VTA)通路的替代机制,成为了亟待解决的科学问题。
针对这一空白,研究人员聚焦于丘脑室旁核(PVT)这一关键脑区。PVT作为内部信号与情境信息的汇聚枢纽,已被证实在应激反应及行为调控中发挥重要作用。本研究旨在揭示PVT如何通过特定的神经微环路,实现对伏隔核(NAc)多巴胺信号的调节,从而在不依赖VTA胞体活动的情况下,优先驱动安全导向行为。

关键技术方法

为了深入解析上述机制,研究人员采用了多学科交叉的实验技术体系。在神经环路示踪方面,研究利用了病毒追踪技术结合光遗传学手段,特异性地操控PVT至伏隔核(PVT→NAc)的投射通路。在神经活动监测上,研究结合了在体钙成像技术以实时记录神经元集群的动态变化,并运用了光纤光度法测定特定神经末梢的多巴胺释放水平。此外,为了验证行为学功能,研究人员设计了包括主动回避学习、奖赏寻求抑制及安全性测试在内的多种行为范式。

研究结果

1. PVT作为生存导向的双重调控中心
研究发现,PVT不仅仅是一个被动的信息传递站,而是一个高度状态依赖的行为调控中心。当生物体面临压力或厌恶刺激时,PVT神经元被强烈激活;而在积极寻求奖赏时,其活动则受到抑制。这种特性使得PVT能够根据环境需求,灵活地在“奖赏模式”与“生存模式”之间进行切换。
2. 双通道微环路的并行运作机制
本研究的重大突破在于揭示了PVT调控行为的“双通道”机制。一方面,PVT通过激活伏隔核中的小清蛋白中间神经元(PV-INs),对中型多棘神经元(MSNs)产生前馈抑制,从而迅速压制不恰当或危险的奖赏寻求行为。另一方面,PVT通过募集伏隔核胆碱能中间神经元(CINs),诱导纹状体局部产生多巴胺释放。这种由胆碱能系统触发的多巴胺信号,独立于经典的VTA胞体放电活动,专门服务于风险规避与安全学习过程。
3. 分子架构与病理意义
研究进一步指出,PVT→NAc通路拥有复杂的分子架构,富集了μ-阿片受体、D2受体及大麻素受体等神经调质受体。这种分子特性虽然增强了机体对环境变化的适应能力,但也使该通路极易受到药物滥用的侵袭。例如,阿片类药物会破坏PVT对PV-INs的突触支配,削弱行为抑制能力,同时增强对D2-MSNs的输入,诱发厌恶性的戒断症状及复吸行为。

讨论与结论

综上所述,Macdonald等人的研究确立了一种全新的“绕过VTA”的生存神经机制。研究表明,丘脑室旁核(PVT)通过双通道微环路——即通过PVT→NAcPV-INs通路抑制不当奖赏行为,以及通过PVT→NAcCINs通路促进安全学习——实现了对生物体生存策略的高效自上而下的控制。这一发现不仅填补了经典强化学习理论在解释内部目标驱动行为方面的空白,也为理解药物成瘾、焦虑症及创伤后应激障碍等神经精神疾病的病理机制提供了全新的环路视角。未来针对PVT→NAc环路的靶向干预,有望成为治疗物质使用障碍及相关行为缺陷的有效策略。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号