有机分子指纹图谱驱动的二维杂化钙钛矿逆向设计:靶向能级对准的定制策略

《SCIENCE ADVANCES》:Fingerprinting organic molecules for the inverse design of two-dimensional hybrid perovskites with target energetics

【字体: 时间:2026年04月20日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  二维(2D)杂化钙钛矿因其优异的光电性能成为前沿材料,但传统的有机间隔基团设计严重依赖试错法和专家经验,难以在广阔的化学空间中探索具有靶向性能的材料。为解决这一问题,研究人员开发了一种结合可逆分子指纹表示、高通量密度泛函理论(DFT)计算、可解释机器学习(ML)和合成可行性筛选的逆向设计流程。该工作成功识别出有望实现Ib、IIa和IIb型能级对准的有机间隔基候选分子,为按需设计具有靶向能级对准的二维Dion-Jacobson(DJ)杂化钙钛矿开辟了高效、可解释的新路径。

  
在人工智能(AI)浪潮席卷科学研究的今天,材料发现领域正在经历一场深刻的范式转变。特别是二维(2D)杂化钙钛矿,以其在太阳能电池、发光二极管(LED)等光电器件中展现出的卓越性能,成为了备受瞩目的前沿阵地。这类材料的独特之处在于其“三明治”般的层状结构:无机金属卤化物骨架被有机阳离子间隔基像夹心一样隔开。这赋予了科研人员一个绝妙的“调色盘”——通过改变有机间隔基,可以精细调控材料的能带结构、电荷传输和稳定性,从而“定制”出具有特定光电性能的材料。
然而,通往理想材料的道路并非坦途。与无机成分的“规矩”不同,有机分子的世界浩瀚无垠,其化学空间(即所有可能的分子结构组合)庞大到难以想象。遗憾的是,目前针对二维钙钛矿有机间隔基的设计,很大程度上仍停留在“试错法”和经验直觉的层面,好比大海捞针。研究者们通常只能在已知的少数几种有机分子骨架上修修改改,或者借鉴有机光伏领域的分子片段。这种“顺向”设计模式,极大地限制了对广阔化学空间的探索,也阻碍了人们深入理解材料结构与性能之间的关联,特别是对于能级对准这一核心性质的系统设计与预测。能级对准决定了半导体材料及其界面处电荷载流子和激子的空间分布与转移,直接关系到光电器件的最终性能。在二维杂化钙钛矿中,有机和无机组分拥有各自独立的“能级阶梯”(即能带结构),它们如何“对齐”(即形成I型、II型等能级排布方式),是控制器件物理过程的关键。目前,利用AI辅助工作流来预测二维钙钛矿物理性质,尤其是系统地探索能级对准的研究,仍处于起步阶段。
面对这一挑战,一项发表于《SCIENCE ADVANCES》的研究带来了突破性的解决方案。研究者们摒弃了传统的“顺向”搜寻策略,转而采用一种全新的“逆向设计”工作流,其核心是引入了一种针对数百万个共轭双铵有机间隔基的可逆指纹表示法。这意味着,研究者可以从想要的性能(特定的能级对准类型)出发,反向推导和设计出可能实现该性能的有机分子结构,将“按需设计”二维杂化钙钛矿的梦想向前推进了一大步。
研究者为开展此项研究,主要整合运用了以下几种关键技术方法:首先,他们开发了一套独特的、可逆的12位数分子指纹表示方案,用以编码和描述Dion-Jacobson(DJ)相钙钛矿中有机间隔基的结构特征。其次,以简单的PDMA分子为起点,采用分子“变形”操作策略,系统性地生成了包含数百万个假设候选分子的庞大化学空间。再次,通过高通量密度泛函理论(DFT)计算,获取了数千个候选分子所对应钙钛矿的能级数据,作为机器学习模型的训练集。然后,利用多种回归模型(如LASSO回归等)训练,建立从分子指纹到有机前沿轨道能级(HOMO/LUMO)的预测模型。最后,构建了一个包含有机分子合成可及性(基于PubChem数据库查询)和二维结构形成能力评估的两步合成可行性筛选漏斗,对预测结果进行过滤和验证。
可逆分子指纹与AI辅助逆向设计工作流
该研究的基石是一个为DJ相二维钙钛矿量身定制的、可逆的12位数分子指纹。研究者洞察到已报道的共轭双铵间隔基共享一些结构基元,因此将分子分解为四个片段:芳香环构成的共轭主链、两个锚定在无机骨架上的铵基、可选的杂原子取代和可选的侧链。通过对这四部分进行编码,最终形成一个紧凑的12维指纹向量。这种表示法高效、可解释,最关键的是具有“可逆性”——可以从指纹反向映射回一组可能的分子结构,这是实现逆向设计的关键。基于此指纹,研究者构建了一个完整的AI辅助逆向设计工作流。该流程始于以PDMA分子为“种子”的化学空间扩展,通过13种“变形”操作迭代生成数百万个假设的有机间隔基。随后,对其中一部分(G0到G3)进行高通量DFT计算,获取其能级数据以训练机器学习模型。接着,利用训练好的模型预测所有假设分子的能级,并结合合成可行性筛选(PubChem可及性和二维结构形成性评分)进行初筛。最后,对有望实现目标能级对准类型的候选分子进行DFT验证。通过整合这些组件,该工作流能够高效地逆向设计出具有目标能级对准类型的DJ相钙钛矿。
化学空间建立与高通量计算
研究者采用分子变形方法,从G0(PDMA)开始,系统生成了直至G6代的约488万个假设有机间隔基,对应的指纹数超过2.1万个。所有21个已报道的实验有机间隔基都被包含在这个集合中,证明了所枚举化学空间的代表性和覆盖度。对其中G0到G2代(共261个)的DJ钙钛矿进行的DFT计算分析显示,大多数已报道结构(21个中的18个)表现出Ia型能级对准,其余3个为IIa型。能级对准的变化主要由有机前沿轨道能级决定,其能量跨度很大(约6.1 eV),而无机带边的变化则小得多(约0.9 eV)。这验证了文献中常见的近似:二维钙钛矿的无机能级在不同有机间隔基下几乎保持不变。分析还表明,有机部分的最高占据分子轨道(HOMO)和最低未占分子轨道(LUMO)能级分散很小,与孤立分子状态非常相似,这主要归因于有机单元间的弱电子相互作用。
机器学习预测有机前沿能级
研究者使用G0到G3代共3239个有机间隔基的数据(指纹为特征,DFT计算的HOMO/LUMO值为目标)训练机器学习模型。线性模型(如LASSO回归)和非线性模型都表现出优异的预测性能(R2分数高达0.99)。为了兼顾可解释性和扩展性,研究者选择了LASSO回归模型。通过对模型系数和SHAP值的分析,可以清晰地解读出结构-性能关系。影响HOMO能级最重要的特征是芳香环数量(x1)和伯铵基数(x4);而对LUMO能级影响最大的是伯铵基数(x4)。这揭示了重要的设计规则:调节共轭主链的尺寸(芳香环数量)可以改变共轭程度,从而有效调控前沿轨道能级;而调整铵基连接基的长度或数量,可以同时影响HOMO和LUMO能级。杂原子取代的影响则取决于其电子性质(给电子或吸电子)。
合成可行性筛选
考虑到实验实现的可能,研究者设计了一个两步合成可行性筛选漏斗。第一步评估有机间隔基的合成可及性,以其中性形式是否存在于PubChem数据库作为代理指标。在枚举的化学空间中,共有9025个间隔基存在于PubChem中,且随着分子复杂性(代际)增加,可及性比例下降。第二步评估形成稳定二维DJ相结构的能力。研究者基于五个拓扑分子描述符(包括空间位阻、偏心度、氮-氮对距离、间隔基尾部的可旋转键数以及铵基在骨架上的相对位置)构建了一个形成性评分,并设定了0.88的阈值。该评分能有效区分已报道的2D与非2D结构。应用此评分发现,96.1%的假设间隔基都有可能形成DJ相,表明大量二维杂化钙钛矿有待发现。非2D案例多与小的单环有机间隔基相关。
逆向设计最终候选分子
在上述针对G0到G6代的“穷举”式探索中,研究者成功找到了8个IIa型和44个IIb型候选分子,并通过了DFT验证,但未在G0到G6代内找到符合合成可行性要求的Ib型分子。为了突破这一限制,并探索更广阔的化学空间,研究者启动了基于指纹约束的逆向设计策略。他们不再穷举所有分子,而是根据对目标能级对准类型指纹特征的分析,施加特定的指纹约束来引导分子生成方向。例如,针对Ib型,约束为具有多个稠合苯环的共轭主链;针对IIb型,则限制为单环结构等。通过这种定向搜索,研究者在更高代际中成功发现了2个Ib型(G7-G8)、12个IIa型(G3-G9)和42个IIb型(G2-G6)有机间隔基候选分子。代表性分子包括:基于并五苯骨架的Ib型间隔基,基于少环并苯或联噻吩的IIa型间隔基,以及基于吡啶型氮杂环(如二嗪类)的IIb型间隔基。
研究结论与意义
该研究成功展示了一种基于可逆分子指纹的AI辅助逆向设计工作流,能够高效导航二维DJ相钙钛矿广阔的有机间隔基化学空间,并靶向发现具有特定能级对准类型(Ib、IIa、IIb)的新材料。这项工作的核心贡献在于将领域知识(对DJ相钙钛矿结构特征的理解)融入到一种物理信息丰富、可解释且可逆的分子表示法中,从而克服了数据稀缺的瓶颈,实现了从性能目标反向推导分子结构的逆向设计。从仅有的21个已知结构出发,该流程导航了约百万量级的化学空间,最终确定了56个有前景的候选分子,显著扩展了二维钙钛矿的已知能级对准类型范围。
这项研究的意义深远。首先,它为解决杂化材料设计中“化学空间浩瀚”与“实验探索低效”之间的矛盾提供了可推广的范式。其次,所开发的可逆指纹和逆向设计流程具有高度的可定制性和可扩展性,未来可通过修改目标性质、调整指纹方案或升级流程中的模块(如采用更先进的机器学习模型或实验数据),应用于优化其他材料性质(如手性、电荷传输)或拓展至其他杂化材料体系。尽管当前工作存在一定局限(如对复杂三维构型分子的编码能力、合成可行性评估的启发性等),并且有待后续实验的最终验证,但它无疑是迈向更强大、更实用的AI辅助材料设计的重要一步。它呼吁钙钛矿领域的研究者共同努力,探索杂化材料设计中尚未开发的广阔区域,通过人机协作,加速下一代高性能光电子材料的发现与应用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号