《Expert Systems with Applications》:Expert systems for predicting the efficiencies of photomultiplication organic photodetectors
编辑推荐:
有机光电探测器(OPDs)因轻量、可弯曲、低成本等特性成为光电子领域重要研究方向,而光生倍增效应(PM)可显著提升OPDs探测弱光信号的能力。本研究构建首个包含141种PM-OPD器件材料SMILES代码、 frontier分子轨道能量、暗电流、EQE值等关键参数的数据库,并基于支持向量回归(SVR)、随机森林(RF)、CatBoost和人工神经网络(ANN)开发预测模型,验证其相关系数均超0.9且具备泛化能力。
李祖信|余宏年|程成勋|程彦如|许链书|朱大雅|卢建平|张一鸣|陈芳忠
台湾新竹30010国立阳明交通大学电气与计算机工程学院光子学系
摘要
由于具有高灵敏度和可调的光谱响应,光倍增有机光电探测器(PM-OPDs)受到了广泛关注,使其成为先进光电应用的有希望的候选者。为了持续改进其性能,进行广泛的实验研究是必要的。然而,计算机辅助的材料筛选可以显著加速PM-OPDs的发展。因此,我们提供了一个全面的数据集,其中包含了关键的设备性能指标、活性层中使用的施主和受体、它们在简化分子输入线系统(SMILES)中的相应代码、前沿分子轨道能级、设备活性区域、施加的偏压、暗电流以及施主和受体的质量比。通过数据分析,我们确定了对训练四种不同机器学习(ML)模型最为重要的PM-OPDs的特征。使用一系列性能指标评估了这些ML模型在预测PM-OPDs的外部量子效率(EQE)方面的性能。结果表明,所有四种ML模型在预测EQE值时都表现出强烈的相关性系数(r > 0.9)。此外,使用一对未见的施主/受体材料制备了PM-OPDs,并利用设备性能来评估ML模型的泛化能力。据我们所知,这项研究提供了第一个专门针对PM-OPDs的数据集和ML模型。我们预期该数据集和ML模型将促进专家系统在有机材料设计和评估方面的创新应用。
引言
有机光电探测器(OPDs)因其优越的特性而受到越来越多的关注,包括轻量化、机械灵活性、低成本、大面积可扩展性和半透明性(Zhang等人,2025a;Huang等人,2025;Wang等人,2026)。这些特性使它们成为人工智能驱动的日常生活领域应用的强大候选者。与无机光电探测器不同,OPDs可以使用廉价的湿法工艺技术制造,如旋涂、槽模涂布、刀片涂布和喷墨打印。此外,能够定制有机半导体的化学结构,使得OPDs可以在从紫外(UV)到近红外(NIR)光的整个电磁光谱范围内实现可定制的响应范围(Zhang等人,2025a;Huang等人,2025;Wang等人,2022)。最先进的OPDs在可见光谱范围内的性能可与商用低噪声硅光电二极管(PDs)相媲美(Fuentes-Hernandez等人,2020)。随着其光谱响应扩展到短波红外(SWIR)区域,OPDs正成为一种极具竞争力的传感技术(Zhang等人,2024a;Chen等人,2024;Tsai等人,2024;Yuan等人,2025)。
在室温下,由于有机半导体中电子施主和受体之间的高结合能,光生激子主要在它们之间的界面处解离(Zhu等人,2022;Chen,2018)。与有机光伏类似,OPDs通常采用体异质结(BHJs)的概念进行设计(Zhang等人,2025a;Carrillo-Sendejas & Maldonado 2025)。在这种配置中,施主和受体分子混合在一起,形成了大量的施主-受体界面。因此,在光激发下,可以生成高密度的自由载流子,从而产生高光电流和检测信号。此外,表现出光倍增(PM)效应的OPDs的外部量子效率(EQE)可超过100%,这对于无需复杂放大系统即可检测微弱光信号具有显著优势(Chen等人,2008;Chuang等人,2012;Huang等人,2025;Kim等人,2024;Li等人,2015a;Suthar等人,2023;Suthar等人,2024;Suthar等人,2025;Wang等人,2018;Wang等人,2023;Wang等人,2024;Zhang等人,2025b;Zhao等人,2022;Zhao等人,2025)。已经研究了多种触发PM现象的策略。这些器件机制通常涉及利用施主与受体比例的显著差异来创建电荷陷阱,或在电极处加入电荷阻挡层以阻碍电荷传输。这种不平衡的电荷传输导致电荷在光活性层内积累,从而促进界面带弯曲。结果,载流子可以通过高效的隧穿注入更容易克服界面能量障碍,从而提高增益特性和增强PM效应(Chen等人,2008;Chuang等人,2012;Kim等人,2024a;Suthar等人,2023;Suthar等人,2024;Suthar等人,2025;Wang等人,2023;Zhang等人,2025b;Zhao等人,2025)。
通过改进器件工程、材料合成、加工技术和形态优化,在高性能OPDs领域取得了显著进展。然而,为各种类型的OPDs开发合适的有机化合物和器件架构仍然非常具有挑战性,通常需要大量的昂贵实验工作。相比之下,计算机辅助技术已被证明在构建定量结构-性质关系(QSPR)模型方面非常有效,这些模型成功地将材料结构与其性质联系起来(Butler等人,2018;Greenstein等人,2022;Kim等人,2024b;Kranthiraja等人,2022;Mahmood等人,2022;Padula等人,2019;Wu等人,2020;Zhang等人,2025c)。已经开发了多种数据驱动的机器学习(ML)和深度学习(DL)模型来自动化材料选择并提高高通量材料筛选。例如,ML技术已被有效用于快速预测有机太阳能电池(OSCs)的功率转换效率(Zhu等人,2024;Zhang等人,2022)。许多ML算法在预测富勒烯和非富勒烯基OSCs的效率方面取得了显著的准确性。此外,ML辅助的虚拟筛选已经识别出高性能的施主和受体分子,并通过实验方法验证了它们的器件性能。最近,一些ML模型还展示了准确预测室内有机光伏系统功率转换效率值的能力(Yu等人,2025)。还开发了用于解释和预测OSCs效率退化的通用ML模型(Valiente等人,2026)。同样,数据驱动技术也被越来越多地用于识别有机发光二极管(OLEDs)的有机材料(Gómez-Bombarelli等人,2016;Jeong等人,2022;Kim等人,2025)。2016年,Aspuru-Guzik等人开发了一种基于神经网络的深度学习架构,有效识别了热激活延迟荧光(TADF)发射体。在分析了160万种分子的搜索空间后,他们实现了22%的有希望的外部量子效率(EQE)(Gómez-Bombarelli等人,2016)。
虽然许多数据驱动的ML方法已被用于预测有机材料的性质和有机电子领域(包括OLEDs和OSCs)中器件的性能,但专门针对OPDs的研究仍然相对较少。在这里,我们建立了一个数据集,概述了表现出PM效应的材料的性质和OPDs的器件性能。该数据集包括141个子集,这些子集是由施主(D)和受体(A)材料的组合生成的,其化学结构使用简化分子输入线系统(SMILES)表示法记录。它还包含了关键的设备特性,如施加的偏压、暗电流(Jiang等人,2025)、光谱响应、EQE值、施主和受体的质量比等。此外,它还提供了这些材料的前沿分子轨道(FMO)能级信息。基于该数据集,我们开发了四种ML模型:支持向量回归(SVR)(Chen,2019;Eibeck等人,2021)、随机森林(RF)(Chen,2019;Eibeck等人,2021;Nagasawa等人,2018)、CatBoost(Hasan等人,2025;Zhang等人,2024b)和人工神经网络(ANN)(Malhotra等人,2022;Sun等人,2019)。
这些模型旨在预测PM-OPDs的EQE值。所有ML算法都表现出出色的性能,皮尔逊相关系数(r)值超过0.9,这突显了它们在加速发现有效的施主/受体(D/A)组合以用于PM-OPDs方面的巨大潜力。此外,我们还展示了这些模型对潜在有机材料进行虚拟筛选的能力。我们预期这项研究的结果将为高性能OPDs的进一步发展提供有价值的基础,并为构建有前景的化学结构提供有洞察力的设计指南。
章节摘录
ML建模
本研究使用的数据集包含了从相关文献中手动编译的材料性质和器件性能指标。本研究中检验的ML模型是使用scikit-learn库在Python中实现的。化学结构转换为SMILES字符串是使用ChemSketch软件完成的,然后使用RDKit库将其转换为分子指纹。转换使用了Morgan算法,以及默认的哈希值
数据描述和相关性分析
图1(a)展示了OPDs的典型器件结构。它由一层有机施主和受体材料组成,这些材料夹在两个电极之间。图1(b)显示了一个施主和受体对的化学结构示例。为了提高电荷收集效率,可以在电极和有机层之间集成界面层。在有机半导体中,激子的结合能通常很高,这使得...
结论
我们手动收集了一个数据集,详细记录了材料的性质和PM-OPDs的性能。这些数据包括D/A材料的SMILES代码,以及它们的FMOs、器件活性区域、施加的偏压、暗电流和施主与受体的质量比等信息。此外,它还包含了器件的关键性能指标,包括光谱响应、EQE值、峰值位置和检测灵敏度。据我们所知,这项研究提供了第一个数据集...
未引用的参考文献
Greenstein和Hutchison,2022;Kim等人,2024;Kranthiraja和Saeki,2022;Li等人,2015;Li等人,2015;Yu等人,2026;Zhang等人,2024;Zhang和Jáno?ík,2024;Zhang等人,2025;Zhang等人,2025;Zhang等人,2025;Zhang等人,2025。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
致谢
作者感谢台湾国家科学技术委员会(grant no. NSTC 112-2221-E-A49-072-MY3和114-2221-E-A49-045-MY3)以及台湾教育部高等教育Sprout项目框架内的特色领域研究中心计划的支持。这项工作还得到了加拿大国家研究委员会AI for Design Challenge计划的财政支持。