光程长度对用于测量材料整体性能的红外光谱准确度的影响

《Vibrational Spectroscopy》:Influence of path length on the accuracy of infrared (IR) spectroscopy for bulk property measurements

【字体: 时间:2026年06月23日 来源:Vibrational Spectroscopy 3.1

编辑推荐:

  冈田春奈|斯科特·T·桑德斯 泰国沙功那空拉贾巴特大学机械与工业技术系,沙功那空47000 摘要 透射式流动池的光程长度是影响红外光谱定量准确性的关键参数。本研究利用基于机器学习的通用框架,探讨光程长度如何影响用于测定物质整体性质的红外光谱的准确性。研究以一种机载燃

  冈田春奈|斯科特·T·桑德斯
泰国沙功那空拉贾巴特大学机械与工业技术系,沙功那空47000

摘要
透射式流动池的光程长度是影响红外光谱定量准确性的关键参数。本研究利用基于机器学习的通用框架,探讨光程长度如何影响用于测定物质整体性质的红外光谱的准确性。研究以一种机载燃料传感应用为例,该应用旨在通过5.8–7.2微米波段的中红外光谱预测喷气燃料及燃料混合物的衍生十六烷值。通过对照实验数据进行缩放模拟,研究了从1×10??到500微米不等的不同光程长度下的光谱情况。结果表明,过短的光程长度会导致吸收不足和信噪比过低,从而降低预测精度;而过长的光程长度则会造成强烈的吸收饱和效应以及光谱伪影,进而降低模型性能。在模拟框架中发现了10至58.7微米这一近乎最优的范围,在该范围内光谱具有适度的吸收强度、较低的饱和度以及最小的失真现象。这些研究结果表明,允许适度的吸收饱和可以通过提高与目标性质最相关的波长处的信噪比来提升预测精度,同时也强调了确定最佳测量条件时应以预测性能为依据,而非仅仅追求在传统吸收限度内最大化信噪比。

引言
流动池的光程长度选择是影响红外光谱准确性的重要因素。红外光谱已被广泛用于定量分析,例如测定混合物中的化合物浓度。它还可用于识别官能团的存在,从而帮助推断物质的化学和物理性质以及分子结构[1][2][3]。由于光程长度会影响吸收强度,进而影响所测光谱的信噪比,因此通常会选择能够最大化信噪比且符合实际约束条件的光程长度,而非单纯优化目标性质的预测精度。对于稀溶液或弱吸收物质,使用尽可能长的光程长度是常见且合适的做法。而对于强吸收物质,光程长度的选择则更为复杂,本文研究的也正是这种情况。在这种情况下,人们通常会选择避免饱和的光程长度(通常要求透射率至少为1%)。虽然这种方法通常能获得高信噪比的光谱,但并不一定能保证从光谱中准确预测目标性质。

已有多项研究尝试通过将红外光谱数据与机器学习技术相结合,采用更系统的方法选择光程长度,以获得最准确的分析结果[4][5][6][7][8][9][10][11]。加西亚·马丁[4]研究了利用可见光/近红外光谱同时优化光程长度和波长选择以测定橄榄油的游离酸度,表明要实现精确的多变量预测,必须对光程长度和光谱区域进行协同优化。马库斯等人[5]则研究了利用吸收光谱高灵敏度测定臭氧浓度时的光程长度优化问题,发现同时优化光程长度和吸收截面可显著提升检测限。萨拉明等人[6]提出了一种用于光谱多组分分析中同步选择波长和光程长度的正式方法,为这两种参数相互依赖的情况提供了系统的化学计量学框架。徐等人[9]开发了一种用于定量近红外分析的光程长度选择方法,表明基于光谱信息含量而非仅依据信噪比标准来优化光程长度,可提升模型性能。刘等人[10]进一步扩展了这一概念,提出了一种用于近红外光谱的联合最优光程长度方法,通过同时考虑多个光程长度来最大化定量精度。

然而,这些研究主要依赖于多元线性回归,即通过将光谱数据与混合物浓度进行线性关联,并且仅考虑了有限范围的光程长度。此外,所研究的光程长度有时会被人为限制在既能产生可测信号又不会导致饱和的范围内。目前还缺乏关于当光程长度包含可能引发吸收饱和的值以及使用非线性机器学习模型时,光程长度对预测精度影响的的研究。这类模型有望提升预测性能,尤其是在测定粘度等混合物的整体性质方面。

吸收饱和是红外光谱中的一个常见问题。当吸收达到饱和状态时,几乎所有入射光都会被吸收,透射强度接近仪器的检测极限。这样一来,微小的吸收变化就无法被区分出来,导致吸收特征呈现平顶状且无法清晰分辨。这种光谱细节的丢失会减少可用信息量,进而降低性质预测的准确性。为减少这类影响,通常会选择0.1到1.0之间的十进制吸光度范围,分别对应90%和10%的透射率,以此确保测量精度。吸光度超过2的值通常被视为已饱和。

本文介绍的方法既适用于气相吸收光谱,也适用于液相吸收光谱,不过后续内容将以液相情况为主进行讨论。光程长度在吸收饱和问题中起着关键作用,因为它决定了有多少光线能与样品发生相互作用。为避免饱和并保持在理想的吸光度范围内,对于在中红外区域(3–25微米)测量的液相样品,光程长度通常控制在10微米以下;而近红外区域(0.8–3微米)的测量则通常需要数十厘米级的光程长度。这种差异源于不同光谱区域内分子吸收强度的差异。中红外区域的吸收主要来自涉及较大偶极矩变化的基频振动跃迁,因此会产生较强的吸收特征[12][13][14];而近红外区域的吸收则主要来自泛频和组合带,其强度要弱得多[12][13][14]。因此,为避免饱和,中红外区域需要较短的光程长度;而为了增强弱信号,近红外区域则需要较长的光程长度。不过,对于中红外区域中强吸收物质而言,往往难以获得足够短的流动池,因此不得不转而使用近红外光谱。

尽管某些情况下吸收强度过高会给测量带来挑战,但由于中红外光谱具有清晰、分辨率高的峰形,能够提供高度具体的分子信息,因此在某些机器学习应用中仍能展现出出色的预测性能。相比之下,近红外光谱则由宽而重叠的谱带组成,化学特异性较低,因而限制了预测精度。不过需要指出的是,中红外光谱与近红外光谱的相对性能强烈依赖于样品类型、仪器设备、预处理策略以及建模方法,因此在进行普遍化推论时需格外谨慎。在某些情况下,即使存在一定程度饱和的中红外光谱,其预测能力也可能优于近红外光谱。

此外,在某些光谱区域内,允许一定程度的吸收饱和实际上有助于提升预测精度。例如,在中红外区域中有一个被称为“指纹区”的范围(约7–14微米),该区域富含对精确化学定性至关重要的独特分子吸收特征[15][16]。不过,这些吸收特征的强度往往低于其他信息量较低的区域的吸收特征,这意味着在强度较高但信息量较低的区域内可能会先出现饱和现象,从而限制了对指纹区的完全优化。

本文提出的方法通过研究包括可能导致吸收饱和在内的多种光程长度对预测精度的影响,弥补了现有研究的不足。需要注意的是,由于在实际实验中很难覆盖如此广泛的光程长度范围,本研究采用了基于模拟的方法,即通过对单个实测光程长度下的光谱进行数学缩放,来表示其他光程长度下的光谱。这种方法存在一定的局限性——下文将详细阐述——因此其结论应被视为参考性意见而非定论。要验证这些研究结果,还需要在多种实际光程长度下进行实验测试。本研究的总体目标是提升预测精度。本研究中所使用的机器学习框架建立在先前研究的基础上[17],它同时支持线性回归模型和非线性回归模型,从而进一步提升预测能力。研究首先确定感兴趣的光谱范围以及需要预测的目标性质,接着筛选出可行的光程长度,对于每一个候选光程长度,机器学习模型会选出能够带来最佳预测性能的波长子集,最后比较所有光程长度下的预测结果。

这种方法可应用于各种场景中的光程长度选择,且机器学习模型也可根据不同的目标性质进行调整,不过目前的演示仅限于一个具体的应用场景、光谱范围和目标性质,具体如下所述。在本研究中,我们专注于利用5.8–7.2微米(1380–1720厘米?1)范围内的吸收光谱来预测喷气燃料的衍生十六烷值,这一波长范围恰好对应一种商用量子级联可调谐激光器(sQCL,Block Engineering)的发射范围。我们测试了从10??到500微米不等的光程长度。虽然这些极端值可能在实际应用中并不可行——过短的光程可能根本不存在,而过长的光程则可能导致过度饱和——但它们有助于研究信噪比和饱和效应如何影响预测精度。较短的光程长度虽能减少饱和,但可能会产生弱且受噪声主导的信号;而较长的光程长度虽然能增强信号强度,却有可能因饱和而丢失有用的光谱细节。

为构建机器学习模型,我们使用了一个在单一光程长度下测得的燃料及其纯组分混合物的吸收光谱数据库。为模拟不同光程长度下的光谱,我们对这些光谱进行了线性缩放。对于每个光程长度,我们根据样本在10%误差范围内的预测比例,以及均方误差、平均百分比误差、决定系数等标准回归指标,来评估其预测性能。本研究的结果强调了探索多种候选光程长度并允许一定程度的吸收饱和对于提升预测精度的重要性。总体而言,该方法提供了一种基于机器学习的模拟与敏感性分析框架,用于选择光程长度,从而超越了那些仅侧重于优化信噪比、避免饱和或满足实际约束的传统方法。

问题陈述
本文提出的方法是一种基于机器学习的模拟框架,可用于选择最优的光程长度,适用于多种光谱分析应用。为展示该方法的运作原理,并阐明光程长度如何影响目标性质的预测精度,我们将该方法应用到了我们之前研究中所描述的燃料传感应用中[18][19]。在该应用中,我们的目标是基于中红外吸收光谱开发一种机载燃料传感器。

结果
为研究光程长度如何影响衍生十六烷值的预测精度,我们针对一系列模拟光程长度建立了机器学习模型。首先,对这些吸收光谱进行缩放,以模拟所需的光程长度,随后将其转换为透射光谱,最后加入代表仪器噪声的高斯噪声。如图1所示,该图展示了ARL-CN30燃料在几种模拟光程长度下的加噪声透射光谱,从中可以看出光程长度对光谱的影响。

结论
我们通过基于机器学习的模拟与敏感性分析框架,展示了光程长度对红外光谱定量精度的影响。以机载燃料传感作为案例研究,通过模拟不同光程长度下的光谱并加入代表性的仪器噪声,我们评估了机器学习模型在预测喷气燃料及燃料混合物的衍生十六烷值方面的性能。研究结果表明,过短的光程长度……

作者贡献说明
冈田春奈:写作——审稿与编辑,写作——初稿撰写,验证,方法学,数据整理,概念构思。斯科特·桑德斯:写作——审稿与编辑,指导,方法学,研究实施,概念构思。

利益冲突声明
作者声明不存在任何可能影响本文研究结果的已知财务利益或个人关系。

致谢
本研究由陆军研究实验室资助,项目编号为W911NF?20–2–0181。本文档中所表达的观点和结论仅为作者个人观点,不应被视为陆军研究实验室或美国政府的官方立场。政府有权为自身用途复制和分发重印本,无需考虑任何版权声明。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号