利用多重二阶导数实现液相色谱-高分辨质谱(LC-HRMS1)中伪增强峰效率的方法

《Journal of the American Society for Mass Spectrometry》:Pseudoenhanced Peak Efficiency in Liquid Chromatography–High Resolution Mass Spectrometry Using Multiple Second Derivatives

【字体: 时间:2026年06月06日 来源:Journal of the American Society for Mass Spectrometry 2.7

编辑推荐:

  研究人员介绍了一种利用随时间轴的二阶导数变换及高斯平滑循环,在液相色谱-高分辨质谱(Liquid Chromatography–High Resolution Mass Spectrometry, LC-HRMS1)中实现伪增强峰效率(pseudoenhanc

  
研究人员介绍了一种利用随时间轴的二阶导数变换及高斯平滑循环,在液相色谱-高分辨质谱(Liquid Chromatography–High Resolution Mass Spectrometry, LC-HRMS1)中实现伪增强峰效率(pseudoenhanced peak efficiency)的数学处理方法。该流程将所有以轮廓扫描(profile scans)记录的质谱扫描插值至统一的质荷比(m/z)轴,使数据集中每个m/z增量均可沿洗脱时间进行二阶导数变换。利用公开数据集(含1100种化合物,于Thermo Q Exactive上分析)进行验证,表明该方法可显著改善特征检测和分辨率,兼具定性与定量优势。该变换可使多循环实施时间峰效率提升最高达两个数量级,且无需改动仪器硬件。该方法可增强复杂混合物分离能力、降低本底贡献,并提高非靶向代谢组学及相关分析中结果的可靠性。
论文解读:《利用多重二阶导数实现液相色谱-高分辨质谱中伪增强峰效率的方法》
该研究发表于《Journal of the American Society for Mass Spectrometry》。液相色谱-高分辨质谱(LC-HRMS1)已成为代谢组学、环境科学及药物研发中分析复杂混合物的核心技术,其分析质量高度依赖于色谱与质谱的峰效率(peak efficiency)。尽管硬件方面通过减小填料粒径、优化色谱条件及提升轨道阱(Orbitrap)、傅里叶变换离子回旋共振(FT-ICR)等质量分析器分辨率取得了长足进展,但在数据处理层面仍面临挑战:传统的基于总离子流色谱图(TIP)或总吸收谱的峰拾取(peak picking)易遗漏被主成分掩盖、被本底噪声隐藏或受基线漂移干扰的特征,尤其在非靶向分析(untargeted analysis)中不同软件鉴定重叠率常低于50%。多数商业软件为减小数据量将轮廓扫描(profile scans)转换为 centroid 扫描,造成潜在信息损失。针对此,研究人员基于Finnee MATLAB工具箱,提出一种对原始profile模式LC-HRMS1数据直接进行多重二阶导数与时间域高斯平滑循环的算法变换,在不改变仪器硬件前提下获得"伪增强峰效率(pseudoenhanced peak efficiency)",即算法意义上的有效峰变窄、本底压制与分辨率提升。该方法旨在改善非靶向特征检测、同量异位素/加合离子模式识别及复杂基质中痕量化合物的可视化。
为开展研究,研究人员采用以下关键技术方法:使用公开基准数据集Benchmark Data Set 1(Bd1)——Li等人发表的Thermo Q Exactive HF采集含1100化合物(SA/SB混合标准品)的.raw文件,及真实生物样本呼气冷凝物(Exhaled Breath Condensate, EBC)的Orbitrap Q Exactive Focus采集文件;原始文件经ProteoWizard中msConvert转为mzML并确保保留profile scans而不做centroiding;在MATLAB中调用Finnee工具箱读取mzML,对所有扫描沿m/z轴做二维线性样条插值(linear spline interpolation)至共同m/z轴与恒定扫描时间间隔,构建以扫描号为x轴、m/z为y轴的矩阵;对矩阵逐行(时间方向)施加迭代循环处理——先高斯平滑(Gaussian smoothing filter, 核宽初始约等于平均峰扫描点数,逐循环递减约20%~30%取奇整数),再做时间二阶导数(second derivative with respect to elution time),随后强度取负并截断去除负值(remove negative values),允许重复多至10个循环生成导数数据集记为d??(LC-HRMS1)(n为循环数);最终进行提取离子流色谱图(Extracted Ion Profile, XIP / Extracted Ion Chromatogram, XIC)、基峰剖面(Base Peak Profile, BPP)分析及自动背景离子剔除与峰匹配比对XCMS结果。
Targeted Analysis with a Single File from the Bd1 Data Sets
研究人员对Bd1中SA1.raw文件分别构建d?1、d??、d?1?(LC-HRMS1)数据集,并以其中836个已知化合物做靶向提取离子流色谱图(XIP)分析。结果显示:相比原始数据,1次循环平均峰效率提升约2倍,5次循环约11倍,10次循环约256倍;峰效率提升幅度取决于原始每峰扫描点数,极窄高效峰初次循环可能略降但多循环后仍能显著提升。代表性化合物XIP显示低信噪比下仍可获明显变窄峰形,证明多重二阶导数变换能实质性提高表观色谱峰效率。
Untargeted Analysis with a Single File from the Bd1 Data Set
研究人员对同一样本原始与d?1?(LC-HRMS1)数据集做非靶向基峰剖面(BPP)可视化及自动峰拾取。原始BPP在8–10 min区间仅见约5个峰,而d?1?数据集同一窗口可见30余个峰;自动峰拾取在d?1?中共检出1039个峰(650个高于检测限LOD,553个高于定量限LOQ),远多于原始数据检出的169个峰(36个高于LOQ)。经背景离子剔除流程移除产生假峰(ghost peaks)的本底离子后,保留峰数与信噪比进一步提升。将检出峰平均质谱与ChemCalc理论同位素模式匹配,Level 1鉴定790个化合物,Level 2鉴定748个化合物,与XCMS特征匹配率达92.6%,保留时间偏差均值0.00±0.05 min,质量偏差均值0.0±0.7 ppm,表明变换未引起峰顶位移及m/z失真,同位素、加合与碎片离子关系得以保留。
Analysis with All Files from the Bd1 Data Set
研究人员将伪增强方法应用于Bd1全部10个重复文件(SA???与SB???),评估峰面积重现性与浓度比相对标准误差(RSE)。结果表明:导数数据集峰面积RSD由原始SA的5.7%微升至d?1?的6.6%,SB由5.1%微升至6.0%;但浓度比SB/SA的RSE由原始3.5%降至d?1?的2.4%,说明虽因每峰数据点减少致轻微重现性下降,但峰边界判定一致性改善使比值精度提升。各重复d?1?的TIP叠加显示良好重现性,证实方法稳定可靠。
Untargeted Analysis with the EBC File
研究人员将流程应用于真实生物样本EBC文件(平均约50 scans/peak),经8次循环(高斯核宽61→5)处理,d??(LC-HRMS1)的BPP自动检出633个峰(555个S/N>3)。剔除本底假峰离子后,部分峰可见同一离子[M]+H?与[M+1]+H?同位素对甚至多种加合离子及对应同位素,证明该法适用于真实复杂生物基质并能辅助注释。
Practical Limitation and Potential Artifacts
研究人员指出:反复平滑与二阶导数属非线性操作,若参数未优化可使本底波动锐化为假峰(ghost peaks),须结合原始数据核查或启用背景离子剔除;变换破坏绝对峰面积守恒,不宜直接用于定量,建议作为原始数据互补工具辅助特征检测与分组;对原始未基线分离(isobaric且R≤0.5)共流出峰无法拆分,个别非基线分离双峰依高斯核宽可能合并为单峰;要求profile模式采集且每色谱峰具较高扫描点数(高采样率),低采样数据不适合多循环;大数据矩阵循环运算计算量大,需权衡增强程度与算力。
Conclusions(研究结论部分翻译)
本研究提出了一种稳健的算法流程,通过对LC-HRMS1数据集施加重叠的多重二阶导数变换与高斯平滑,实现峰效率的伪增强(pseudoenhanced peak efficiency)。这种不依赖硬件改动的途径显著改善了峰分辨率、可视化效果及特征检测能力,同时保留了化合物注释所需的关键同位素与加合离子模式。虽然存在细微折衷( notably因数据点减少致重现性轻微下降),但整体影响积极。所提方法可整合入未来分析流程,以解决非靶向高分辨质谱中持续存在的数据处理难题。需注意本方法仅适用于含大数据的profile扫描且循环高斯平滑与二阶导数计算密集;最佳效果需高时间采样率。该方法本质上是伪增强而非真实物理增强——对严重重叠(R≤0.5)的同量异位共流出峰无改善,对非基线分离但可区分的双峰增益取决于分辨率及高斯平滑核宽。尽管主要定位为可视化与数学分离辅助手段以帮助获取干净同位素模式,其与现有HPLC-HRMS计算工具正交,联用有望降低假阳性检出率。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号