太赫兹时域高光谱成像融合无监督学习分析:土壤微塑料检测与空间分布图谱构建新策略

《Environmental Technology & Innovation》:Microplastic detection in soil by THz Time-Domain Hyperspectral Imaging combined with Unsupervised Learning Analysis

【字体: 时间:2026年03月21日 来源:Environmental Technology & Innovation 7.1

编辑推荐:

  为解决土壤微塑料检测方法耗时、依赖标样、空间分布信息缺失等问题,研究团队将太赫兹时域高光谱成像(THz-TDHI)技术与多种无监督学习算法(PCA、K-means、GMM等)结合,对聚乙烯(LDPE)污染土壤进行检测。结果表明,该方法无需纯物质参考光谱,即可在受控条件下稳定区分土壤与塑料相,并实现其空间图谱构建,为土壤微塑料的快速、无标记检测提供了新工具。

  
在我们的脚下,土壤不仅是万物的根基,也可能悄然成为人类活动副产品——塑料微粒的隐秘“垃圾场”。微塑料(尺寸小于5毫米的塑料碎片)污染已成为全球性环境难题。长久以来,研究焦点多集中于海洋,但越来越多的证据显示,农田、森林等陆地生态系统同样是微塑料的重要归宿。它们悄然改变土壤结构,影响碳储存,甚至干扰土壤生物的活动。然而,揪出这些混在复杂土壤基质中的“隐形”塑料微粒并非易事。传统检测方法,如显微镜观察结合显微傅里叶变换红外光谱(micro-FTIR)或显微拉曼光谱(micro-Raman),不仅步骤繁琐、耗时数天,而且难以捕捉污染物在土壤中的真实空间分布。此外,现有一些光谱技术,如可见光-近红外(VIS-NIR)光谱,虽然快速,但其探测深度有限,且难以区分不同聚合物类型。那么,是否存在一种技术,既能“看透”一定厚度的土壤样本,又能精准识别出微塑料的“指纹”,甚至绘制出它们的“藏身地图”呢?
一篇发表于《Environmental Technology》的研究给出了一个充满潜力的答案。一个由意大利研究人员组成的团队,将目光投向了被称为“电磁波最后处女地”的太赫兹波段。他们创造性地将太赫兹时域高光谱成像(Terahertz Time-Domain Hyperspectral Imaging, THz-TDHI)与多种无监督机器学习算法相结合,发展了一套无需预先知晓纯净参考光谱,即可检测并空间定位土壤中低密度聚乙烯(Low-Density Polyethylene, LDPE)微塑料的新方法。这项研究不仅证明了该技术路线的可行性,更重要的是,它展示了一种不依赖“标准答案”(即标记数据)的、从复杂数据中自主发现污染模式的“盲检测”策略,为未来应对成分未知的真实环境样本监测铺平了道路。
研究人员为开展此项研究,主要运用了以下几项关键技术方法:首先,制备了LDPE微塑料与农业壤土混合的压片样本(浓度1%, 5%, 10% wt%)。其次,使用基于异步光学采样技术的TeraASOPS太赫兹时域光谱系统进行透射式测量,该系统集成二维扫描台,可在0.3-1.2 THz频段内,以0.1 mm步进获取每个像素点的时域波形及其对应频谱,构建高光谱数据立方体。最后,运用了包括相似性图谱、主成分分析、K均值聚类、高斯混合模型、谱聚类和凝聚聚类在内的多种统计与无监督机器学习算法,对获取的海量高维光谱数据进行降维、聚类与空间分布分析。
3.1. 平均太赫兹波形和光谱
研究人员首先对所有像素点的信号进行平均分析,以观察塑料含量对整体THz信号的宏观影响。他们发现,随着聚乙烯浓度从1%增加到10%,平均时域电场波形的峰值幅度降低、信号时间展宽且发生延迟。对应的平均功率谱显示,在0.4 THz附近的特征峰受到抑制,整体频谱变窄。通过计算0.4-1 THz频段内的光谱积分并与纯土壤参考谱比较,发现积分差值与塑料浓度呈高度线性相关(R2=0.982)。据此计算的检出限(Limit of Detection, LoD)和定量限(Limit of Quantification, LoQ)分别低至0.32%和1.07%。这表明,即使在微塑料非均匀分布的情况下,THz-TDHI的整体平均响应已足够灵敏,能够定量反映土壤中的塑料含量。
3.2. 基于光谱相似性分析的塑料空间分布
为了“看见”微塑料在土壤中具体藏在何处,研究人员进行了像素级的光谱相似性分析。他们先计算了纯土壤和纯塑料的平均光谱作为参考,然后评估样本中每个像素点的光谱与这两个参考谱的相似度,并生成空间热图。结果显示,与土壤相似度高的区域(图中褐色),恰好是与塑料相似度低的区域(图中黑色),两者呈现清晰的互补关系。这种“你高我低”的模式有力地表明,样本中主要存在的就是土壤和塑料这两相,没有其他强干扰物质。随着塑料浓度增加,与塑料参考谱的相似度指数也显著升高。不过,这种基于参考谱的方法虽然能有效展示空间分布模式,但其量化精度受限于二维成像无法分辨塑料在光束传播方向上的位置,且无法应用于缺乏纯净参考样本的未知环境。
3.3. 基于PCA和无监督机器学习的塑料空间分布
为了突破对参考光谱的依赖,研究转向了无监督学习方法。主成分分析(Principal Component Analysis, PCA)仅依据数据内部的协方差结构,成功地将图像数据的主要方差方向提取出来,其生成的第一主成分(PCA 1)分布图与相似性热图展现出一致的相分离空间模式。更重要的是,无需任何先验标签,多种无监督聚类算法——K均值聚类、凝聚聚类、谱聚类和高斯混合模型——被独立应用于数据。除高斯混合模型在1%低浓度样本中因混合像素效应出现些许偏差外,所有方法均一致地将数据划分为两个明确的簇,其空间分布与PCA结果高度吻合。这种多种独立方法收敛于相同结论的现象,强有力地证明所观察到的区分并非算法人为产物,而是根植于土壤与塑料之间固有的物理(光谱)差异。
3.4. PCA和机器学习分析提供的光谱特征
无监督方法能区分出“两类东西”,但哪一类是塑料,哪一类是土壤呢?为了解决这个身份认定问题,研究人员计算了被各无监督方法(如凝聚聚类、PCA、K均值聚类)归为同一簇的所有像素点的平均光谱。以10%浓度样本为例,他们发现,无论使用哪种无监督方法,从其中一个簇中计算出的平均光谱,其形态(如频谱变窄、0.4 THz峰衰减)与纯塑料参考谱高度相似;而从另一个簇计算出的平均光谱则与纯土壤参考谱匹配。这意味着,无监督方法在完全“盲分析”的情况下,不仅成功分离了不同相,而且所分离出的相恰好对应着具有独特光谱特征的塑料和土壤。这为未来结合已知物质光谱数据库,实现对未知污染物的鉴别与制图奠定了基础。
结论与讨论
这项研究成功地构建并验证了一个将太赫兹时域高光谱成像与无监督机器学习相结合的新型分析框架,用于土壤中微塑料的检测与空间表征。其核心结论在于,在受控的实验条件下,土壤与塑料污染区域之间的区分能够通过多种概念独立的分析方法(平均谱分析、相似性图谱、PCA及多种聚类算法)一致且稳定地呈现出来。这证实了该鉴别能力源于材料间本质的物理对比(如吸收、散射特性差异),而非特定算法的人为效应。
本工作的主要创新与意义体现在:第一,方法学创新:系统集成了THz-TDHI与多元无监督学习,实现了无需纯物质参考光谱的“盲检测”,突破了传统方法在未知或复杂环境样本中的应用瓶颈。第二,物理特征发现:明确了LDPE污染在THz波段的关键指纹特征,包括0.4 THz附近的特征响应、随浓度增加而出现的有效频谱窄化以及时域波形参数(幅值、延时、脉宽)的系统性变化。第三,技术优势验证:证明了THz技术对相对厚样本(本研究为4mm)的体探测能力,相较于表面敏感的可见光-近红外光谱等技术更具优势,提高了探测低浓度污染物的概率。第四,提供了可扩展的框架:研究所采用的样品制备与分析协议,强调明确的光谱对比,为未来鉴定和表征其他类型塑料乃至复合系统的THz指纹提供了一个可扩展的通用框架。
当然,研究也存在局限性,主要是当前远场THz成像的空间分辨率(约0.5 mm)限制了塑料的精确空间定位和定量,易受混合像素和“阴影效应”影响。对此,作者指出,正在开发中的近场THz检测系统有望将分辨率提升至亚微米级,从而更好地应对未来更低环境浓度检测的挑战。
总而言之,由Anna Martinez、Valentina Di Sarno、Domenico Paparo等作者完成的这项研究,不仅为土壤微塑料检测提供了一种快速、无标记且能提供空间分布信息的新工具,更在方法论层面展示了一条从复杂环境数据中自主挖掘污染信息的可行路径。随着THz光源、探测器与数据分析技术的不断进步,这套实验室规模的筛选协议有望发展成为未来环境实地诊断中一项强有力的“透视眼”。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号