《Environmental Pollution》:Improving urban topsoil copper (Cu) inversion in highly industrialized areas using compositionally nearby samples
编辑推荐:
本研究探讨在重工业区利用可见近红外光谱(vis-NIR)反演土壤铜(Cu)含量时,成分相近样本的影响。通过部分最小二乘回归分析,发现加入适量成分相近样本可显著提升模型性能(R2=0.96,RMSEP=3.21 mg·kg?1),但样本数量超过阈值后性能下降,最佳样本数为125(占62.5%)。该研究为高效重金属监测提供了新方法。
刘毅|郭凯|史铁柱|陈一云|张文毅|崔文玲|陈诺
广东财经大学公共管理学院,广州,510320,中国
摘要
在高度工业化地区监测表土中的重金属需要快速、低成本且环保的方法,例如可见光和近红外(vis-NIR)光谱反演技术。然而,成分相近的样本对重金属反演的影响仍不明确。本研究探讨了成分相近的样本如何影响重金属(特别是铜)的反演,并分析了其背后的机制。我们通过选择成分相近的样本,利用偏最小二乘回归法建立了铜含量估算模型。为了全面评估这种影响,我们逐步增加了样本数量。结果表明,与传统方法相比(R2=0.75,RMSEP=8.56 mg·kg?1,RPD=1.83),增加样本数量显著提升了模型性能(R2=0.96,RMSEP=3.21 mg·kg?1,RPD=4.87)。样本数量的增加起初提高了模型性能,随后又导致了性能下降,呈现出倒U形趋势。最终确定最佳样本数量为125个(约占总样本的62.5%)。这些发现表明,纳入成分相近的样本可以显著提高铜含量的反演精度;但必须谨慎控制样本数量,以平衡样本数量和模型复杂性。本研究提出了一种新的方法来提高重金属反演效果,为高度工业化地区的有效土壤监测提供了有前景的途径。
引言
重金属污染严重阻碍了实现联合国2030年可持续发展目标(SDGs)的进程,包括可持续城市和社区、陆地生命以及清洁水和卫生设施(Hou等人,2020年)。这种威胁源于受污染的饮用水对人类和动物的毒性、在食物链中的积累以及与绿地土壤的直接接触(Hou等人,2025年;Liu等人,2023年)。它还可能通过破坏土壤微生物、增加碳释放和减少碳封存来影响与气候相关的过程(Xu等人,2021年)。重金属污染主要发生在城市和采矿区(Punia,2021年)。在城市中,污染由快速的城市化和工业化驱动,包括工厂排放、建筑活动和不当的废物处理(Khan等人,2021年;Zhang等人,2024年)。因此,监测重金属对于了解当前的污染水平以支持SDGs的实现至关重要。
传统的重金属监测方法通常依赖于化学分析。然而,这些技术成本高昂、耗时较长,且常常依赖有害环境物质,如酸性溶液(Ji等人,2016年;Li等人,2022年)。此外,高分辨率的空间评估需要大量样本(Munnaf和Mouazen,2023年)。为了处理如此庞大的数据集,需要新的方法。一种有前景的替代方法是可见光和近红外(vis-NIR)光谱技术(Hong等人,2025年;Peng等人,2025年),该方法快速、成本低且环境影响小(Viscarra Rossel等人,2024年)。它可以在地面和空中进行应用(Ben Dor等人,2024年;Ou等人,2021年)。这是因为重金属与其他物质(如有机物)相互作用,而纯重金属本身在可见光和近红外范围内不吸收光(Stenberg等人,2010年)。因此,在将重金属反演模型应用于不同数据集时需谨慎。研究人员利用vis-NIR光谱技术评估了重金属浓度。例如,Chen等人(2025年)预测了黑土中的锌、铜和镉含量;Nakhostin等人(2025年)估算了城市土壤中的砷、镉、钴、铬、铜、锰、镍、铅和锌含量;Qi等人(2025年)也分析了欧盟和美国的土壤中的这些元素。铜是城市土壤中最常见的重金属污染物之一,最近引起了公众关注(Hou等人,2025年)。da Silva Sangoi等人(2025年)使用R2=0.91的模型监测了巴西南部的土壤铜含量;Kusuma等人(2025年)使用R2=0.96的模型对印度土壤铜含量进行了分类。这些发现表明,vis-NIR光谱技术是一种可靠且高效的估算城市土壤中铜含量的方法,即使面对大量样本也是如此。
vis-NIR光谱模型的性能有时不佳,因此需要改进策略。提高模型性能的一个重要方法是增加样本之间的相似性,即使目标样本与训练样本更加相似(Ramirez-Lopez等人,2013年)。da Silva Sangoi等人(2025年)利用地理区域标准预测了土壤铜含量,并报告了性能的提升;Liu等人(2025年)考虑了光谱相似性来估算土壤铜含量;Song等人(2024年)在考虑地理分层的情况下估算了土壤性质;Liu等人(2024b;Wu等人,2022年)通过结合空间相似性来监测土壤铜含量。许多研究人员还研究了其他类型的相似性,包括土壤类型或类别(Meng等人,2022年)、土地利用(Hong等人,2023年;Moura-Bueno等人,2020年)、土壤质地(Moura-Bueno等人,2020年)以及母质和海拔(Moura-Bueno等人,2021年)。这是因为来源相似的样本通常具有共同特征——如母质和环境条件——从而导致相似的土壤成分。然而,关于成分相似性的研究仍然有限。
成分相似性有潜力提高重金属反演的准确性。它表示两个样本在含量水平上的相似程度——例如,10 mg·kg?1的铜浓度与11 mg·kg?1的铜浓度被认为是相似的。刘毅等人(2024年)将样本分为五组(<46, 46–55, 55–62, 62–71, 和 > 71 mg·kg?1),发现光谱相似性显著提高了模型性能。Hong等人(2022年)将样本分为三个pH组:pH < 5.5、5.5 ≤ pH ≤ 6.5 和 pH > 6.5;Zeng等人(2021年)分析了光谱相似性和成分相似性之间的关联。其他研究表明,不同的相似性水平对应不同的模型(McDowell等人,2012年;Vasques等人,2010年)。成分相似性比其他类型的相似性(如光谱或空间相似性)更为直接。模型中的成分变异性较低通常会导致预测结果的变异性较低。然而,很少有研究关注成分相近样本的影响。
成分相近样本的概念超出了普通成分相似性的范围。它们指的是成分水平最相似的样本。例如,如果目标样本含有10 mg·kg?1的铜,那么含有10.5、11、9.8、9.8 mg·kg?1铜浓度的样本就被认为是成分相近的。在这些样本中,含有9.8 mg·kg?1铜浓度的样本比其他三种浓度差异较大的样本更适合用于模型构建。如果成分相似性策略(如分层)有效(Dorantes等人,2022年),那么成分相近样本可能会带来益处。据我们所知,尚无研究测试或确认成分相近样本对重金属(铜)反演的影响。因此,应高度重视研究它们对铜含量建模的影响。
成分相近样本的另一个重要方面是样本数量。增加样本数量是否总是能提高铜含量估算模型的性能?是否存在一个临界点,超过这个点后性能不再提高甚至恶化?校准数据集的大小会显著影响重金属估算模型的准确性(Debaene等人,2014年;Ng等人,2020年)。深入研究不同数量的成分相近样本对模型性能的影响可以提供有关潜在机制的宝贵见解。然而,关于不同数量的成分相近样本对铜含量估算模型影响的研究很少。
为了解决对成分相近样本在重金属铜含量估算中作用的理解不足的问题,本研究利用vis-NIR光谱技术探讨了这些样本在高度工业化地区如何影响铜的反演。我们的目标如下:i) 评估纳入成分相近样本是否能够提高铜含量估算模型的准确性;ii) 研究模型性能随成分相近样本数量变化的情况。本研究加深了对成分相近样本在高度工业化地区重金属反演中作用的理解,并提出了一种提高反演性能的有效方法。
研究区域和土壤采样
在中国深圳选取了一个约1700平方公里的研究区域(图1)。该沿海地区(北纬22.5°)位于热带季风气候区,靠近北回归线。夏季炎热、潮湿且漫长(4月至11月),降雨量大;冬季短暂且干燥(1月至2月)。年平均气温在15.7°C至29°C之间,平均值为23.3°C。年平均降水量为1933毫米,其中约86%发生在夏季。
实验室测得的土壤铜浓度
铜的浓度范围为20.45–103.24 mg·kg?1(补充图S1),平均浓度为58.29 mg·kg?1。根据我们之前的研究,该地区的背景铜含量为17 mg·kg?1(Liu等人,2025年)。平均浓度远高于背景水平,表明有大量重金属进入土壤。尽管该地区不是铜矿区,但它经历了40多年的快速城市化和工业化过程。
利用vis-NIR光谱预测重金属铜含量
利用vis-NIR光谱成功估算了土壤中的铜含量。在我们的研究中,当使用69个成分相近样本时,获得了最佳的预测性能,R2=0.96,RMSEP=3.21 mg·kg?1,RPD=4.87(图4)。这些结果表明,vis-NIR光谱技术能够以可接受的准确度预测土壤中的重金属含量。一些关于土壤铜含量反演的最新研究总结在表1中。一些研究者报告的性能相对较低(例如,R2=0.36等)。
结论
我们的研究深入分析了成分相近样本如何影响利用vis-NIR光谱技术反演土壤中的铜含量。具体来说,我们研究了不同数量的成分相近样本,并探讨了影响铜含量估算的潜在机制。主要发现如下:
- 与传统方法相比,我们的方法显著提高了铜含量估算模型的准确性。
- 随着成分相近样本数量的增加...
CRediT作者贡献声明
陈诺:验证、软件、方法论。崔文玲:验证、调查、数据整理。刘毅:撰写——初稿、项目管理、资金获取、概念构思。张文毅:可视化、方法论、数据分析。陈一云:撰写——审稿与编辑、监督。史铁柱:撰写——审稿与编辑、可视化、监督、资源协调。郭凯:撰写——审稿与编辑、撰写——初稿、调查、数据分析、概念构思
伦理审批和参与同意
本研究未涉及任何动物实验。“不适用。”
出版同意
所有作者均同意发表本文。
数据可用性
本研究使用和分析的数据和材料可向相应作者提出合理请求后获取。
资助
本研究得到了
广东省基础与应用基础研究基金会(资助编号:2024A1515010110)的支持。
利益冲突声明
? 作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。