《Geoderma》:Zero-shot inference with Tabular Prior-data Fitted Network (TabPFN) for soil MIR spectral analysis
编辑推荐:
Tabular Prior-data Fitted Network(TabPFN)是一种为表格数据预测任务设计的预训练基于Transformer的神经网络基础模型(Foundation Model)。尽管TabPFN相对于现有先进基线模型已展现出较强性能,但其
Tabular Prior-data Fitted Network(TabPFN)是一种为表格数据预测任务设计的预训练基于Transformer的神经网络基础模型(Foundation Model)。尽管TabPFN相对于现有先进基线模型已展现出较强性能,但其对不同规模土壤光谱数据集的泛化能力尚不清楚。本研究评估TabPFN的性能,并将其与偏最小二乘回归(Partial Least Squares Regression,PLSR)、Cubist回归树及卷积神经网络(Convolutional Neural Network,CNN)进行比较,用于基于中红外(mid-infrared,MIR)光谱的土壤分析。研究人员使用美国Kellogg土壤调查实验室(Kellogg Soil Survey Laboratory,KSSL)土壤样品预测三种土壤属性:代表高可预测性的总碳(Total Carbon,TC)、代表中等可预测性的pH(1:1土水悬液)及代表低可预测性的Olsen法提取磷(Olsen method extractable Phosphorus,Olsen-P)。内部测试集来自美国德克萨斯州(N = 620),外部测试集来自澳大利亚东部(N = 387)。模型使用不同规模及与测试集具不同光谱相似度的数据集进行训练。TabPFN在大多数结果中精度高于所有基线模型,预测TC时相比PLSR平均RMSE(Root Mean Square Error,均方根误差)降低74%,相比Cubist降低39%。在中规模数据集上性能提升尤为显著,且TabPFN在光谱差异较大的训练集与测试集间表现出更优的泛化能力。土壤属性的可预测性影响所有模型表现,TC精度高于pH和Olsen-P。不确定性量化方面,TabPFN在外部测试集产生的预测区间(Prediction Interval)覆盖率接近期望水平,表明不确定性泛化较合理,但分位数校准(Quantile Calibration)可靠性较低。Shapley加性解释(Shapley Additive exPlanations,SHAP)显示对预测贡献显著的波数与已知土壤有机碳和无机碳MIR光谱特征吻合,支持TabPFN的可解释性。综上,TabPFN具有高预测精度、优于传统方法的泛化能力及有用的不确定性估计,表明其适用于大、小规模土壤光谱库分析。
论文解读:《Zero-shot inference with Tabular Prior-data Fitted Network (TabPFN) for soil MIR spectral analysis》发表于《Geoderma》
研究背景与意义
土壤光谱学常采用偏最小二乘回归(Partial Least Squares Regression,PLSR)、Cubist回归树及卷积神经网络(Convolutional Neural Network,CNN)等算法建立土壤属性与中红外(mid-infrared,MIR)光谱间的预测关系。传统深度学习模型数据饥渴、计算量大且小样本易过拟合;树模型虽在小样本表现较好但对光谱差异大的域外数据泛化有限。Tabular Prior-data Fitted Network(TabPFN)是基于上下文学习(In-Context Learning,ICL)的表格数据基础模型(Foundation Model),预训练于大量合成表格数据集,推理时通过给定输入—输出示例做单次前向传播预测而无需更新权重,理论上适合小—中等规模表格光谱数据,但其在土壤MIR光谱上的适用性尚未系统评估。为此,研究人员以美国Kellogg土壤调查实验室(Kellogg Soil Survey Laboratory,KSSL)MIR光谱库及澳大利亚外部验证集为材料,系统比较TabPFN与PLSR、Cubist及CNN在预测总碳(Total Carbon,TC)、pH和Olsen法提取磷(Olsen-P)上的精度、泛化性、不确定性量化及可解释性,以明确TabPFN在土壤光谱分析中的潜力。
主要技术方法
研究人员选取KSSL数据库中含TC、pH、Olsen-P测定值的11,564份美国土壤样品,MIR光谱截取3900–700 cm?1(分辨率2 cm?1)不做预处理;内部测试集取德克萨斯州N=620,外部测试集取澳大利亚新南威尔士州及维多利亚州N=387(光谱重采样至相同范围)。按样本量与光谱相似度设7个训练子集:小且相似(Iowa N=46)、小且不同(Vermont N=50)、中且相似(Montana N=337)、中且不同(Florida N=275)、大1(CA+NV N=1119)、大2(NE+KS N=1253)、超大(除TX外全美N=10,944)。TabPFN采用v6.0.6本地部署TabPFNRegressor默认超参数,通过ICL将训练集作上下文进行推理并输出预测分布以获取点预测与分位数;基线中PLSR经网格搜索最佳潜变量数,Cubist调参优化,CNN建6层1D-CNN用Monte Carlo Dropout与早停(仅用于超大集)。评价指标为决定系数(R2)、均方根误差(Root Mean Square Error,RMSE)、性能与四分位距比(Ratio of Performance to InterQuartile range,RPIQ)及标准化偏差(Standardised bias,Stb);不确定性用平均预测区间宽度(Mean Prediction Interval Width,MPIW)、区间覆盖概率(Prediction Interval Coverage Probability,PICP)及分位数覆盖概率(Quantile Coverage Probability,QCP)评价;可解释性用TabPFN自带置换近似计算Shapley加性解释(Shapley Additive exPlanations,SHAP)值。
研究结果
3.1. Model performance(模型性能)
TC预测中TabPFN于中、大及超大训练集均获高R2(>0.9),超大集R2=0.99、RPIQ=10.54、RMSE=0.19%优于Cubist(R2=0.95,RPIQ=4.41)与CNN(R2=0.96,RPIQ=4.68)。即便光谱差异较大的中规模Florida集(N=275),TabPFN仍达R2=0.92(Cubist R2=0.35,PLSR负R2),表明其对光谱异源训练数据具更强泛化力。小相似集(Iowa)TabPFN与Cubist相当(R2≈0.5–0.57),小异源集(Vermont)各模型均失效。pH预测TabPFN于中大规模集优于基线(Montana集R2=0.63 vs Cubist 0.41),超大集与Cubist持平(R2=0.82)。Olsen-P各模型RPIQ<1无实用预测能力。结论:TabPFN在中—大规模集全面优于或匹敌基线,尤其光谱异源时优势明显;低光谱相关性属性(Olsen-P)仍难预测。
3.2. External validation(外部验证)
以澳大利亚集为外部测试,PLSR全面失效(负R2);小集TabPFN略逊于Cubist,中大规模TabPFN超越Cubist与CNN,Montana训练R2=0.89、RPIQ=2.58,Florida训练R2=0.72、RPIQ=1.64(Cubist R2=-0.25),超大训练R2=0.97、RMSE=0.25%、RPIQ=4.71。表明TabPFN对跨大陆、跨实验室MIR数据具良好泛化力,光谱相似的中规模训练即能获较准外部预测。
3.3. Uncertainty quantification(不确定性量化)
基于超大集训练预测TC,90%预测区间平均宽度内部测试0.55%、外部0.57%;内部测试区间偏保守(PICP高于名义水平),外部测试PICP贴近期望值表明区间校准合理。但分位数覆盖概率(QCP)在外部测试显示系统轻微欠覆盖,提示分布偏移下次分位数级校准待改进。总体而言TabPFN的不确定性估计可合理迁移至外部样本。
3.4. SHAP values(SHAP值)
对澳洲测试集计算TabPFN的SHAP值,平均绝对SHAP高值区位于3000–2500 cm?1及2000–1500 cm?1,对应土壤有机碳C–H伸缩振动(~2930 cm?1)与无机碳酸盐(方解石~1800 cm?1)及有机碳官能团吸收区,与文献已知MIR光谱特征一致,证实TabPFN决策依赖合理光谱特征,具物理解释性。
3.5. Assumptions, limitations and future applications(假设、局限与未来应用)
TabPFN精度受属性本身可预测性及训练集规模与光谱代表性影响,极低可预测属性(Olsen-P)仍无法可靠预测;极小样本(N<50)常规树模型暂具微弱优势;原生支持≤约10,000样本与≤500特征(超限做随机子特征集成)。未来可探索微调(fine-tuning)、超参(如n_estimators)优化及降维预处理影响,建议在更广土壤光谱场景验证。
讨论与结论总结
研究人员得出结论:TabPFN用于MIR土壤光谱预测TC、pH和Olsen-P时,整体精度等于或优于PLSR、Cubist和CNN,尤其中规模数据集优势显著——TC预测相对PLSR平均RMSE降低74%、相对Cubist降低39%,且超越超大集训练的CNN。TabPFN在光谱异源训练—测试对间具强泛化力,R2与RPIQ可达PLSR与Cubist两倍。与基线相同,低可预测属性(Olsen-P)预测仍差。外部验证证实其中大规模训练下跨域预测精度高于基线。不确定性量化产生接近期望覆盖率的预测区间(分位数校准偏弱)。SHAP分析表明重要波数与土壤有机/无机碳MIR特征吻合,模型具可解释性。本研究证明TabPFN可高精度预测土壤属性并提供不确定性估计,是土壤光谱分析中具前景的方法,适用于大、较小规模土壤光谱库,未来应纳入国家或区域光谱库并评估资源受限环境表现。