利用近红外高光谱成像(NIR-HSI)的形态学与化学特征进行稻米品种高级分类:一种化学计量学(Chemometrics)方法

《Food Control》:Use of Morphological and Chemical Features from Near Infrared-Hyperspectral imaging (NIR-HSI) for Advanced Classification of Rice Varieties: A Chemometric Approach

【字体: 时间:2026年06月13日 来源:Food Control 6.3

编辑推荐:

  摘要:稻米是世界上最重要的主粮作物之一,但其品种多样性极大导致真伪控制与掺假防范困难。本研究探讨近红外高光谱成像(Near Infrared-Hyperspectral imaging, NIR-HSI)结合化学计量学(Chemometrics)是否能通过形态

  
摘要:稻米是世界上最重要的主粮作物之一,但其品种多样性极大导致真伪控制与掺假防范困难。本研究探讨近红外高光谱成像(Near Infrared-Hyperspectral imaging, NIR-HSI)结合化学计量学(Chemometrics)是否能通过形态学信息与化学信息辅助稻米品种判别。共分析47个稻米品种(36个意大利品种及11个国外品种),每品种115粒谷粒,所得图像数据经主成分分析(Principal Component Analysis, PCA)探索,并采用偏最小二乘判别分析(Partial Least Squares-Discriminant Analysis, PLS-DA)及层次建模进行分类。形态学特征给出最佳性能:五类粒形经形态学参数分类获得94.1%非错误率(Non-Error Rate, NER)及最高达96.0%的类别准确率(Accuracy);基于形态的层次模型进一步提升判别力,可将11–12个组别分离且准确率超93%,最优情况达99.6%。NIR光谱对品种判别信息量较少:基于直链淀粉含量的PLS-DA达86.7% NER与91.0%准确率,而光谱层次模型对多数类别表现出高特异度(Specificity)但低灵敏度(Sensitivity)。形态学变量与光谱变量数据融合(Data Fusion)未能超越单一形态学模型性能,表明两信息源互补性有限。综上,结果表明NIR-HSI是一种快速、无损且有前景的稻米真伪鉴别方法,其中形态学描述子为分类提供最稳健依据。研究发现支持采用化学计量学成像策略强化质量控制、协助防范稻米供应链中食品欺诈行为。
论文解读:利用近红外高光谱成像(NIR-HSI)形态与化学特征进行稻米品种高级分类研究
一、研究背景与意义
稻米是全球消费最广的谷物之一,意大利是欧洲最主要产区。稻米品种遗传多样性极高,不同品种在风味、质地及商品价值上差异显著,导致以次充好、将低价品种冒充高端品种(如香米或意大利特定品种)的食品欺诈问题突出。传统稻米品质与品种鉴定依赖耗时、破坏性的化学分析,难以满足现场快速筛查需求。虽然高光谱成像(Hyperspectral Imaging, HSI)可在近红外(Near Infrared, NIR)区域同时获取样品空间(形态)与光谱(化学组成)信息,但已有文献多聚焦亚洲少数品种,且多用深度学习致模型缺乏化学解释性,针对大量意大利及国际品种的HSI结合层次化学计量学分类尚属少见。为此,Cazzaniga等人开展本研究,发表于《Food Control》,旨在评估NIR-HSI提取的形态学特征与NIR光谱特征及其融合数据在47个稻米品种判别中的效能,为稻米防伪与质量控制提供快速、无损的化学计量学解决方案。
二、主要关键技术方法简述
研究人员获取意大利国家稻米局(Ente Nazionale Risi)提供的47个稻米品种(36个意大利种+11个外国种,含Oryza sativa Japonica与Indica亚种),每品种取115粒去壳精米。使用Specim FX17线扫描NIR-HSI系统(光谱范围935–1720 nm)采集反射模式高光谱图像,以黑白参照校正。通过MATLAB自制程序去除背景、校正镜头空间畸变(三阶多项式重采样),从二值掩膜提取单粒稻米形态参数——面积(Area)、圆度(Circularity, 4π×Area/Perimeter2)、偏心率(Eccentricity)、长轴长(Major axis length)、短轴长(Minor axis length)、周长(Perimeter);各粒平均NIR光谱经Savitzky-Golay一阶导数(2阶多项式,11点窗口)及2-范数归一化,截取1100–1634 nm。数据按品种以Kennard-Stone算法分层划分校正集与测试集(测试集33%)。探索性分析采用主成分分析(PCA)及Ward法欧氏距离凝聚聚类;分类采用偏最小二乘判别分析(PLS-DA)对宏观类别(五类粒形、三类直链淀粉含量)建模,对47品种采用自动层次模型构建器(Automatic Hierarchical Model Builder, AHIMBU)与基于聚类树的人工手动层次PLS-DA模型(节点校准集Specificity(cal)≥80%停止),并以灵敏度(Sensitivity)、特异度(Specificity)、非错误率(Non-Error Rate, NER = 各类Sensitivity均值)、准确率(Accuracy)评价。形态与光谱矩阵分别预处理后按低层数据融合(Low-level data fusion)拼接分析。
三、研究结果
3.1. Analysis of morphological data(形态学数据分析)
经PCA对品种平均形态参数分析,PC1解释粒形由"长粒(Long B)"至"圆粒(Round)"渐变,载荷显示圆度负向、长轴与偏心率正向与长粒关联。除Italmochi(圆类但落于中粒群)外五类粒形明显分区。研究人员提出"形态图(Morphogram)"——将单品种115粒各形态参数分布直方图拼接可视化,可直观展现长粒(Dedalo)与圆粒(Elio)在圆度、偏心率及轴长分布的显著差异。以形态参数聚类得到树状图,印证先分长粒与非长粒,再分中粒与圆粒等子类。
基于形态参数的单PLS-DA对五粒形类分类整体NER 94.1%,准确率最高96.0%(Long A内销类),Long B灵敏度97.1%、特异度96.3%表现最优,Medium与Long A蒸谷灵敏度略低。AHIMBU层次形态模型将47品种分为11组(校准Spec≥80%阈值),各组均属同一基础粒形大类,组间准确率93%–99.6%,最优组达99.6%。手动层次模型分出12组,组准确率均>93%,但Medium相关组灵敏度偏低(如Group 1 Sens 34.6%、Group 11 Sens 7.7%),反映中粒形态界限模糊。两层次法结果相近,表明形态信息稳健,AHIMBU因自动化推荐优先使用。
3.2. Analysis of NIR data(NIR数据分析)
品种平均NIR光谱PCA显示蜡质(Waxy, 直链淀粉<5%)稻米明显分离,高(>20%)与低(5–20%)直链淀粉类部分重叠但沿PC1有趋势。载荷中~1450 nm负峰归属直链淀粉O–H倍频,~1400 nm归属水分O–H倍频,暗示蜡质稻米水分略低。基于直链淀粉三类的PLS-DA模型整体NER 86.7%、准确率91.0%,Waxy类灵敏度98.3%、特异度97.6%优,高/低类区分尚可。以NIR特征的AHIMBU层次模型在同样Spec(cal)≥80%下分出16个单品种或小组,但多数类灵敏度<70%(部分接近0),NER偏低,特异度均>90%。表明NIR光谱对品种细分区分力弱(稻米主体成分为淀粉致化学高度相似),虽高特异度可用于排除非目标品种做初筛,但不足以可靠正判品种归属。手动层次模型表现近似。模型最先单独分出Italmochi及三个Waxy品种,再次验证蜡质稻米化学指纹独特。
3.3. Analysis of the fused dataset(融合数据集分析)
低层融合形态+NIR矩阵后经PCA,载荷显示形态参数(特别是圆度、长轴、偏心率)主导PC1/PC2,NIR载荷幅值小。PC1正向长粒(Long B)伴~1426 nm(直链淀粉O–H二倍频)及~1225 nm(CH3倍频),反向圆粒伴水分吸收(~1345 nm、~1150 nm),提示长粒可能直链淀粉偏高、圆粒(尤其蜡质)水分略高,但整体形态与化学无强普适关联。融合数据分类模型未优于单纯形态模型,证实两源互补性有限,融合仅助益探索性理解。
3.4. Overall results discussion and contextualization(整体结果与文献对比讨论)
结果与既有亚洲品种HSI研究趋势一致:形态特征判别力强于光谱。本研究首次在欧洲大量意大利益种结合层次PLS-DA与AHIMBU,比神经网络法更具化学/光谱可解释性。由于未做光谱变量选择且品种数多,NIR区分力受限。未来可探索单类分类(One-class classification)评估品种间混淆关系。
四、结论(Conclusions)总结翻译
食品欺诈具全球性危害,需快速精准检测手段。本研究证明NIR-HSI可同步获取稻米空间与化学信息,结合化学计量学建立分类模型。PLS-DA能有效区分宏观粒形类别与直链淀粉含量等级;形态学特征分类效果最优,NIR光谱单独对品种细分力较弱但仍可区分直链淀粉三大类及蜡质品种。层次模型(手动与AHIMBU)可有效处理多类别(47品种)问题,基于形态学特征可将品种区分为11–12组且保持高灵敏度与特异度。形态与NIR数据融合未显著提升分类性能,因二者互补性有限且仅Long B类呈轻微直链淀粉—形态关联。研究确认NIR-HSI为快速、无损稻米真伪鉴别有力工具,形态学描述子是稻米品种分类最稳健依据,支持在供应链质控与防欺诈中应用化学计量学成像策略。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号