《Chemometrics and Intelligent Laboratory Systems》:Validation in principal component regression: A case study of ash determination in wheat flour based on the CIELAB color space
编辑推荐:
非破坏性检测小麦粉灰分的方法研究,基于CIELAB颜色空间结合主成分回归模型(PCR),验证了该方法在准确度(RMSEP=0.0586)、快速性(5小时缩短至秒级)和成本效益(无需昂贵设备)上的优势,为工业质量控制提供新方案
Thainá Harris Vieira | Francieli C.G.B.S. Alves | Keila C. da Silva | Patricia Valderrama
巴拉那联邦技术大学,坎波莫朗校区(UTFPR-CM),巴拉那州坎波莫朗,巴西
摘要
灰分含量是小麦面粉提取率的关键指标,在评估面粉质量和分类中起着至关重要的作用。传统的测定面粉灰分的方法具有破坏性、耗时且需要熟练的操作人员。在本研究中,使用CIELAB颜色空间(L*a*b*)和多元主成分回归(PCR)作为非破坏性方法来估算小麦面粉的灰分含量。样品来自一家磨粉厂,所有分析均在工厂现场进行。通过评估相关参数来评价模型的性能,包括准确度(RMSEP = 0.0586,RMSEC = 0.0623,调整后的椭圆联合置信区间)、校准期间的残差预测偏差(RPDcal = 4.5094)和外部验证期间的残差预测偏差(RPDval = 5.2113)、分析灵敏度的倒数(0.0131%)、检测限(0.0431%)和定量限(0.1306%)。研究结果表明,结合CIELAB颜色空间和PCR模型可以准确、快速、经济且非破坏性地估算小麦面粉的灰分含量,使其成为传统质量控制方法的一种有前景的替代方案。
引言
多元主成分回归(PCR)是一种多变量校准工具,当预测变量不共线时,它可以表征分析物的化学和物理性质。PCR在回归前应用主成分分析(PCA),使用正交的主成分得分。这种策略能够提高数值稳定性,减少相关性,并增强回归模型的稳健性和可解释性[1][2],因此在这里用于对CIELAB颜色空间中的预测变量进行建模,以确定小麦面粉的灰分含量。
CIELAB颜色坐标本质上是描述单一物理现象(即光与物质的相互作用)的相关指标,所有这些坐标都源自单一的反射光谱。具体来说,L*反映了整体反射强度,而a*和b*则是从同一光谱反射信息通过非线性变换得到的[3]。因此,这些变量往往不会独立变化,在这种情况下,多元线性回归(MLR)的系数估计可能会变得数值不稳定,对噪声非常敏感,并且从物理化学角度来看难以解释[4][5]。
现有文献提出了一些基于中红外(MIR)光谱学和衰减全反射技术结合偏最小二乘(PLS)[6]、近红外(NIR)光谱学结合区间偏最小二乘(iPLS)[7]、NIR光谱学与PLS[8]、手持式NIR光谱仪结合PLS[9]、拉曼光谱学与PLS[10]、可见光-近红外高光谱成像结合PLS和人工神经网络[11]、基于近红外高光谱成像和太赫兹技术的数据融合结合连续投影算法(SPA)和特征加权算法(Relieff)以及分层极值学习机(H-ELM)模型[12]来测定小麦面粉灰分的方法。
大多数上述方法需要使用复杂或昂贵的设备,并结合复杂的数学建模,而这些方法在某些情况下并未经过充分验证。此外,PLS是最常用的多元回归工具。尽管PCR早于PLS出现,但自其引入以来,PLS已成为化学家的首选方法,文献中也报道了其一些优势。其中,PLS所需的潜变量数量少于PCR中的主成分数量,因此应该更为简洁[1]。然而,在CIELAB颜色空间中,只有三个预测变量(L*a*b*),因此PLS相对于PCR的优势并不显著。
在工业环境中,利用现有设备并开发更简单、更易于解释的模型是一种实用且经济有效的替代方案,更符合企业的实际运营情况。在这方面,颜色分析是一种质量控制措施,也是工业小麦面粉厂日常分析 routine 中的一部分。该分析使用色度计进行,根据AACC(美国谷物化学家协会)14-22.01标准[14]提供亮度(L*)作为结果。此外,构成CIELAB颜色空间的a*(红/绿轴)和b*(黄/蓝轴)参数也可以通过同一设备获得。此外,这种分析方法具有较高的分析通量,能够快速获得结果。
另一方面,灰分的测定也是质量控制的一部分,遵循AACC 08-02.01方法[14],最低分析时间为5小时。测定灰分含量非常重要,因为它可以将小麦面粉分为1型(灰分最大0.80%)和2型(灰分最大1.40%)[15]。根据这种分类,小麦面粉可用于不同的产品配方。因此,本研究的目的是提出并验证一种基于CIELAB颜色空间的PCR模型来预测小麦面粉的灰分含量。
样本
样本
本研究收集了336份面粉样本,分为1型(230份)和2型(106份),来自巴拉那州中西部地区的一家磨粉厂。分析在整个2024年期间在工厂现场进行。这些样本直接来自生产过程,未添加铁和叶酸。由于样本直接来自生产过程,因此没有进行重复实验。
样本根据巴西标准被分为1型和2型。
结果与讨论
首先,通过方差膨胀因子(VIF)验证了预测变量(X列)之间的定量相关性。VIF通过以下公式计算:
其中R_i^2表示当预测变量i基于其他所有预测变量进行回归时得到的R^2值。
L*、a*和b*的VIF估计值分别为11.7399、11.7106和1.2446。如果一个变量与其他变量不相关,则R_i^2 ≈ 0且VIF ≈ 1;如果相关性很高,则R_i^2会增加。
结论
开发了基于CIELAB颜色空间的多元主成分回归模型来估算小麦面粉的灰分含量。验证结果表明,所提出的方法是一种高度准确且可靠的非破坏性方法,适用于工业小麦面粉生产过程中的灰分含量测定。
由于灰分含量是面粉提取率的关键指标,较高的灰分值意味着更多的麸皮成分,因此在定义面粉质量方面起着至关重要的作用。
CRediT作者贡献声明
Patricia Valderrama: 撰写——审稿与编辑、可视化、验证、监督、软件开发、资源管理、项目规划、方法论设计、研究实施、资金筹集、数据分析、概念构建。
Francieli C.G.B.S. Alves: 撰写——初稿撰写、可视化、验证、监督、资源管理、项目规划、方法论设计、研究实施、数据分析、概念构建。
Keila C. da Silva: 撰写——初稿撰写、可视化。
利益冲突声明
? 作者声明他们没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
致谢
本工作部分得到了高级人员培训协调委员会(CAPES)的支持。Patrícia Valderrama还感谢巴西国家科学技术发展委员会(CNPq - 项目编号303055/2025-1)的资助。