基于深度学习方法的蚕豆营养品质特性预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

基于深度学习方法的蚕豆营养品质特性预测

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》：Prediction of nutritional quality characteristics of faba bean based on deep learning method

【字体：大中小】 时间：2026年06月01日 来源：Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐：

　　本研究建立了一种基于近红外光谱（Near-Infrared Spectroscopy, NIRS）的集成分析方法，用于对蚕豆（Vicia faba L.）中的四种主要营养成分——淀粉、蛋白质、水分和膳食纤维进行快速、无损、定量的检测。通过系统地比较单一与组合光

本研究建立了一种基于近红外光谱（Near-Infrared Spectroscopy, NIRS）的集成分析方法，用于对蚕豆（Vicia faba L.）中的四种主要营养成分——淀粉、蛋白质、水分和膳食纤维进行快速、无损、定量的检测。通过系统地比较单一与组合光谱预处理策略，研究人员确定了每种成分的最佳预处理组合。采用包括竞争性自适应重加权采样（Competitive Adaptive Reweighted Sampling, CARS）在内的七种特征波长选择算法，以提取关键的光谱变量。随后，研究人员采用四种建模方法——偏最小二乘（Partial Least Squares, PLS）、随机森林（Random Forest, RF）、支持向量机（Support Vector Machine, SVM）和多层感知机（Multilayer Perceptron, MLP）——构建了预测模型。结果表明，组合预处理方法显著优于单一技术。CARS算法在特征提取方面表现出最稳健的性能，而MLP模型在预测所有成分方面均持续优于传统机器学习方法。最终确定的每种成分的最优建模流程如下：淀粉（MLP + CARS + MSC + SG + MSS，R² = 0.92），蛋白质（MLP + CARS + SD + SNV + MSC + MSS，R² = 0.94），水分（MLP + SPA + SG + SNV，R² = 0.9973），膳食纤维（MLP + PCA + FD + SNV，R² = 0.9999）。本研究验证了将NIRS与深度学习相结合用于蚕豆多成分同步检测的有效性，并为农产品无损质量评估提供了可靠的方法学框架。

基于深度学习方法的蚕豆营养品质特性预测

蚕豆（Vicia faba L.）是继大豆（Glycine max）和豌豆（Pisum sativum）之后的第三大重要豆类植物。它具有出色的营养价值，含有蛋白质、碳水化合物、B族维生素和矿物质，传统上被用作人类和动物营养的主要蛋白质来源。蚕豆中的蛋白质含量在36%至39%之间，其蛋白质含有人体所需的8种必需氨基酸，尤其富含赖氨酸，可与谷物同食以弥补谷物蛋白中赖氨酸的不足。与其他豆类相比，蚕豆还含有更多的钙、磷、铁和锌。此外，蚕豆对癌症、II型糖尿病、心血管疾病和高胆固醇血症等多种慢性疾病具有保护作用，同时也是左旋多巴（L-dopa）的良好来源，后者是多巴胺的前体，可用于治疗帕金森病。因此，检测不同品种蚕豆的主要营养成分，有助于评估其特定的营养价值，以确保健康饮食。

然而，传统的蚕豆营养成分检测方法主要依赖于高效液相色谱、气相色谱等化学分析技术。这些方法需要繁琐的样品前处理流程和复杂的仪器操作，耗时费力，且容易导致样品破坏，与市场对快速、高效检测的需求相悖。因此，开发一种快速、无损的蚕豆营养成分检测方法具有重大的现实意义。

近红外光谱（Near-Infrared Spectroscopy, NIRS）是一种重要的光谱分析技术，其原理基于化合物中的特定官能团吸收近红外光，引起振动的倍频和合频吸收，从而提供分子组成的详细信息。大多数有机化合物的主要结构和成分可以通过其近红外光谱进行表征，这促进了近红外光谱在食品工业中的广泛应用。结合偏最小二乘（Partial Least Squares, PLS）、支持向量机（Support Vector Machine, SVM）、随机森林（Random Forest, RF）等多变量统计分析，近红外光谱分析技术具有快速、低成本、无损等优点，被广泛应用于玉米、水稻、甘薯、糯稻、咖啡豆等多种农产品的营养成分检测中，并表现出令人满意的性能。此外，通过使用光谱预处理、特征波长提取、模型集成等方法，可以提高所建立模型的灵敏度和准确性。

深度学习是一种模拟人脑分析和学习过程的方法。随着人工智能的进步，深度学习模型已成为对分析仪器相关的多变量数据进行建模的最流行工具之一。多层感知机（Multilayer Perceptron, MLP）是一种基础的前馈神经网络，由多个全连接层组成。每个神经元与前一层的所有神经元相连，这种结构使MLP能够捕捉输入数据之间的复杂交互关系，并执行复杂的计算任务。因此，MLP具有强大的表达和泛化能力。MLP与近红外光谱相结合，已成功应用于梨可溶性固形物含量的检测和留兰香（Mentha spicata）精油含量的预测。除了食品质量分析，机器学习在营养与健康相关的建模中也得到了广泛应用。例如，一种具有分层稀疏网络的混合深度学习架构已成功用于为女性月经周期提供营养推荐；K近邻（KNN）和朴素贝叶斯模型也被用于改进肥胖预测和设计定制化营养计划。此外，基于对立学习和元启发式优化的高级特征选择技术已被整合到深度学习框架中，用于个性化月经营养推荐。这些例子凸显了机器学习和深度学习在解决复杂营养挑战方面的多功能性，进一步支持了将类似方法应用于预测蚕豆营养品质的可行性。

因此，鉴于这些在营养相关领域的成功应用，研究人员尝试使用MLP建模来预测蚕豆中的营养成分含量。

尽NIRS结合化学计量学在谷物和豆类分析中取得了有前景的结果，但现有研究仍存在一些尚未解决的局限性。首先，大多数已发表的工作依赖于单一的预处理方法（例如，仅使用SG平滑或仅使用MSC）和单一的特征选择算法（例如，仅使用PCA），而没有系统地比较不同的组合。这可能导致模型性能不佳，因为最佳的预处理和特征选择策略通常因成分而异。其次，大多数研究采用PLS等线性校准模型，这些模型难以捕捉光谱吸收与营养成分含量之间的非线性关系，特别是在存在重叠吸收带的情况下。第三，只有少数研究同时针对同一豆类作物中的多种营养成分；针对特定成分优化的流程很少被建立。第四，尽管深度学习方法在非线性建模方面功能强大，但很少应用于豆类NIRS数据。因此，显然需要进行系统性评估，比较广泛的预处理策略、特征选择算法以及传统和深度学习模型，同时为每种成分提供特定的最佳流程和透明的实验细节报告。

本研究旨在开发一种集成的NIRS方法，用于准确、快速、无损地量化蚕豆中的四种主要营养成分——淀粉、蛋白质、水分和膳食纤维。定量目标是实现每种成分的确定系数（R²）大于0.9。为解决以往研究的局限性，本工作的主要创新点在于：（1）系统地比较了针对蚕豆NIRS的1102种预处理组合，这代表了针对该作物一次显著全面的评估；（2）应用多层感知机（Multilayer Perceptron, MLP）同时预测四种主要营养成分，并与传统的PLS、SVR和RF模型进行直接比较；（3）建立了针对每种成分特定的“预处理-特征选择-建模”最优流程，为多成分质量评估提供了实用框架。

研究被划分为以下几个关键阶段：（1）使用标准分析方法测定所有四种成分的参考含量，并获取相应的原始近红外光谱；（2）系统评估单一和组合的光谱预处理技术，以增强光谱质量和模型稳健性；（3）应用七种特征波长选择算法提取信息性光谱变量并提高模型效率；（4）使用三种传统机器学习方法和一种深度学习方法（多层感知机，MLP）构建预测模型；（5）综合性能比较，并根据验证指标为每种成分选择最优的集成建模流程。该研究从而建立了可重复的蚕豆多成分质量评估分析框架，并为基于NIRS的其他农产品分析提供了方法学见解。

蚕豆样品准备阶段，研究人员收集了2023年6月至9月产自青海省农业科学院试验基地的130个不同品种的蚕豆，选取每个品种完整饱满的籽粒并标记后于-18°C储存。近红外光谱采集使用DA 7250近红外光谱仪（Perten Instruments, Sweden）。在测量前将光谱仪预热至少30分钟以确保信号稳定性。完整的整颗蚕豆籽粒直接置于仪器样品杯中进行光谱扫描，每个样品扫描32次取平均。

光谱描述与数据预处理阶段，使用Python的JCAMP包读取并整理dx格式的光谱数据。将同一样本的光谱数据合并并取平均，结果如图1所示。从原始光谱图中可以观察到两个峰（1210 nm和1487 nm）以及两个谷（1119 nm和1311 nm）。波长在1119 nm和1311 nm附近，以及1210 nm附近，可能归因于CH伸缩振动的第二倍频；而接近1487 nm的波长可能归因于...（原文此处描述不完整，但提及了光谱特征峰谷与化学键振动的对应关系）。

讨论部分指出，蚕豆是重要的农产品和食品原料，其营养成分在食品生产加工过程中需要被检测，但传统的化学检测方法耗时费力，且破坏样品。因此，开发一种快速、无损的蚕豆营养成分检测方法对于生产加工中的质量控制和产品评价具有重要意义。作为一种快速、...（原文此处开始部分句子，后续内容在结论部分）。

结论部分总结，本研究开发了一个集成的NIRS框架，用于蚕豆中淀粉、蛋白质、水分和膳食纤维的快速、无损量化。通过系统整合光谱预处理、特征波长选择和机器学习建模，成功地为每种成分构建了高性能的预测模型。结果表明，组合预处理策略显著优于单一方法，CARS算法在特征...（原文此处句子未完成）。综合来看，该研究为蚕豆乃至其他农产品的多成分快速无损检测提供了有效的方法学参考。

联系信箱：

粤ICP备09063491号

热点排行