《ACS Omega》:Integrating Untargeted GC-MS Metabolomics, GNPS Molecular Networking, and Machine Learning for Sugarcane Byproduct Valorization
编辑推荐:
全球制糖工业每年产生大量副产物与废弃物,带来显著的环境压力。本研究遵循循环经济与零废弃原则,探索通过溶剂提取结合先进代谢组学分析实现甘蔗残余物的高值化利用。研究人员采用多种有机溶剂对不同部位甘蔗材料进行代谢物提取,经N,O-双(三甲基硅烷基)三氟乙酰胺(BST
全球制糖工业每年产生大量副产物与废弃物,带来显著的环境压力。本研究遵循循环经济与零废弃原则,探索通过溶剂提取结合先进代谢组学分析实现甘蔗残余物的高值化利用。研究人员采用多种有机溶剂对不同部位甘蔗材料进行代谢物提取,经N,O-双(三甲基硅烷基)三氟乙酰胺(BSTFA)衍生化后,利用气相色谱-质谱(GC-MS)进行分析。借助开源平台(MSHub、GNPS、Cytoscape)完成自动光谱去卷积与分子网络构建,实现代谢物结构去重与聚类。将代谢组数据与样品元数据整合,实现跨提取条件下的化学多样性与代谢物丰度的系统比较。研究人员应用随机森林与多元统计分析等机器学习方法,识别出区分生物质类型与提取溶剂体系的特征性化学驱动因子。结果表明,特定的溶剂-生物质组合显著影响高附加值化合物(包括多廿烷醇、植物甾醇、三萜类化合物及酚酸)的产率与选择性。其中,蔗叶残渣与滤泥被确认为脂质类化合物回收的潜力基质;甲醇与乙醇总体提取效率最高,而非极性溶剂如叔丁基甲基醚(TBME)与正己烷则能够选择性富集甾醇与长链醇。通过将分子数据与统计建模及产率分析相结合,本研究提出了一种数据驱动的优化生物炼制工艺框架,为甘蔗副产物高值化利用的效率提升、经济增值与环境可持续性提供了关键支撑。
研究背景与意义
全球制糖业在支撑食品与能源供应链的同时,产生了大量固体与液体副产物,包括蔗梢、蔗叶、蔗渣、滤泥和糖蜜,其处置不当会造成环境污染并加剧资源浪费。尤其在部分地区,收获前焚烧甘蔗导致细颗粒物(PM2.5)排放,威胁公共健康。针对这一问题,循环经济理念推动了对甘蔗副产物的高值化利用研究。已有报道表明,甘蔗中含有丰富的生物活性成分,如多廿烷醇(policosanols)、酚类化合物、植物甾醇和三萜类,这些化合物在营养保健、化妆品及医药领域具有潜在应用价值。然而,不同甘蔗副产物的化学组成差异及其与提取溶剂选择之间的关系尚未得到系统性解析,限制了高效生物炼制工艺的开发。为此,研究人员整合非靶向气相色谱-质谱(GC-MS)代谢组学、全球天然产物社交分子网络(GNPS)平台及机器学习方法,对不同溶剂提取下的甘蔗副产物化学成分进行了全面解析,以期构建数据驱动的副产物高值化利用策略。该研究成果发表于《ACS Omega》。
主要关键技术方法
研究选取五种甘蔗副产物(蔗叶、蔗梢、蔗渣、滤泥、蔗茎残渣),分别使用五种不同极性的溶剂(甲醇、乙醇、乙酸乙酯、叔丁基甲基醚、正己烷)进行索氏提取。提取物经BSTFA衍生化后进行GC-MS分析,原始数据经ProteoWizard转换为mzML格式,并在GNPS平台的MSHub中进行去卷积处理。随后,利用特征导向分子网络与统计分析(FBMN-STAT)构建分子网络,并通过Cytoscape进行可视化与注释。代谢组学数据在R语言环境中进行空白去除、缺失值填补、归一化与自标度缩放等预处理,之后采用主坐标分析(PCoA)、层次聚类及随机森林模型进行多元统计与分类识别。
研究结果
3.1 不同溶剂条件下甘蔗生物质的提取产率
研究发现,滤泥在所有溶剂中均表现出最高的总提取率,而蔗渣最低。甲醇对蔗叶残渣的提取率达到12.4%,为所有溶剂-材料组合中最高。整体上,甲醇的总体提取效率最高,其次为乙醇、乙酸乙酯、叔丁基甲基醚和正己烷。从工业化可行性来看,乙醇因成本低、安全性好、可再生的特性被认为是最平衡的绿色溶剂选择。
3.2 基于GC-MS分子网络的化合物类别聚类分析
共检测到357个质谱特征峰,约33%获得注释,分为四个主要簇:脂肪酸、多廿烷醇及烃类(簇A);糖类及其衍生物(簇B);甘油、多元醇及有机酸(簇C);植物甾醇和三萜类(簇D)。簇A中多廿烷醇亚类显示,二十八烷醇在滤泥中丰度最高,三十烷醇与二十六烷醇在不同生物质中分布各异;簇D中β-谷甾醇、豆甾醇和菜油甾醇在滤泥中含量最高,三萜类如glutinol和lanosterol则在蔗叶残渣中显著富集。
3.3 甘蔗生物质代谢组的比较分析
主坐标分析(PCoA)显示,生物质类型对代谢谱的影响大于溶剂极性,生物质解释了约34%的代谢变异。随机森林模型实现了对五种甘蔗副产物的100%分类准确率,验证了代谢特征的特异性。特征重要性分析指出,四三十四烷醇、棕榈酸、油酸、glutinol和二十六烷醇是区分各类副产物的关键化合物。
3.4 甘蔗生物质代谢物的比较分析
热图分析将代谢物分为四个簇,分别富集于极性化合物(簇1)、中链脂肪酸与酚酸(簇2)、长链脂肪酸与甾醇(簇3)、极长链脂肪酸与三萜类(簇4)。滤泥是甾醇与多廿烷醇的主要来源,蔗叶残渣富含三萜类。极性溶剂适合总产率最大化,非极性溶剂则提高目标化合物的选择性。
讨论与结论
研究证明,结合GC-MS代谢组学、GNPS分子网络和机器学习可有效揭示甘蔗副产物的化学多样性,并指导溶剂与原料的匹配优化。滤泥与蔗叶残渣是高价值脂质类成分的重要来源,非极性溶剂在选择性回收甾醇、多廿烷醇和三萜类方面表现优异,而极性溶剂则更适合总产率最大化。该框架为甘蔗生物炼制的精准化、绿色化与可持续化发展提供了科学依据与技术支撑。