数字化转型对中国农业企业绿色创新影响的揭示:一种基于可解释机器学习的方法

《Agriculture》:Unveiling the Effects of Digital Transformation on Agribusiness Green Innovation in China: An Explainable Machine Learning-Based Approach

【字体: 时间:2026年06月11日 来源:Agriculture 3.6

编辑推荐:

  数字化转型是推动农业企业绿色创新的关键驱动力。尽管数字化转型对企业创新的积极影响已得到充分证实,但其多维属性及其与农业企业绿色创新之间的异质性关联仍缺乏深入研究。本研究将数字化转型拆解为五个业务维度和两个结构特征,采用2011—2021年155家中国A股上市农

  
数字化转型是推动农业企业绿色创新的关键驱动力。尽管数字化转型对企业创新的积极影响已得到充分证实,但其多维属性及其与农业企业绿色创新之间的异质性关联仍缺乏深入研究。本研究将数字化转型拆解为五个业务维度和两个结构特征,采用2011—2021年155家中国A股上市农业公司样本。通过构建整合贝叶斯优化(Bayesian optimization)XGBoost与SHAP(SHapley Additive exPlanations)的可解释机器学习框架,识别各特征对以绿色专利申请衡量的绿色创新的个体预测效应与交互预测效应。结果显示,治理数字化是农业绿色创新的主导性预测驱动因素,其次为制度数字化。仅仅扩大数字化转型覆盖范围,并不会对基于绿色专利的创新产出带来实质性提升。不同数字化维度呈现出显著异质性的非线性关联,并具有不同的阈值特征。研究还发现,数字化各维度之间存在显著协同交互联系,多维度协调发展的数字化进程对于充分释放数字化转型的绿色创新潜力至关重要。这些发现为农业企业管理者与政策制定者优化数字投资优先序并促进低碳转型提供了启示。
本文发表于《Agriculture》,聚焦数字经济与实体经济深度融合背景下,中国农业企业如何通过数字化转型提升绿色创新能力这一重要议题。研究背景在于,农业企业作为农业技术创新的重要主体,既承担农业现代化任务,也面临绿色低碳转型压力。然而,与制造业和高技术企业相比,中国农业企业在创新活动中具有明显部门特性:生产过程非标准化、产业链条长且分散、抵押资产不足、风险承受能力较弱,导致创新效率偏低、高质量创新产出不足。与此同时,农业领域面临日益加剧的生态约束,绿色创新因此成为兼顾生产率提升与生态可持续性的迫切路径。现有研究虽然已经证实数字化转型能够促进企业创新,但大多聚焦工业企业,并通常将数字化转型视为单一维度变量,难以揭示农业企业内部不同业务环节数字化的异质性作用。此外,传统线性计量方法难以识别数字化转型与绿色创新之间可能存在的非线性关系、阈值效应及复杂交互效应,因此有必要开展针对农业企业多维数字化转型的系统研究。

围绕上述问题,研究人员以资源基础观(强调异质资源形成竞争优势)、动态能力理论(强调资源整合与重构)和资源互补理论为分析基础,提出三个核心研究问题:哪一数字化维度是农业企业绿色创新的核心预测驱动因素;不同数字化维度与绿色创新之间呈现何种异质性关联;不同数字化维度之间是否存在协同交互作用。研究得出的总体结论是:农业企业数字化转型对绿色创新的影响并非“越广越好”,而是呈现出明显的层级差异、非线性阈值特征和协同互补关系。其中,治理数字化(GD)是最重要的预测驱动因素,制度数字化(ID)次之;生产数字化(PD)和追溯数字化(TD)也具有重要作用;单纯扩大数字化覆盖面的数字化转型范围(DS)几乎不产生实质性贡献。该研究的重要意义在于,推进了农业企业数字化转型的测度框架与方法框架,从传统单指标、线性分析推进到多维分解、可解释机器学习分析,为企业制定数字投资优先序和政府实施差异化支持政策提供了经验依据。

在技术方法方面,研究人员选取2011—2021年中国A股上市农业企业作为样本,最终获得155家企业、1636个企业—年份观测值。文本数据来自中国证券信息网年报,绿色专利数据来自中国研究数据服务平台,财务与治理数据来自CSMAR和Wind数据库。研究以绿色发明专利申请量经对数化处理作为农业企业绿色创新指标,并基于年报关键词频次构建五个业务维度——生产数字化(PD)、流通数字化(CD)、追溯数字化(TD)、治理数字化(GD)、制度数字化(ID)——以及两个结构特征——数字化转型范围(DS)与数字化转型均衡性(DB)。方法上,采用贝叶斯优化(Bayesian optimization)调参的XGBoost模型进行预测,并使用SHAP解析变量重要性、非线性边际贡献和交互效应,同时辅以替换因变量、剔除疫情年份和改用LightGBM等稳健性检验。

在研究结果部分,论文依次呈现了多个小节的分析结论。

5.1. Bayesian Hyperparameter Optimization
本节说明研究人员利用贝叶斯优化完成XGBoost超参数搜索,并在训练集内部嵌套5折交叉验证,防止数据泄露。结果显示,优化过程在多个关键参数上均表现出良好的收敛性,说明模型并非拟合噪声,而是在较优参数区域获得了稳定表现。这一部分的作用在于为后续模型解释提供可靠的参数基础。

5.2. Model Validation and Comparison
本节通过均方根误差、平均绝对误差和R2对模型进行验证,并与决策树、随机森林、Elastic Net、LightGBM及其优化版本进行比较。结果表明,贝叶斯优化后的XGBoost模型整体表现最佳,具有最低RMSE、最低MAE和最高R2。尤其是线性模型Elastic Net解释力显著较弱,说明数字化转型与农业企业绿色创新之间确实存在强非线性关系,传统线性模型难以充分捕捉。由此,研究人员确认XGBoost+BO为后续分析最合适的基准模型。

5.3. Predictive Drivers of Digital Transformation to Agribusiness Green Innovation
本节围绕数字化转型各维度的重要性展开,检验命题1。通过XGBoost内置特征重要性与SHAP平均绝对值排序,研究人员发现治理数字化(GD)在两类排序中均位列第一,是农业企业绿色创新最核心的预测驱动因素;制度数字化(ID)稳定位列第二,表明外部数字制度环境对绿色创新也具有关键意义。追溯数字化(TD)和生产数字化(PD)同样具有较强解释力,反映农业企业绿色创新与生产管理、质量安全管理高度相关。流通数字化(CD)与数字化转型均衡性(DB)呈辅助性正向贡献。值得注意的是,数字化转型范围(DS)在两类排序中均接近最低,且SHAP总效应近零,说明仅扩展数字化覆盖的“宽而浅”策略并不足以提升绿色创新产出。该结论直接表明数字资源在不同业务环节中的价值并不相同,农业企业需要聚焦关键维度而非盲目铺开。

5.4. Nonlinear Relationship Between Digital Transformation and Agribusiness Green Innovation
本节利用SHAP依赖图检验命题2,揭示各维度与绿色创新之间的非线性关系。结果显示,不同维度具有显著异质性的阈值特征。生产数字化(PD)呈轻微U型,在较低水平时边际贡献为负,超过一定水平后逐步转为弱正向,说明前期设备和系统投入可能挤占研发资源,只有积累到一定程度后才释放绿色创新效应。流通数字化(CD)则表现为持续增强的正向贡献,没有明显阈值约束。追溯数字化(TD)呈L型特征,在较低水平时具有较强正向作用,但随着数值增加其边际贡献迅速下降并趋于稳定,表明追溯体系在满足基本合规和认证要求后,进一步扩张带来的增益有限。治理数字化(GD)呈显著U型,在低中水平时对绿色创新贡献为负,但当Ln(GD)大致超过0.25后转为明显正向,说明底层数字基础设施只有在较成熟状态下才能充分支持绿色创新。制度数字化(ID)呈指数式增长特征,在Ln(ID)<0.3时贡献有限,而一旦跨越阈值,边际贡献迅速增强,显示数字信贷、数字保险和智能补贴等制度安排在达到一定成熟度后会显著改善创新环境。数字化转型均衡性(DB)表现为稳步增强的正向作用,而数字化转型范围(DS)在全区间几乎无明显变化,进一步印证其预测相关性极弱。

5.5. Interaction Effects Between Features of Digital Transformation
本节通过SHAP交互值检验命题3,重点考察不同数字化维度之间是否存在协同效应。结果显示,治理数字化(GD)与制度数字化(ID)的交互会明显削弱GD原有的U型波动,使其在低水平时负向影响减轻、高水平时正向贡献增强;GD与生产数字化(PD)的交互同样会平滑GD的波动轨迹,并强化高GD区间的正向贡献。制度数字化(ID)与生产数字化(PD)的交互则使ID原本快速上升的边际贡献变得更平稳,但在高ID区间能够进一步放大其正向作用。GD与追溯数字化(TD)的交互也表现出类似特征,即高TD有助于强化高GD时对绿色创新的积极预测效应。GD与数字化转型均衡性(DB)的交互表明,多维数字化配置更均衡时,治理数字化跨越阈值后的积极效应会进一步增强。DB与ID之间的交互则说明制度数字化水平较高时,均衡化布局本身也更可能转化为绿色创新收益。总体而言,交互结果表明,多维数字化并非简单相加,而是通过互补配置平滑单一维度的波动、降低阈值约束、放大核心维度贡献,因此协调发展的多维数字化体系才是释放绿色创新潜力的关键。

5.6. Robustness Checks
本节通过三类稳健性检验验证结论的稳定性。第一,使用“绿色专利申请量与授权量之和”的对数替换原有绿色创新指标,结果表明SHAP特征重要性排序与基准模型高度一致。第二,剔除2020—2021年疫情年份后重新估计模型,尽管整体拟合度下降,但核心重要性排序仍保持稳定,说明主要结论并非由疫情时期样本驱动。第三,将基学习器由XGBoost替换为LightGBM后,虽然预测性能减弱,但特征重要性模式仍与基准模型一致。研究人员据此认为,主要结论对指标替换、样本时期变化和模型设定调整均具有稳健性。

在讨论部分,论文进一步对结果作出归纳。首先,在“Representative Features of Digital Transformation for Agribusiness Green Innovation”中,作者强调治理数字化和制度数字化是最具代表性的核心特征,而DS无显著作用,说明数字化转型必须强调深度而非简单扩面。其次,在“Impact of Multi-Dimensional Digital Transformation on Agribusiness Green Innovation”中,作者从“Individual Nonlinear Effects”和“Interaction and Synergistic Effects”两个层面说明,数字化维度之间既存在不同的阈值轨迹,也存在显著协同互补关系。最后,在“Implications”中,作者指出农业企业应优先推进治理数字化和制度数字化,避免“宽而浅”的象征性数字化布局,并重视多维协同;政策制定者则应完善数字信贷、数字农业保险、智能补贴等制度环境,为不同基础条件的农业经营主体提供差异化支持。

研究结论部分可概括翻译如下:数字化转型已成为与农业企业绿色创新密切相关的核心因素,也是中国农业实现低碳转型、高质量发展和乡村振兴的重要战略路径。基于2011—2021年中国A股上市农业企业样本,研究将数字化转型拆分为五个业务维度和两个结构特征,并借助整合贝叶斯优化、XGBoost和SHAP的可解释机器学习框架进行系统分析。研究发现,单纯增加数字化维度数量并不会带来实质性绿色创新提升;治理数字化是最重要的预测驱动因素,制度数字化次之,追溯数字化和生产数字化也具有重要作用,流通数字化与数字化转型均衡性发挥补充作用。不同数字化维度与绿色创新之间存在显著异质性的非线性关系和阈值特征,同时各维度之间存在明显协同交互作用,多维协调发展的数字化转型对于释放农业企业绿色创新潜力具有关键意义。论文同时指出,XGBoost—SHAP框架揭示的是预测关联而非因果关系,且样本范围、文本测度方式及绿色专利指标本身仍存在一定局限。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号