巴西联邦预算分配的探索性混合人工智能工作流:数据稀缺条件下的预测-优化建模与政策情景分析

《Data & Policy》:An exploratory hybrid AI workflow for Brazilian federal budget allocation

【字体: 时间:2026年04月09日 来源:Data & Policy 2.7

编辑推荐:

  本研究针对巴西联邦预算分配在严重数据约束下的决策难题,构建了结合多输出XGBoost预测与贝叶斯优化(TPE/Optuna)的混合AI工作流,通过合成数据增强解决小样本问题,实现了对经济增长、通胀与不平等的多目标优化情景推演,为公共财政“假设分析”提供了可审查、可复现的方法框架。

  
在公共财政领域,预算分配始终是国家治理的核心命题——从Musgrave提出的“配置、分配、稳定”三大经典职能,到数字化时代人工智能(AI)驱动的决策支持,如何平衡经济增长、通胀控制与公平分配的多重目标,一直是全球政策制定者的痛点。然而,在巴西这样的新兴经济体,这一挑战尤为尖锐:尽管2024年联邦预算规模高达约5.5万亿雷亚尔(约合1.1万亿美元),但可用数据极其匮乏——受限于预算分类的历史变更,2000年至2023年间仅能提取24条年度有效观测值,且缺乏跨时期的可靠映射规则,导致纵向可比性难以稽核。更棘手的是,传统增量预算法因僵化、适应性差而备受诟病,而现有AI应用多集中于发达国家长序列数据场景,针对小样本、高维度预算问题的探索几乎空白。
为破解这一困局,一项发表于《Data》的研究首次将混合预测-优化工作流引入巴西联邦预算体系,其核心创新在于:面对仅24条真实观测值的极端数据稀缺,研究团队并未止步于简单回归,而是构建了“合成增强+多目标学习+贝叶斯搜索”的全流程方案,旨在为政策制定者提供可审查、可复现的情景模拟工具,而非替代人类决策的“黑箱”处方。
研究的关键技术路径清晰而务实:首先,以巴西2000-2023年按功能分类的已执行支出为输入,GDP增长、通货膨胀率与基尼系数(Gini index)为多输出目标,建立多输出极限梯度提升(XGBoost)预测模型;其次,针对小样本瓶颈,创新性融合三种合成数据增强策略——控制噪声注入(高斯噪声标准差0.05)、自助重抽样(1000次配对采样)与变分自编码器(VAE)重构,将数据集扩展至1072条(24条真实+1048条合成);最后,采用基于树结构Parzen估计器(TPE)的贝叶斯优化(通过Optuna库实现),在历史边界与惩罚项约束下搜索最大化目标函数(标准化后Score = GDP_growth - Inflation - Gini_index)的预算分配向量。所有数据与代码均开源共享,确保全流程可追溯。
学习曲线与性能诊断揭示增强策略的双面性
学习曲线分析显示,随着训练集扩大,验证误差在中间样本量处最低,最终稳定在约0.04,但训练-验证间的持续差距暴露了过拟合风险。更关键的发现来自双重验证协议的对比:在增强数据集上的随机K折交叉验证中,模型表现惊艳——平均决定系数R2=0.97,平均均方误差(MSE)=0.04,调整后R2达0.96;然而,在“防泄漏”设计(仅从训练折叠生成合成数据,以真实观测值测试)下,泛化能力急剧下滑:整体平均MSE升至1.03,R2跌至-0.45,仅基尼系数保持正向解释力(R2=0.60)。这一反差警示:合成增强虽提升内部分布拟合,但对未见过真实条件的预测稳健性仍存疑,极端值处的误差放大尤其明显。
预测精度呈现“中心紧、两端散”特征
标准化后的预测值与观测值对比显示,在中部区间两者高度重叠——如GDP增长观测值1.22对应预测值1.21,基尼指数观测值1.92对应1.90,通胀观测值-1.75对应-1.75;但在分布尾端,尤其GDP增长与通胀的极值点,预测偏差显著增大。散点图中,多数点沿恒等线密集分布,而两端离散加剧,印证模型对常规情景捕捉精准,对异常冲击的预测力有限。
优化情景揭示结构性再分配方向
贝叶斯优化锁定了一个满足目标函数的“理想化”情景:在标准化输出尺度上,GDP增长达1.15(高于历史均值1.15个标准差),通胀为-0.04(低于均值0.04个标准差),基尼指数为-0.17(低于均值0.17个标准差)。对应的输入调整方向明确:文化(+0.60)、农业(+0.33)、行政管理(+0.24)与立法(+0.24)支出上调,而劳动(-1.04)、土地整理(-0.80)、体育休闲(-0.68)、卫生(-0.64)与社会保障(-0.60)支出下调。需强调的是,这些数值反映的是相对于历史分布的偏移幅度,而非绝对预算份额,且完全依赖模型对同期关联的捕捉,未纳入滞后效应。
研究的深刻启示在于,它将“技术可行性”与“政策实用性”做了严格区分:混合AI工作流的价值不在于产出“最优解”,而在于将隐含假设显性化——从权重设定(等权重仅为基准情形)、时间对齐(同年关联非因果),到增强策略的敏感性,每一步都可被审视与迭代。更重要的是,它指向了巴西乃至拉美公共财政的根本瓶颈:预算分类体系的断层与元数据缺失,比算法本身更制约分析深度。未来方向已然清晰:推进跨时期分类映射的标准化,引入时滞结构与因果推断方法,并在多国数据上检验框架的可迁移性。
这项工作不仅是方法论的展示,更是对“负责任AI”的实践:通过全栈开源与透明记录,它为公共部门团队提供了可修改、可批判的工具,让算法真正服务于政策辩论的丰富,而非决策的简单外包。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号