巴西联邦预算分配的探索性混合人工智能工作流：数据稀缺条件下的预测-优化建模与政策情景分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Data & Policy》：An exploratory hybrid AI workflow for Brazilian federal budget allocation

【字体：大中小】 时间：2026年04月09日 来源：Data & Policy 2.7

编辑推荐：

　　本研究针对巴西联邦预算分配在严重数据约束下的决策难题，构建了结合多输出XGBoost预测与贝叶斯优化(TPE/Optuna)的混合AI工作流，通过合成数据增强解决小样本问题，实现了对经济增长、通胀与不平等的多目标优化情景推演，为公共财政“假设分析”提供了可审查、可复现的方法框架。

在公共财政领域，预算分配始终是国家治理的核心命题——从Musgrave提出的“配置、分配、稳定”三大经典职能，到数字化时代人工智能(AI)驱动的决策支持，如何平衡经济增长、通胀控制与公平分配的多重目标，一直是全球政策制定者的痛点。然而，在巴西这样的新兴经济体，这一挑战尤为尖锐：尽管2024年联邦预算规模高达约5.5万亿雷亚尔（约合1.1万亿美元），但可用数据极其匮乏——受限于预算分类的历史变更，2000年至2023年间仅能提取24条年度有效观测值，且缺乏跨时期的可靠映射规则，导致纵向可比性难以稽核。更棘手的是，传统增量预算法因僵化、适应性差而备受诟病，而现有AI应用多集中于发达国家长序列数据场景，针对小样本、高维度预算问题的探索几乎空白。

为破解这一困局，一项发表于《Data》的研究首次将混合预测-优化工作流引入巴西联邦预算体系，其核心创新在于：面对仅24条真实观测值的极端数据稀缺，研究团队并未止步于简单回归，而是构建了“合成增强+多目标学习+贝叶斯搜索”的全流程方案，旨在为政策制定者提供可审查、可复现的情景模拟工具，而非替代人类决策的“黑箱”处方。

研究的关键技术路径清晰而务实：首先，以巴西2000-2023年按功能分类的已执行支出为输入，GDP增长、通货膨胀率与基尼系数(Gini index)为多输出目标，建立多输出极限梯度提升(XGBoost)预测模型；其次，针对小样本瓶颈，创新性融合三种合成数据增强策略——控制噪声注入（高斯噪声标准差0.05）、自助重抽样（1000次配对采样）与变分自编码器(VAE)重构，将数据集扩展至1072条（24条真实+1048条合成）；最后，采用基于树结构Parzen估计器(TPE)的贝叶斯优化（通过Optuna库实现），在历史边界与惩罚项约束下搜索最大化目标函数（标准化后Score = GDP_growth - Inflation - Gini_index）的预算分配向量。所有数据与代码均开源共享，确保全流程可追溯。

学习曲线与性能诊断揭示增强策略的双面性

学习曲线分析显示，随着训练集扩大，验证误差在中间样本量处最低，最终稳定在约0.04，但训练-验证间的持续差距暴露了过拟合风险。更关键的发现来自双重验证协议的对比：在增强数据集上的随机K折交叉验证中，模型表现惊艳——平均决定系数R²=0.97，平均均方误差(MSE)=0.04，调整后R²达0.96；然而，在“防泄漏”设计（仅从训练折叠生成合成数据，以真实观测值测试）下，泛化能力急剧下滑：整体平均MSE升至1.03，R²跌至-0.45，仅基尼系数保持正向解释力（R²=0.60）。这一反差警示：合成增强虽提升内部分布拟合，但对未见过真实条件的预测稳健性仍存疑，极端值处的误差放大尤其明显。

预测精度呈现“中心紧、两端散”特征

标准化后的预测值与观测值对比显示，在中部区间两者高度重叠——如GDP增长观测值1.22对应预测值1.21，基尼指数观测值1.92对应1.90，通胀观测值-1.75对应-1.75；但在分布尾端，尤其GDP增长与通胀的极值点，预测偏差显著增大。散点图中，多数点沿恒等线密集分布，而两端离散加剧，印证模型对常规情景捕捉精准，对异常冲击的预测力有限。

优化情景揭示结构性再分配方向

贝叶斯优化锁定了一个满足目标函数的“理想化”情景：在标准化输出尺度上，GDP增长达1.15（高于历史均值1.15个标准差），通胀为-0.04（低于均值0.04个标准差），基尼指数为-0.17（低于均值0.17个标准差）。对应的输入调整方向明确：文化(+0.60)、农业(+0.33)、行政管理(+0.24)与立法(+0.24)支出上调，而劳动(-1.04)、土地整理(-0.80)、体育休闲(-0.68)、卫生(-0.64)与社会保障(-0.60)支出下调。需强调的是，这些数值反映的是相对于历史分布的偏移幅度，而非绝对预算份额，且完全依赖模型对同期关联的捕捉，未纳入滞后效应。

研究的深刻启示在于，它将“技术可行性”与“政策实用性”做了严格区分：混合AI工作流的价值不在于产出“最优解”，而在于将隐含假设显性化——从权重设定（等权重仅为基准情形）、时间对齐（同年关联非因果），到增强策略的敏感性，每一步都可被审视与迭代。更重要的是，它指向了巴西乃至拉美公共财政的根本瓶颈：预算分类体系的断层与元数据缺失，比算法本身更制约分析深度。未来方向已然清晰：推进跨时期分类映射的标准化，引入时滞结构与因果推断方法，并在多国数据上检验框架的可迁移性。

这项工作不仅是方法论的展示，更是对“负责任AI”的实践：通过全栈开源与透明记录，它为公共部门团队提供了可修改、可批判的工具，让算法真正服务于政策辩论的丰富，而非决策的简单外包。

联系信箱：

粤ICP备09063491号

热点排行