深度主动学习用于高效重构预测的标签生成 Abdulmajeed Alameer 和 Amal Alazba

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Information》：Deep Active Learning for Label-Efficient Refactoring Prediction Abdulmajeed Alameer and Amal Alazba

【字体：大中小】 时间：2026年04月30日 来源：Information 2.9

编辑推荐：

　　摘要

摘要

软件重构可以提高代码的可维护性并减少技术债务，但构建带有标签的重构数据集是一个成本高昂且劳动密集型的过程。为了在有限的注释预算下使重构预测更具可行性，本文提出了一种深度主动学习（DAL）流程，该流程通过软件度量表示迭代训练深度神经分类器，并选择性地查询最具信息量的未标记实体。我们在基于池的分类器设置中，针对类级、方法级和变量级重构数据集（多种重构类型）评估了所提出的方法，使用了统一的训练协议和一系列广泛的查询策略。结果表明，DAL可以在使用显著较少的标签的情况下恢复接近全数据的效果：平均而言，类级重构需要11.4%的标记数据，方法级重构需要25.0%的标记数据，变量级重构需要20.0%的标记数据——这相当于节省了大约75%到89%的标记工作量，证明了重构预测数据效率的提高。此外，基于不确定性的策略和增强Dropout的策略在各种重构类型和标记预算下都是最有效的查询策略。

联系信箱：

粤ICP备09063491号

摘要

热点排行