深度主动学习用于高效重构预测的标签生成
Abdulmajeed Alameer 和 Amal Alazba
《Information》:Deep Active Learning for Label-Efficient Refactoring Prediction
Abdulmajeed Alameer and
Amal Alazba
【字体:
大
中
小
】
时间:2026年04月30日
来源:Information 2.9
摘要
软件重构可以提高代码的可维护性并减少技术债务,但构建带有标签的重构数据集是一个成本高昂且劳动密集型的过程。为了在有限的注释预算下使重构预测更具可行性,本文提出了一种深度主动学习(DAL)流程,该流程通过软件度量表示迭代训练深度神经分类器,并选择性地查询最具信息量的未标记实体。我们在基于池的分类器设置中,针对类级、方法级和变量级重构数据集(多种重构类型)评估了所提出的方法,使用了统一的训练协议和一系列广泛的查询策略。结果表明,DAL可以在使用显著较少的标签的情况下恢复接近全数据的效果:平均而言,类级重构需要11.4%的标记数据,方法级重构需要25.0%的标记数据,变量级重构需要20.0%的标记数据——这相当于节省了大约75%到89%的标记工作量,证明了重构预测数据效率的提高。此外,基于不确定性的策略和增强Dropout的策略在各种重构类型和标记预算下都是最有效的查询策略。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号