利用组合分析方法与机器学习融合技术实现快速准确的CPU性能建模
《IEEE Micro》:Fast and Accurate CPU Performance Modeling with Compositional Analytical–ML Fusion
【字体:
大
中
小
】
时间:2026年06月05日
来源:IEEE Micro 2.9
编辑推荐:
摘要:像gem5这样的周期级模拟器在微架构设计中被广泛使用,但在大规模设计空间探索中速度却非常慢。我们提出了Concorde,这是一种用于快速准确地学习微架构性能模型的新方法。与现有的模拟器和学习方法不同,Concorde使用简单的分析模型来计算每个组件的性能界限,生成紧凑的分
摘要:
像gem5这样的周期级模拟器在微架构设计中被广泛使用,但在大规模设计空间探索中速度却非常慢。我们提出了Concorde,这是一种用于快速准确地学习微架构性能模型的新方法。与现有的模拟器和学习方法不同,Concorde使用简单的分析模型来计算每个组件的性能界限,生成紧凑的分布数据,然后通过机器学习模型将这些数据映射到程序行为上。Concorde的速度比谷歌的周期级模拟器快五个数量级以上,在SPEC2017、开源测试以及谷歌的专有基准测试中,其平均每指令周期(CPI)预测误差约为2%。Concorde已经在谷歌内部推动了大规模架构探索,为CPU设计项目做出了贡献。这使得以前无法进行的分析成为可能:在大约一小时内,我们首次对微架构组件进行了细粒度的性能归因分析,而这需要大约1.5亿次CPI评估。同样的组合式分析-机器学习方法不仅适用于CPU,还表明了一种构建快速、可解释的性能模型的更广泛途径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号