利用组合分析方法与机器学习融合技术实现快速准确的CPU性能建模

《IEEE Micro》:Fast and Accurate CPU Performance Modeling with Compositional Analytical–ML Fusion

【字体: 时间:2026年06月05日 来源:IEEE Micro 2.9

编辑推荐:

   摘要:像gem5这样的周期级模拟器在微架构设计中被广泛使用,但在大规模设计空间探索中速度却非常慢。我们提出了Concorde,这是一种用于快速准确地学习微架构性能模型的新方法。与现有的模拟器和学习方法不同,Concorde使用简单的分析模型来计算每个组件的性能界限,生成紧凑的分

  

摘要:

像gem5这样的周期级模拟器在微架构设计中被广泛使用,但在大规模设计空间探索中速度却非常慢。我们提出了Concorde,这是一种用于快速准确地学习微架构性能模型的新方法。与现有的模拟器和学习方法不同,Concorde使用简单的分析模型来计算每个组件的性能界限,生成紧凑的分布数据,然后通过机器学习模型将这些数据映射到程序行为上。Concorde的速度比谷歌的周期级模拟器快五个数量级以上,在SPEC2017、开源测试以及谷歌的专有基准测试中,其平均每指令周期(CPI)预测误差约为2%。Concorde已经在谷歌内部推动了大规模架构探索,为CPU设计项目做出了贡献。这使得以前无法进行的分析成为可能:在大约一小时内,我们首次对微架构组件进行了细粒度的性能归因分析,而这需要大约1.5亿次CPI评估。同样的组合式分析-机器学习方法不仅适用于CPU,还表明了一种构建快速、可解释的性能模型的更广泛途径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号