一种用于音频处理的40纳米、30.69 TOPS/W性能的FC-DNN引擎,该引擎采用基于CAM的内存搜索技术和基于DIMC的近似计算方法

《IEEE Open Journal of the Solid-State Circuits Society》:A 40-nm 30.69-TOPS/W Weight Sharing FC-DNN Engine for Audio Processing Using CAM-Based In-Memory Search and DIMC-Based Approximate Computing

【字体: 时间:2026年05月25日 来源:IEEE Open Journal of the Solid-State Circuits Society 3.2

编辑推荐:

   摘要:本文提出了一种权重共享的全连接深度神经网络(FC-DNN)架构,该架构结合了基于内容寻址内存(CAM)的内存内搜索和数字内存计算(DIMC)技术,以减少数据传输量并提高能效。通过采用权重共享机制并利用共享权重的分布式特性,该架构显著降低了存储权重的数量和权重访问的频率,从

  

摘要:

本文提出了一种权重共享的全连接深度神经网络(FC-DNN)架构,该架构结合了基于内容寻址内存(CAM)的内存内搜索和数字内存计算(DIMC)技术,以减少数据传输量并提高能效。通过采用权重共享机制并利用共享权重的分布式特性,该架构显著降低了存储权重的数量和权重访问的频率,从而减少了乘法运算的次数。该架构集成了二进制内容寻址内存(BCAM)以实现高效的索引匹配,并采用了具有近似计算功能的SRAM DIMC,从而实现了高吞吐量的数据积累和更低的功耗,同时保持了最小的精度损失。该架构采用40纳米CMOS工艺实现,支持16位输入、权重和激活值,以满足失语症语音转换任务的精度要求。测试结果显示,在0.6伏的供电电压下,其能效达到了30.69 TOPS/W,验证了所提出的BCAM-DIMC混合架构的有效性及其在高精度、低功耗边缘AI音频应用中的适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号