编辑推荐:
组合优化问题在传统计算机上难以实现高效求解。尽管量子与模拟硬件已被探索用于应对此类挑战,但其常面临高功耗、高复杂度或可扩展性受限等问题。本研究提出了一种创新方法,利用商用垂直NAND(V-NAND)闪存——一种普遍存在于日常设备中的存储技术——作为求解此类问题
组合优化问题在传统计算机上难以实现高效求解。尽管量子与模拟硬件已被探索用于应对此类挑战,但其常面临高功耗、高复杂度或可扩展性受限等问题。本研究提出了一种创新方法,利用商用垂直NAND(V-NAND)闪存——一种普遍存在于日常设备中的存储技术——作为求解此类问题的物理基础。通过创造性调整存储单元的工作机制,研究人员实现了一种霍普菲尔德神经网络(Hopfield Neural Network, HNN),该网络能够模拟模拟退火(Simulated Annealing, SA)这一寻找近似最优解的经典方法。该系统在求解最大割问题(Max-Cut)时展现出高精度,同时其能耗显著低于基于图形处理器(Graphics Processing Unit, GPU)或现场可编程门阵列(Field-Programmable Gate Array, FPGA)的传统解决方案。与新兴的非易失性存储技术不同,该研究设计无需对现有V-NAND闪存结构进行任何改动,使其在大规模和高能效应用中极具实用价值。这项工作证明,V-NAND闪存不仅可用于数据存储,还可作为解决复杂优化问题的强有力工具。
《Advanced Intelligent Systems》发表的这项研究针对传统计算架构在处理非确定性多项式时间(NP)难问题上效率低下的问题,探索了利用成熟半导体工艺解决复杂组合优化问题(COPs)的新路径。当前,量子退火器虽受关注,但受限于极低温运行带来的高成本与高功耗,以及量子比特相干性导致的可扩展性问题;而基于忆阻器(Memristor)等新兴器件的伊辛机则面临制造工艺成熟度不足、器件变异性大及与现有半导体产线兼容性差的挑战。鉴于此,研究人员提出利用已大规模商业化、具有高可靠性与高集成度的垂直NAND(V-NAND)闪存来实现伊辛求解器。研究通过将组合优化问题映射至伊辛模型,利用V-NAND闪存的本征物理特性实现了霍普菲尔德神经网络(HNN)与模拟退火算法的硬件融合,实验验证表明该方案在保持高求解精度的同时,实现了显著的能效提升,为后摩尔时代高能效计算提供了切实可行的技术路线。
为实现上述目标,研究人员采用了几项关键技术方法。实验选用SK海力士(SK hynix)提供的商用三层单元(TLC) V-NAND晶圆,其堆叠层数超过100层。研究人员利用Keysight B1500A半导体参数分析仪配合探针台对存储单元进行电学表征,通过精确控制位线(BL)、源线(SL)及字线(WL)电压,调节单元阈值电压(Vth)以表征问题权重。研究核心在于利用增量阶跃脉冲编程(ISPP)技术将最大割问题的邻接矩阵映射为存储阵列的电导矩阵,并通过调控读取电压(VRead)来利用器件固有的电流噪声特性实现模拟退火机制。此外,研究人员构建了包含真实器件噪声模型与电导分布的Python仿真框架,以评估不同温度与电压条件下的求解成功率及可扩展性。
2 结果
2.1 HNNs和最大割问题
研究人员首先介绍了最大割问题,即将图G的顶点集划分为两个子集以最大化连接两子集的边权和。该问题是NP难问题,随着节点数增加,解空间呈指数级增长。研究采用霍普菲尔德神经网络作为求解框架,通过定义能量函数E,将最大化割边数转化为最小化网络能量。为解决HNN易陷入局部最优的问题,研究引入了模拟退火机制,通过概率性接受能量升高的状态转移,增强全局寻优能力。
2.2 用于HNN的V-NAND闪存
研究人员展示了V-NAND阵列架构及其作为存内计算平台的实现方式。权重矩阵被映射为存储单元的电导矩阵,其中代表连接的边被编程为高电导状态(GHigh),未连接的边则为低电导状态(GLow)。为解决正负偏置电压导致电流不对称的问题,研究优化了偏置方案:将源线电压(VSL)设为0.2 V,位线正电压(VBL+)设为0.6 V,负电压(VBL-)设为0 V。这种配置在保证正负电流(|IBL|)对称的同时,避免了负电压产生电路带来的复杂度与功耗开销,确保了HNN运算的准确性。
2.3 V-NAND闪存中模拟退火的实现
研究分析了V-NAND单元的漏极电流(IBL)波动特性。实验发现,在较低读取电压(VRead)下,归一化电流波动(ΔIBL/IBL)较大,导致源线总电流(ISL)的符号频繁反转,从而引发随机的节点状态翻转,这种行为等效于模拟退火中的随机搜索,有助于跳出局部最优。随着VRead升高,相对噪声减小,ISL符号趋于稳定,系统转为确定性收敛。因此,通过动态调节VRead,即可在硬件层面实现从随机探索到确定性收敛的退火过程控制。
2.4 基于V-NAND闪存的伊辛求解器
研究人员演示了求解器的完整工作流程。通过ISPP技术精确调控电导,成功在8节点最大割问题上实现了100%的最优解成功率。实验表明,温度升高会降低相对噪声,使系统更倾向于确定性收敛。仿真结果显示,相比固定电压,采用递增VRead的策略显著提高了12节点问题的求解成功率(达71.2%)。进一步的大规模仿真表明,该求解器在不同节点数和图密度下均能保持平均割值超过最优值的99%,验证了方案的鲁棒性与可扩展性。
2.5 V-NAND闪存伊辛机的基准测试
研究人员将所提方案与多种伊辛机进行了基准对比。在处理100节点、50%密度的最大割问题时,虽然V-NAND方案的解算时间(2.3秒)慢于忆阻器和GPU方案,但其能耗极低,仅为GPU方案的0.23%和FPGA方案的0.097%。考虑到V-NAND无需修改现有产线结构且集成密度极高,该工作在能效比和实际落地可行性上具有显著优势。
3 讨论
研究总结指出,V-NAND闪存作为成熟的商用技术,可有效用于构建高能效伊辛求解器。虽然其工作速度受限于非易失性存储的物理特性及顺序读取机制,但通过优化退火调度算法、利用多层堆叠结构进行并行试错计算以及优化外围读出电路,有望大幅降低解算时间。这项工作证明了利用现有存储基础设施执行复杂计算任务的巨大潜力,为嵌入式与边缘计算场景下的高能效优化问题求解提供了新范式。