|
|
www.design-reuse-china.com |
TetraMem将高性能的存内运算与Andes晶心RISC-V向量处理器整合
简介 人工智能在越来越多的硬件应用中快速发展,推动了对传统冯·诺依曼架构无法满足专业计算加速的前所未有的需求。在众多竞争性替代方案中,最有前景的一种方案是模拟存内运算(In-Memory Computing, IMC)。释放多级阻变存储器(RRAM)的潜力,让这一承诺在今天比以往更加真实,硅谷新创公司TetraMem引领这一发展,正在解决阻碍这一解决方案发展的根本挑战。该公司的独特IMC采用多级RRAM技术,提供更高效、低延迟的AI处理,满足AR/VR、移动设备、物联网等现代应用不断增长的需求。
mp.weixin.qq.com, Dec. 05, 2024 –
半导体产业背景
过去几十年来,半导体产业取得了显著进步,特别是在满足人工智能和机器学习不断增长的需求方面。芯片设计的创新突破了性能和效率的界限,然而,一些固有的持续挑战仍然存在,例如冯·诺依曼瓶颈和存储墙(memory wall),限制了CPU和内存之间的数据传输速率,以及与先进节点技术相关的不断升级的功耗和热管理问题。
IMC代表了一种突破性的计算方法转变,改变了数据处理的方式。传统的运算架构将存储和处理单元分开,产生大量的数据传输负担,特别是对于以数据为中心的人工智能应用程序。另一方面,IMC将存储器和处理器整合在同一实体中,通过交叉阵列架构实现更快、更高效的数据运算,进一步消除矩阵运算中的大量中间数据。这种方法对于大规模数据处理和实时分析至关重要的人工智能和机器学习应用特别有益。
为IMC选择合适的存储设备至关重要,SRAM和DRAM等传统存储技术由于其设备和单元限制及其易失性特性,并未针对存储中操作进行优化。RRAM凭借其高密度、多级功能和非挥发性以及卓越的保持能力,无需刷新即可克服这些挑战。RRAM的工作原理是通过控制电压或电流来调整存储单元的电阻变化,模仿人类大脑中突触的行为,这一功能使RRAM特别适合模拟IMC。
TetraMem专注于多级RRAM(阻变存储器)技术,与传统的单级单元存储技术相比,该技术具有多种优势。RRAM能够在每个单元中存储多个比特,并在原地执行高效的矩阵乘法运算,这使其成为IMC的理想选择。该技术解决了传统数字运算的许多限制,例如带宽限制和能效不足等问题。
RRAM可编程电路设备会记住其最后的稳定电阻值,此电阻值可以通过施加电压或电流来调节,施加在设备上的电压和电流的大小和方向变化会改变其导电性,从而改变其电阻值。类似人类神经元的功能,这种机制有多种应用:存储、模拟神经元,以及TetraMem的存内运算IMC。RRAM的操作由离子驱动,通过控制导电丝的尺寸、离子浓度和高度,可以精确实现不同的单元电阻多级变化。
数据在与存储相同的实体中进行处理,中间数据移动和存储最少,从而实现低功耗。通过具有设备级颗粒内核的交叉阵列架构进行大规模并行运算可产生高吞吐量。通过物理定律(欧姆定律和基尔霍夫电流定律)进行运算,确保低延迟。TetraMem的非易失性存内运算单元相比传统的数字冯·诺依曼架构可大幅降低功耗。
点击阅读更多