开云-TetraMem将高性能的存内运算与Andes晶心RISC

[导读]人工智能在愈来愈多的硬件利用中快速成长,鞭策了对传统冯·诺依曼架构没法知足专业计较加快的史无前例的需求。在浩繁竞争性替换方案中,最有前景的一种方案是摹拟存内运算(In-Memory Computing, IMC)。释放多级阻变存储器(RRAM)的潜力,让这一许诺在今天比以往加倍真实,硅谷新创公司TetraMem引领这一成长,正在解决阻碍这一解决方案成长的底子挑战。该公司的怪异IMC采取多级RRAM手艺,供给更高效、低延迟的AI处置,知足AR/VR、移动装备、物联网等现代利用不竭增加的需求。 人工智能在愈来愈多的硬件利用中快速成长,鞭策了对传统冯·诺依曼架构没法知足专业计较加快的史无前例的需求。在浩繁竞争性替换方案中,最有前景的一种方案是摹拟存内运算(In-Memory Computing, IMC)。释放多级阻变存储器(RRAM)的潜力,让这一许诺在今天比以往加倍真实,硅谷新创公司TetraMem引领这一成长,正在解决阻碍这一解决方案成长的底子挑战。该公司的怪异IMC采取多级RRAM手艺,供给更高效、低延迟的AI处置,知足AR/VR、移动装备、物联网等现代利用不竭增加的需求。 半导体财产布景 曩昔几十年来,半导体财产获得了显著前进,特殊是在知足人工智能和机械进修不竭增加的需求方面。芯片设计的立异冲破了机能和效力的边界,但是,一些固有的延续挑战依然存在,例如冯·诺依曼瓶颈和存储墙(memory wall),限制了CPU和内存之间的数据传输速度,和与进步前辈节点手艺相干的不竭进级的功耗和热治理问题。 IMC代表了一种冲破性的计较方式改变,改变了数据处置的体例。传统的运算架构将存储和处置单位分隔,发生年夜量的数据传输承担,特殊是对以数据为中间的人工智能利用法式。另外一方面,IMC将存储器和处置器整合在统一实体中,经由过程交叉阵列架构实现更快、更高效的数据运算,进一步消弭矩阵运算中的年夜量中心数据。这类方式对年夜范围数据处置和及时阐发相当主要的人工智能和机械进修利用特殊有益。 为IMC选择适合的存储装备相当主要,SRAM和DRAM等传统存储手艺因为其装备和单位限制和其易掉性特征,并未针对存储中操作进行优化。RRAM凭仗其高密度、多级功能和非挥发性和出色的连结能力,无需刷新便可降服这些挑战。RRAM的工作道理是经由过程节制电压或电流来调剂存储单位的电阻转变,模拟人类年夜脑中突触的行动,这一功能使RRAM特殊合适摹拟IMC。 TetraMem专注在多级RRAM(阻变存储器)手艺,与传统的单级单位存储手艺比拟,该手艺具有多种优势。RRAM可以或许在每一个单位中存储多个比特,并在原地履行高效的矩阵乘法运算,这使其成为IMC的抱负选择。该手艺解决了传统数字运算的很多限制,例如带宽限制和能效不足等问题。 RRAM可编程电路装备会记住其最后的不变电阻值,此电阻值可以经由过程施加电压或电流来调理,施加在装备上的电压和电流的巨细和标的目的转变会改变其导电性,从而改变其电阻值。近似人类神经元的功能,这类机制有多种利用:存储、摹拟神经元,和TetraMem的存内运算IMC。RRAM的操作由离子驱动,经由过程节制导电丝的尺寸、离子浓度和高度,可以切确实现分歧的单位电阻多级转变。 数据在与存储不异的实体中进行处置,中心数据移动和存储起码,从而实现低功耗。经由过程具有装备级颗粒内核的交叉阵列架构进行年夜范围并交运算可发生高吞吐量。经由过程物理定律(欧姆定律和基尔霍夫电流定律)进交运算,确保低延迟。TetraMem的非易掉性存内运算单位比拟传统的数字冯·诺依曼架构可年夜幅下降功耗。 显著成绩 TetraMem在RRAM手艺的成长中获得了主要的里程碑。值得留意的是,该公司展现了一个史无前例的装备,每一个单位具有11位,在单个装备中实现了2000多个信息品级,这一精度程度代表了存内运算IMC手艺的重年夜冲破。 近期在Nature《1》和Science《2》等闻名期刊上颁发的文章强调了TetraMem的立异方式。提高单位噪声机能和加强多级信息IMC运算手艺是其主要的进展范畴。例如,TetraMem开辟了专有算法来按捺随电机报噪声(telegraph noise),从而使RRAM单位具有更优胜的记忆连结和经久性特点。 存内运算(IMC)的运作 TetraMem的IMC手艺采取交叉架构,此中阵列中的每一个交点对应在一个可编程的RRAM存储单位。这类设置装备摆设答应高度并行操作,这对神经收集计较相当主要。在向量矩阵乘法(Vector-Matrix Multiplication, VMM)操作时代,输入旌旗灯号会利用在交叉开关阵列,计较成果被搜集到位线(bit lines)上。这类方式年夜年夜削减了在存储和处置单位之间传输数据的需求,从而提高了计较效力。 现实利用 TetraMem经由过程贸易晶圆厂制造的首款评估SoC,MX100芯片(见下图)展现了其IMC手艺的现实利用。该芯片已在多个芯片内演示中展现了其能力,展现了其在实际场景中的功能。一个值得留意的演示是瞳孔中间收集(Pupil Center Net, PCN),展现了该芯片在AR/VR中的利用,用在主动驾驶车辆中的脸部追踪和身份验证监控。 为了增进其手艺的采取,TetraMem供给了周全的软件开辟套件(Software Development Kit, SDK)。此SDK使开辟者可以或许无缝地界说边沿AI模子。另外,与Andes晶心科技的NX27V RISC-V CPU和其向量扩大功能的整合简化了操作,让客户更轻松地将TetraMem的解决方案摆设到其产物中。 TetraMem的IMC设计很是合适矩阵乘法,但在向量或标量运算等其他功能上的效力不高。这些运算在神经收集中常常利用,为了撑持这些功能,Andes晶心科技供给了CPU加向量引擎的矫捷性,并具有现有的SoC参考设计和成熟的编译器和函数库,以加速我们的市场推行时候。 TetraMem与Andes晶心科技合作,将其IMC手艺与Andes晶心的RISC-V CPU和向量扩大集成在一路。这一合作晋升了整系统统机能,为各类AI使命供给了壮大的平台。连系的解决方案充实操纵了两家公司优势,供给了一个矫捷且高效的架构。 瞻望将来,TetraMem预备推出基在22nm手艺的MX200芯片,这款芯片许诺将供给更年夜的机能和效力。该芯片专为边沿推理利用而设计,供给低功耗、低延迟的AI处置。MX200估计将开辟新的市场机遇,特殊是在能源效力相当主要的电池供电的人工智能装备中。 TetraMem在IMC方面的进展代表了AI硬件范畴的一次重年夜奔腾。经由过程解决传统计较的根基挑战,TetraMem正在为更高效和可扩大的AI解决方案摊平道路。跟着公司不竭立异并与Andes晶心科技等行业带领者合作,AI处置的将来看起来布满但愿。TetraMem的解决方案不但晋升了机能,还下降了采取尖端AI手艺的门坎。

欲知详情,请下载word文档 下载文档

北京2024年8月27日 /美通社/ -- 在8月23日举行的2024年长三角生态绿色一体化成长示范区结合招商会上,软通动力信息手艺(团体)股分有限公司(以下简称 软通动力 )与长三角投资(上海)有限...

要害字: BSP 信息手艺

上海2024年8月26日 /美通社/ -- 本日,高端全合成润滑油品牌美孚1号联袂品牌体验官周冠宇,开启全新路程,助力泛博车主经由过程驾驶去摸索更广漠的世界。在全新发布的品牌视频中,周冠宇和分歧布景的消费者表达了对驾驶的酷爱...

要害字: BSP 汽车制造

上一篇:开云-第五届亚洲科技变革峰会隆重宣布:布莱恩•考克斯教授将担任演讲嘉宾 下一篇:开云-玩美移动亮相2024厦门眼镜展,虚拟试戴技术掀起行业新浪潮