当前位置: 首页 -> 科技

绕过存储墙是AI时代的刚需内存中的计算更适合热数据的处理

发布时间:2022-08-27 23:15   来源:中国经济网   作者:如思   阅读量:10239   

最近几天,集存储和计算于一体的芯片设计公司辛平科技宣布,已于数月前完成数千万美元的A轮融资中国工程院院士吴在2022中国计算大会上表示,对于自动驾驶等场景中产生的热数据,存储和计算的分离会使数据在存储和计算之间来回输入,内存中的计算更适合热数据的处理

在冯诺依曼架构中,计算和存储功能分别由CPU和内存完成可是,在遵循摩尔定律逐年提升性能的过程中,处理器却留下了对制造工艺不敏感的内存,它们之间的性能差距形成了内存墙相比之下,存储和计算的一体化可以避免数据来回移动带来的功耗和时间延迟伴随着AI技术释放数据洪流和计算场景需求的大趋势,集成内存和计算芯片越来越受到业界和资本市场的关注

绕过存储墙是AI时代的刚需

早在1969年,斯坦福研究所的William Kautz就提出了存款与计算一体化的概念Kautz提出在芯片的存储单元中加入逻辑电路,将多个单元连接起来形成阵列,从而创造出更灵活,更快速,耗能更少的数字电路,以更好地满足当时LSI的需求可是,早期关于存储与计算整合的研究并未取得重大突破以冯诺依曼架构为蓝本,按照摩尔定律提升芯片性能,逐渐成为业界共识

但最近几年来,存储与计算的融合重新回到了业界的视野,并被视为一个重要的技术方向。

智存科技创始人兼CEO王绍迪向《中国电子报》指出,过去几十年是摩尔定律快速发展的时期,新架构的开发需要高投入所以摩尔定律能走下去的时候,工业界对存储和计算一体化等架构创新的需求并不高可是近十年来,对计算能力的需求越来越大,使得存储墙的问题越来越突出

2010年进入后摩尔时代后,行业对计算能力日益增长的需求与几乎达到极限的摩尔定律之间日益突出的矛盾,成为人工智能发展的巨大瓶颈因此,能够解决存储墙问题的存储计算一体化技术越来越受到重视,最近几年来在行业内发展非常迅速王绍迪说

尤其是2016年,人工智能Alpha Go击败围棋世界冠军李世石之后,以深度学习为代表的统计学习理论和方法推动了整个人工智能行业的发展OpenAI的分析显示,自2012年以来,人工智能训练任务中使用的计算能力每3.5个月翻一番计算需求的快速发展对计算芯片的效率提出了更高的要求和新的挑战

九睿芯董事长兼CEO刘洪洁告诉《中国电子报》记者,在冯诺依曼架构中,处理器从处理单元之外的内存中提取数据,处理时间往往是运算时间的数百或数千倍。

深度学习加速的最大挑战是数据在计算单元和存储单元之间的频繁移动市场迫切需要能达到超高能效,并能快速迭代的智能计算芯片,以满足瞬息万变的市场变化我们新的类脑计算的内存计算架构是AI发展面临的计算瓶颈,核心技术是解决AI低计算力能比的核心刚性需求计算力叠加造成的能量消耗,存储和计算一体化是一个很好的解决方案刘洪洁说

衍生出不同的架构和技术路线。

面对智能时代对计算能力的需求和计算服务业态的变革,英特尔,三星等IDM厂商和尖端计算芯片厂商都在探索集成内存和计算芯片,并衍生出了不同的架构和技术路线。

刘洪洁表示,目前国际上存算一体化还处于蓬勃发展阶段,没有一个技术框架占据绝对主导地位2017年,第一批内存计算公司崛起目前,内存计算中的一些技术已经落地,这就需要业界加大投入,开发高质量的产品

内存计算本身有一个类似摩尔定律的发展过程,包括代工厂对内存计算特殊工艺的改进其次,先进材料目前可以量产的内存计算存储器中,Flash和SRAM更适合内存计算,新的存储器件还需要做更多的研究另外,内存计算从算法到供应链生态都需要产学研结合,相互融合促进发展刘洪洁说

作为DRAM市场份额多年的冠军,三星在2021年推出了结合DRAM的高带宽内存中内存处理方案,将AI计算能力引入内存通过在每个存储子单元中放置DRAM优化的AI引擎,将处理能力直接引入数据的存储位置,从而实现并行处理,最大限度地减少数据移动与三星之前的高带宽内存方案相比,新架构可以提供两倍以上的系统性能,并将能耗降低70%以上

英特尔的神经拟态计算芯片Loihi也采用了存储计算的架构,更容易扩展Loihi芯片的裸芯片包含128个小核,每个小核模拟1024个神经元的计算结构,每个神经元有1000个突触连接,这意味着可以连接768个芯片来构建一个接近1亿个神经元的系统

国内以集成内存和存储芯片为主的企业,大多采用SRAM和Flash路线。

九睿芯基于模拟特征提取+模数混合电荷畴SRAM架构实现了内存计算,2021年回归第一款传感与内存计算集成芯片ADA100MoSi第一代芯片基于SRAM,第二代芯片基于PRAM苹果核心技术的两款产品也是基于28纳米SRAM

智存科技主要采用嵌入式Flash技术,2020年发布了第一代内存—计算集成芯片WTM10012022年,实现了存储计算一体化SoC芯片WTM2101的量产和应用

最近几年来,伴随着新兴非易失性存储器的发展,国内出现了计算能力很强的公司,同时新的玩家也在不断涌入但距离大规模应用还有10年左右的时间,从工艺,材料,算法,工具链到生态,都需要产业界和学术界的持续投入和共同推动王绍迪说

一体机芯片还没有量产。

虽然内存条集成芯片的技术前景和应用场景逐渐清晰,但目前内存条集成芯片还没有大规模量产和部署,产品性能和产业生态有待进一步提升和完善。

在性能方面,内存计算集成芯片还有很大的提升空间刘洪洁说,内存计算集成芯片仍然需要在三个方面提高性能第一,流程迭代伴随着自动驾驶等应用场景对计算能力的需求越来越大,后摩尔时代的内存—内存集成芯片需要跟上工艺迭代的红利,进一步提高能效比和表面效率比二是提高准确率更多如飞行器姿态估计等对运算精度要求较高的应用,对存储和计算一体化架构的精度提出了一定的挑战第三,算法适配在更广阔的消费领域,AI应用呈现碎片化趋势,带来算法模型的多样化为满足应用落地需求,存储与计算的融合仍需进一步拓展计算架构的适应性

以九天睿芯为例,从工艺,架构等方面继续深化模数混合存储集成芯片的开发和部署根据消息显示,九天睿芯已经规划了从55nm到6nm的产品路线55nm产品主要面向TinyML等低功耗唤醒场景,22nm产品面向AR/VR SLAM协同处理,移动机器人,ADAS等场景6纳米产品主要用于联邦学习,元宇宙和空间人工智能等应用

此外,集成存储和计算芯片需要加强上下游协作,以加快产业化进程王绍迪指出,集成存储器和计算芯片的大规模量产和应用,涉及上下游产业链的合作包括行业标准化,以便更好的实现产品的落地,生态建立,拓展更多应用场景

据王绍迪介绍,下一步,智存科技将从产品和生态层面进行升级在初步构建存储与计算融合发展的小生态的基础上,伴随着芯片计算能力,计算能力,计算速度的不断提升,将打造更丰富,更便捷的开发工具链,稳定架构,打磨标准化产品,拓宽应用场景,逐步从端到端向边缘测量或云端发展

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

推荐阅读