清华团队研制出全球首款多阵列忆阻器存算一体系统

  • 时间:
  • 浏览:184
  • 来源:世界杯买球盘口网址app

金凤

想让手机听得懂你的口音、能处置惩罚堪比“阿尔法狗”人机大战的数据量,需要借助强大的芯片算力。

传统的芯片盘算处置惩罚技术,会划分由存储芯片和CPU举行数据存储和盘算。数据往返“搬运”处置惩罚,耗时长,功耗大,随时有“交通堵塞”的风险。如果存储和盘算能力可以“合体”到一张芯片,信息处置惩罚能力将事半功倍。

2月26日,记者从清华大学获悉,该校微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队,与互助者配合研发出一款基于多个忆阻器阵列的存算一体系统,在处置惩罚卷积神经网络时的能效,比图形处置惩罚器芯片高两个数量级,大幅提升盘算设备的算力,且比传统芯片的功耗降低100倍,相关结果克日揭晓于《自然》。

如用基于其设计的芯片生产手机,芯片的算力将使手机险些掌握“读心术”,听懂你的声音,知道你喜欢哪些照片,和你越来越亲近。

基于忆阻器芯片的存算一体系统。受访者供图

“存算一体”忆阻器打破算力瓶颈

如果我们把居家生活比作存储,把上班比作盘算,天天上班路上会消耗时间、能量,遇到早晚岑岭,通勤时间会更长。这个场景和信息处置惩罚有许多相似之处,如果存储和盘算合二为一,就相当于居家办公一样,能淘汰通勤时间也能节约体力消耗,可以用更小的功耗实现更大的算力,淘汰数据传输的延迟。

随着人工智能应用对盘算和存储需求的不停提升,集成电路芯片技术面临诸多新挑战。一方面,摩尔定律“渐行渐远”,通过集成电路工艺微缩的方式获得算力提升越来越难;另一方面,盘算与存储在差别电路单元中完成,会造成大量数据搬运的功耗,增加延迟。

所以,如何用盘算存储一体化突破AI算力瓶颈,成为近年来海内外的科研热点。寻找合适的硬件,是提升算力的基础之一。

“基于忆阻器的新型存算一体架构,可以打破算力瓶颈,满足人工智能等庞大任务对盘算硬件的高需求。”该团队的研究成员之一、清华大学未来芯片技术高精尖创新中心教授吴华强告诉科技日报记者。

忆阻器,是继电阻、电容、电感之后的第四种电路基本元件,这种组件的电阻会随着通过的电流量而改变。而且纵然电流中断,它的电阻仍然会停留在之前的值。用于盘算领域,这意味着,纵然断电了,数据还可以保留。再加上忆阻器的尺寸小,可以大规模的集成,功耗又低,又适合做模拟盘算,所以可以用来实验做存算一体、低能耗类脑盘算。

不外,想让忆阻器阵列实现芯片的功效,还需解决器件、系统、算法等方面的瓶颈。

“忆阻器固有的非理想特性,例如器件间颠簸、器件电导卡滞、电导状态漂移等,会导致盘算准确率降低;此外,在架构方面,忆阻器阵列实现卷积功效需要以串行滑动的方式一连采样、盘算多个输入块,无法匹配全毗连结构的盘算效率。”吴华强说。

研究团队成员高滨、姚鹏、吴华强、张清天、唐建石(从左到右)。受访者供图

DIY质料和器件,曾一度瓦解

十年磨一剑,波涛起伏。如何优化质料和器件结构,制备出高性能的忆阻器阵列,来路并不平坦。吴华强用“一度瓦解”来形容。

“质料和工艺集成是最大的难题,因为没有代工厂,只能在实验室探索,2012-2013年我们研究用忆阻器做存储时,由于质料器件优化及集成工艺还不成熟,导致器件的一致性欠好,良率不高,很瓦解。2014年后,我们与中科院微电子所、北京大学等单元互助,制备工艺逐步提升。”

忆阻器性能优劣,很大水平上取决于质料的选择与组合。吴华强说,在选择质料时,团队会思量所选质料未来是否适合工业化,质料的物理参数是否易调控。

本着这些原则,团队在常用于忆阻器的二氧化铪质料上,添加了一层界面调控层。这个界面调控层是一种金属氧化层质料,它的氧身分占比,可以凭据加工工艺的差别来准确控制。通过这种方法,可以比力有效的控制二氧化铪忆阻层中的微观变化,以及内部的温度和电场。

“界面调控层就像一层口罩,不仅能阻遏病毒、灰尘,还能保暖、保湿。界面调控层类似 ‘口罩’的设计,使我们的器件具有很是优异的电学特性,而且可以在工厂里大规模生产。”吴华强说。

多个忆阻器阵列芯片协同事情示意图。受访者供图

会率先应用在人工智能领域

其实,早在2017年5月,该团队就曾在《自然通讯》揭晓结果,首次实现了基于1024个氧化物忆阻器阵列的类脑盘算,将氧化物忆阻器的集陋习模提高了一个数量级。这使芯片越发高效地完成人脸识别盘算任务,将能耗降低到原来的千分之一以下。

此次研究,该团队则集成了8个包罗2048个忆阻器的阵列,以提高并行盘算的效率。

“这次研究的意义不仅是忆阻器的阵列翻番,多阵列带来的阵列间的信号通报,系统精度控制,都是面临的新挑战。”吴华强先容,为解决器件非理想特性造成的系统识别准确率下降问题,他们提出一种新型的混淆训练算法,仅需用较少的图像样本训练神经网络,并通过微调最后一层网络的部门权重,使存算一体架构在手写数字集上的识别准确率到达96.19%,与软件的识别准确率相当。

“用软件在传统盘算架构上举行盘算,接纳的是存储、盘算分散的架构,准确率高,能耗大,速度慢;但现在在存算一体芯片上,也可以实现和软件识别同样的效果,意味着存算一体芯片可以提高速度、降低能耗,可是准确率依然很高。”

此外,团队提出了空间并行的机制,将相同卷积核编程到多组忆阻器阵列中,各组忆阻器阵列可并行处置惩罚差别的卷积输入块,提高并行度来加速卷积盘算。

在此基础上,团队搭建了全硬件组成的完整存算一体系统,在系统里集成了多个忆阻器阵列,并在该系统上高效运行了卷积神经网络算法,乐成验证了图像识别功效,证明晰存算一体架构全硬件实现的可行性。

吴华强畅想,忆阻器的“存算一体”潜力,会率先应用在人工智能领域,如果用基于忆阻器涉及的芯片生产手机,那么芯片的算力险些可以让手机掌握“读心术”,“它能听懂你的声音,知道你喜欢哪些照片,会跟你越来越亲近、越来越智能。”

泉源:科技日报

编辑:李俊霞

审核:王小龙

终审:冷文生