比iPad还大的芯片黑马!它会是AI芯片生长的未来偏向吗?

  • 时间:
  • 浏览:166
  • 来源:世界杯买球盘口网址app

从第一个现代集成电路降生距今已有62年。这么多年以来,人们获得更高性能产物的方法一直没有改变,那就是使用更多的晶体管举行更高密度的盘算。令人欣慰的是,半导体制造技术的生长支撑了集成电路对晶体管数量险些无尽的需求,并降生了摩尔定律这样业界统一的共识,不停驱动盘算能力一步步增强。可是,在AI盘算进一步生长后,人们发现AI盘算对算力的渴求更胜以往。

在半导体制造技术进步速度逐渐放缓的今天,如何进一步获得更高算力的芯片就成为AI行业配合的问题。门路开始分叉,押大还是押小?一家名为Cerebras的公司带给我们一个新的可能——那就是越大越好,一个12英寸的晶圆上只容纳一颗完整功效的AI盘算芯片。这就是Cerebras Wafer Scale Engine (WSE),今天本文就和你一起来相识它的秘密。

AI盘算中的深度学习盘算已经是现在最重要的盘算负载之一。在已往,那些只有人类大脑才气完成的任务,如今有许多都可以使用盘算机以人类或者凌驾人类的效率来执行。凭据OpenAI的陈诉显示,自2012年以来,AI盘算中所使用的的盘算量出现出指数增长的态势,盘算需求平均每三四个月就可以翻一番。从2012年到2018年,全球的整个盘算量指标增长了30万倍。

▲进入2012年后,AI盘算的盘算需求平均每三四个月翻一番

AI盘算需求的暴增,和我们熟悉的摩尔定律所驱动的半导体工业速度之间发生了一个显而易见的矛盾。如今的摩尔定律已经从之前的18个月放缓到每2年到3年才使得半导体单元面积的晶体管数量翻倍,而且在可预见的未来,这样的放缓速度还将继续下去。因此,半导体厂商在面临市场的性能需求时,往往会选择通过其他手段来增加芯片有效事情面积,提高性能。

现在业内对此的态度普遍是倾向两种看法,一种是选择小芯片团结提高性能,也就是Chiplet方案,这种方案比力容易在民用和商用市场之间取得平衡,不外如何毗连诸多小芯片并取得更好的性能,业内依旧有许多讨论,固然这也并非本期的话题,暂且不表。

另一种看规则是继续做大芯片,这对一部门需要大规模并行盘算的用户来说是很是友好的,好比超级盘算机。原因也很简朴,芯片面积越大,相对应所涉及的外围质料就越少。举例来说,一个传统尺寸的GPU芯片如果可以提供1TFLOPS算力的话,那么扩大它的面积到现有芯片的4倍,其算力在合理的情况下还可以继续提升2~3倍。甚至芯片面积进一步扩大,直接将外围的DRAM、SRAM等集成在芯片上,由此带来的延迟降低、带宽增加等因素,性能还将继续提升。同时,节约了多个小芯片系统所需要的PCB、供电、封装等差别组件的成本,综合思量,甚至可能带来更低的单元性能价钱。

不外,芯片尺寸并不仅仅由厂商自行决议,它还受到许多其他因素的限制。好比之前英伟达、IBM和英特尔就很难推出尺寸凌驾800mm²的芯片,这是因为纵然是现在,i193型号的光刻步进器最大可支持刻录的芯片尺寸为短边26mm,长边33mm,面积最大可接受858mm²。因此,继续扩大芯片尺寸也需要思量设备允许等问题。

▲ASML的先容显示,在经由多次缩放处置惩罚后,现在能够生产的最大的芯片尺寸约莫是858mm²。

因此,以整体的方式(非片上拼接)制造超出通例尺寸的芯片需要更多新工具的支持。不外依旧存在一些替代方法可以告竣制造更大芯片的目的,这就是晶圆级集成(Wafer-scale integration,简称为WSI)的单芯片制造方法,接纳这种方法制造的芯片尺寸和晶圆自己最大直径十分靠近,在12英寸晶圆上能出现“巨无霸”芯片的效果。

▲Trilogy Systems的WSI芯片样品

缺陷控制:初探晶圆级集成WSI

WSI能制造如此庞大的芯片,看起来很是优美。但实际上,WSI虽然能够大幅度提升芯片的尺度从而提升性能,相应的也面临着庞大的难题。纵观历史,WSI在已往的50年时间中被多个厂商实践过,但乐成者寥寥。失败的主要原因除了资金、市场外,技术上问题也颇多,包罗超大尺度的芯片的设计、制造、封装、散热等,另有致命的晶圆缺陷。所谓晶圆缺陷,是指高纯度硅晶圆上那些存在杂质或晶体生成异常的区域。

作为一个晶圆尺寸级此外芯片,对电路正确的要求很是高,理论上任何电路错误都可能导致整个芯片运作失败。可是由于人类现在工程技术制约和物理纪律限制,任何晶圆都不行能100%完美,总会有缺陷的存在。因此,WSI如何控制晶圆缺陷(甚至包罗制造缺陷)就在很大水平上制约着它的成败。

晶圆缺陷并不是一个新话题,它在普通的芯片制造中也存在,并引发了良率和成本等问题。为了更好地明白WSI技术,本文先对普通芯片制造制造历程和缺陷处置惩罚方式举行简朴形貌。

一般来说,普通芯片设计时,工程师在芯片设计阶段就能确定芯片所使用的工艺代次,然后和芯片制造厂商配合确定所设计芯片的面积尺寸。在获得这些数据后,使用晶圆的面积除以目的芯片的面积,就获得了一张晶圆可以获得几多芯片的参考数据。凭据这个参考数据,芯片制造厂会在晶圆上凭据芯片的尺寸给出最佳的结构方式,完成之后,晶圆看起来就像划上了纪律的方格。然后,芯片制造厂会凭据结构的方格,使用同样方格结构的掩模,使用光刻工艺举行不停地重复刻制、冲洗、继续重复、冲洗等,直到形成了所需要的一个个乐成的芯片图案。接下来,厂商会凭据之前设定的方格边线,切割并离开一个个芯片,再通过检测手段确定不能事情的芯片。

▲经由光刻芯片后的晶元,可见大量相同的芯片排列。

对这些已经切割的完成、但又不能正常事情的芯片而言,迎接它们的通常的做法是直接报废,或者还可以屏蔽一部门功效后再廉价销售。这种情况下,使用被扬弃报废的芯片数量除以所有生产出的芯片数量,就获得了某种意义上的良率数据(差别情况下良率盘算需求可能差别,好比是否纳入屏蔽芯片等)。可以看到,传统的芯片制造依靠切割芯片并扬弃一部门,来实现对晶圆缺陷和制造缺陷的控制。

▲晶圆缺陷是固有的,传统的处置惩罚方法是将其扬弃。红色点为晶元缺陷,黄色为需要扬弃的芯片。可见芯片面积越小,扬弃的芯片数量越少。

对WSI来说,扬弃、切割等方法都无法使用,究竟作为一整块芯片,难以切割部门区域。不外转换思维来看,所谓的扬弃,只是坏块部门在芯片意义上不存在而已,等同于存在但不事情。对WSI来说,在芯片设计上也接纳分区设计的方案,区块之间相对独立,且存在可以单独关闭或者开启某个区域的控制电路等,就可以在一定水平上制止“一个老鼠屎坏一锅汤”的问题。

实际上,WSI技术解决晶圆缺陷的方法,正是通过设计阶段提前结构,在发现缺陷块后,通过改变芯片自己的事情逻辑来避开损坏的区域。详细实现上,设计人员会使用子电路的网格图案和适当的处置惩罚逻辑,在受损电路周围“重新布线”,因此纵然晶圆区域上有不少的错误,但只要有足够的子电路,那么整个芯片纵然存在故障也可以使用。

在解决了缺陷控制问题后,WSI技术的威力终于可以发作出来了。由于不需要切割,WSI发生的整个晶圆最终会被作为一个芯片看待,因此在制造历程上,WSI可以制止受到单芯片尺寸的限制。现在尚未有详细的资料说明WSI光刻历程是如何举行的,不外,思量到WSI技术的特殊性,厂商完全可以使用现有的设备和技术,对芯片上差别部门分区制造,固然,WSI可能需要泯灭更多的、昂贵的掩模,可是和整个芯片的性能以及最终的单元性能价钱相比,应该还是值得的。

此外,WSI的生长历史也值得相识。WSI的初出茅庐是在1970年到1980年,其时主流晶圆还是2.5英寸,包罗好比TI和ITT等公司都实验实现WSI技术,可是最终均告失败。真正在WSI技术上有所突破的是一家名为Trilogy Systems的公司,这家公司在1980年获得了2.3亿美元的投资,开发了名为Trilogy Systems的WSI芯片,这是一个在100mm晶圆上实现的“超级盘算机”,而且乐成制造出了样品,可是随后由于种种原因包罗自然灾害、资金不足等,产物在1985年宣布研发终止。1989年,英国一家公司也推出了WSI技术的产物,不外集成的是内存颗粒,一张晶元集成2021Mb内存,在其时也是天文数字了。

从生长历史来看,WSI的研发道阻且长,对Cerebras公司来说,他们对此情况应该有充实的预计和预测。那么Cerebras Wafer Scale Engine又是一款怎样的产物呢?