Hot Chips 31 | AI芯片创业企业的困境与希望(下)

作者:姚颂,来源:Xilinx学术合作


引子

“在互联网领域,阿里、腾讯像两座大山横贯在路上,利用其强大的资金、技术与产品能力、渠道、用户等等优势阻挡住了无数的创业公司。许多成长起来的后起之秀,都是找到自己的途径去规避巨头的最强点:京东自建物流,拼多多充分发掘下沉市场,今日头条用推荐引擎取代搜索引擎。在AI芯片领域,我们终于也有了类似的感受,但许多企业还做着想正面直接挑战巨头的计划。而先进工艺下芯片的制造成本,也成了创业公司很难迈过去的一道坎。”

本文是关于Hot Chips 31大会观察与思考的系列文章的最后部分。在这一部分中,我想结合Philip Wong老师的Keynote,一起讨论一下集成电路制造工艺演进的问题,也想谈一下我自己关于制造工艺对于AI芯片创业企业的影响。如没有特殊说明,图片均来自于本人在Hot Chips 31拍摄的照片,PPT版权由原报告人所有。

No.1、Philip Wong教授的报告回顾

在去年8月,斯坦福大学著名教授Philip Wong(黄汉森,以下简称黄教授)确认加入台积电,担任研究副总裁,在业界传为佳话,让大家觉得又是一例产学研结合的典型案例。黄教授多年来在存储领域有非常深的建树,也在碳纳米管器件领域有着深入的研究,他的加盟毫无疑问说明TSMC会在存储方面更下功夫。


黄教授一上来便抛出了他最重要的主题,他说:

“Moore’s law is not dead, is not slowing, is even not ill. It’s well alive!”

(摩尔定律没有终结,也没有放缓,更没有生病。摩尔定律活得好好地!)

在之后,他介绍了台积电在工艺节点演进上的路线图与展望,并且阐述了三条他认为可以继续延续摩尔定律的技术路径:

1. 系统集成的方式,如用interposer的方式将SoC与DRAM可以集成在一起,如SiP,如Chiplet;

2. 更进一步存储与计算的集成,比如直接将存储与计算部分在垂直方向上进行堆叠,采用更细致和极致的堆叠方案N3XT;

3. 新的底层材料和技术,比如碳纳米管。

特别地,他强调了半导体技术的演进,总是被不断变化的应用需求所引领的,如上个世纪80年代到2000年的PC/互联网,到21世纪至今的移动互联网,在新的时代我们也会更多的去关注AI与5G的底层需求。

No.2、制造工艺之于AI芯片

黄老师有理有据地阐述了他的观点:摩尔定律很健康!然而俗话说“屁股决定脑袋“,他这样说,我们就无从知道,有多少比例的原因是他正在台积电担任集团研究副总裁。


如在AMD CEO Lisa Su的报告中,就已经画出来了工艺演进的曲线,可以看到10nm与7nm工艺的发展速度已经很大程度上偏离了原来的projection。虽然系统级封装,利用Interposer方式将HBM与计算部分集成到一起,大大提升了存储带宽,但是这并不是集成密度的提升。

而芯片制造工艺对于行业影响最大的,并不只是放缓,其制造成本也有非常大的影响:对于晶圆厂和Fabless设计公司均是这样。

对于晶圆厂来说,7nm等先进工艺生产线动辄数十亿美金的投资是一笔巨大的负担。于是我们看到,在2018年8月,第二梯队的晶圆厂联电、Global Foundries先后宣布放弃7nm工艺。在整个市场上,拥有最先进生产工艺的代工厂,只剩下了台积电、Intel和三星。

对于Fabless的芯片设计公司,问题同样巨大。对于台积电28nm、16nm、7nm的芯片来说,要完成一颗芯片的量产,其IP购买、MPW、量产的成本在数百万美金,千万美金,亿美金以上——如果考虑人员成本、设备成本等等的,这个数字还会高上不少。这就导致只有出货量极大、收入极高的几家大厂能够负担得起最先进工艺。比如大家耳熟能详的联发科,如今也只能先使用着台积电的12nm,而不能像高通和海思一样使用7nm工艺。

先进制造工艺的成本问题,对于AI芯片创业公司也有很大影响。一般的AI芯片创业公司,可能只能负担得起28nm工艺,或者说最开始只敢用28nm工艺进行尝试。融资足够多的AI创业企业才能尝试得起16nm工艺的生产费用。在全球数十家AI芯片创业公司当中,我只听说过有一家敢于去使用7nm。

如地平线在周五发布的征程二代芯片,就是使用的台积电28nm工艺(虽然28nm HPC+是多次改进的版本,不展开详细介绍),这也是大部分嵌入式/终端AI芯片目前选择的制造工艺;在Hot Chips上吸引了众多眼球的Cerebras与Habana,均采用的16nm工艺——而这也是迫不得已,因为他们的应用场景在云端,必须追求极限的高性能,所以必须使用能负担得起的最好的工艺,也必须选择HBM或者更加极端的存储方案(如Cerebras使用的Wafer-scale engine,采用18GB SRAM,单片成本据说在100万美金左右)。

这就导致一个巨大的问题:CPU与GPU的竞争中,CPU并不能凭借制造工艺的优势,来弥补通用性带来的性能不足,因为二者并无制造工艺上的代差,对于特定应用,性能差距本来也很大;而大公司与AI芯片创业公司之间财力的差距,导致大公司的芯片可以选择更先进的制造工艺,而AI芯片创业公司却只能负担得起相对成熟的工艺。这样的话,即便在体系结构设计上,AI芯片创业公司的芯片在特定任务上有数倍的优势,也可能被制造工艺的差别给抹平。大公司可以通过制造工艺的碾压,获得更好的性能,再通过其通用性和原有的渠道、用户生态的优势,卖出更多的芯片来收回成本。

在互联网领域,阿里、腾讯像两座大山横贯在路上,利用其强大的资金、技术与产品能力、渠道、用户等等优势阻挡住了无数的创业公司。许多成长起来的后起之秀,都是找到自己的途径去规避巨头的最强点:京东自建物流,拼多多充分发掘下沉市场,今日头条用推荐引擎取代搜索引擎。在AI芯片领域,我们终于也有了类似的感受,但许多企业还做着想正面直接挑战巨头的计划。而先进工艺下芯片的制造成本,也成了创业公司很难迈过去的一道坎。

没有机会了吗?也不是。发掘巨头没有覆盖到,但是有潜力的新市场,也许机会正在打开,如拼多多一般;用新的底层技术,如存内计算,去获得数量级的提升,而不是在原来传统数字芯片上硬拼,就好像抖音用短视频取代了长视频与图片文字的社区;在具体的领域,去做整个系统与产品层面的优化,而不只是做芯片,提供更好的服务,就如昨晚在朋友圈刷屏的ZAO,从DeepFake单个算法出发,做成了细节考虑充分的完整应用;利用好不同地区之间的政策与文化的差异性,就好像滴滴在中国击败了Uber。

谁能够跨过这道门槛,真正和巨头们掰一掰呢?我个人看好华为与阿里平头哥。前者有足够多的资源,也可以排在世界前几的的研发实力与工程能力,软硬件都非常强,有机会在市场终于被做大之后进场收割;后者,在有足够多的资源和很强的技术能力外,还有明确的应用以及长期的集团战略,也能在其看重的领域掀起波浪。而对于创业企业,找到与巨头的差异性,无论是细分市场、系统集成度、地区政策差异、还是底层技术变革,强化优势,再拿到足够多的资源,我相信也希望能够跑出几家在各自领域拥有相当地位的公司。

刘慈欣在《流浪地球》里写过一个著名的谜语:“你在平原上走着走着,突然迎面遇到一堵墙,这墙向上无限高,向下无限深,向左无限远,向右无限远,这墙是什么? ”

对于AI芯片创业企业来说,眼前这墙真的很大,但也不是无限大。

文章转载自:Xilinx学术合作

推荐阅读