FPGA云端技术提供商创业的商业分析

作者:冯棕煦 来源:电子产业说微信公众号

2016年底,亚马逊网络服务宣布将通过云交付模式提供高端XilinxFPGA服务,同时,国内云服务商腾讯云也宣布推出FPGA云服务器,使FPGA为数据中心提供云端服务引起热议。今天就关于FPGA的云端服务,以及技术提供商的商业机会做分析。这里所说的技术提供商指的是通过云服务商的云端平台,提供FPGA的软硬件技术,包括提供各种算法加速的模块IP,如深度学习的DNN库,为云服务使用者在各种算法,包括人工智能的算法模型方面提供云端加速服务。

自从Intel收购Altera以来,关于FPGA在数据中心的作用就一直引起注意。甚至Intel首席执行官Brian Krzanich在收购完成后曾宣布,到2020年,将有高达三分之一的云端服务提供商使用混合的CPU-FPGA服务器(配合Xeon服务器)节点。目前FPGA在很多方面都已经得到使用案例,包括加密、安全、基因组学、金融服务,以及一系列的机器学习应用,在大数据、高性能计算、人工智能等。尽管FPGA在双精度性能和总体价格上没有优势,但是FPGA也有GPU不能提供的优势,如并行性、低功耗等方面。

本文的分析主要采用传统的行业分析模型,主要是希望通过对各利益相关者的分析,把整个交易结构阐述清楚。

就行业内的竞争者而言,目前还不是很多,主要分为两类,一类是原来一直专注于FPGA的开发,在特定行业内已经积累多年经验的创业者;另一类是侧重算法,特别是随着深度学习的兴起,基于FPGA开发深度学习算法。就商业模式来看,就目前来说,由于国内的云服务商自身也有数据处理的业务,如腾讯、阿里等,有大量的互联网数据需要处理,FPGA技术提供商可以为他们提供软硬件的平台,包括FPGA硬件板卡,插入到他们的云端服务器中。当然FPGA技术提供商也可以提供FPGA IP,由云服务商提供硬件,FPGA技术提供商按照客户需求提供技术平台服务,客户可以按需提供付费的模式。交易方式可以多种,取决于整个结构及利益的平衡。目前来看,由于FPGA在编程上的问题,该领域进入的门槛相对较高,竞争者相对还比较少,目前各家都是针对一些云服务商提供特定领域的解决方案。

就供应商来说,FPGA芯片的提供商主要是两家,Xilinx和Intel的Altera。这两家一直就FPGA的可编程环境努力,目的是降低使用的门槛,推广FPGA在云端的应用。如Intel一直在增加对OpenCL开发环境的支持。同时,尚不确定的是Intel是否会就它的CPU与FPGA做进一步的绑定,如就Xeon-FPGA做单一封装混合,在硬件接口上、整个开发环境上做改变。同时,Xilinx也在积极地推进,包括针对云端服务提供可重配置加速堆栈,积极与一些FPGA技术提供商合作开发。FPGA芯片厂商的努力,有利于促进FPGA的应用,但同时也一定程度上拉低了门槛,因此,这是把双刃剑。

就云服务厂商来说,包括阿里巴巴、亚马逊、百度、Facebook、谷格、微软和腾讯这“超七大”数据中心,他们的身份是多重的。它们既是供应商,又是竞争对手,同时又是客户。它们可以提供云服务平台,与FPGA技术提供商合作,为云服务使用者提供更好的服务。同时,由于这些公司往往自己的业务也需要这样的服务,比如搜索业务,FPGA可以在某些方面提供更好的加速服务,因此可以作为客户。但同时,这些公司的研发能力很强,他们可以直接与FPGA芯片厂商合作,自己研发技术。所以,FPGA技术提供商在与他们合作时,先需要摸清这些厂商的发展策略,区别对待,因为毕竟每一家的战略重点是不一样的。有可能有些云服务厂商,在原来的云服务提供方面没有那么强,需要与第三方紧密合作,尽快推动FPGA的云服务,扩大自己的生态和应用范围,因为这也是他们超越竞争对手的好机会。但对FPGA技术提供商来说,通过与这些厂商的合作,尽快建立自己的技术能力和客户资源。同时,扩大与云服务使用者的联系,理解并满足他们的多样化的实际需求,才是可持续的。

就替代者而言,目前云服务的主流技术还是CPU+GPU的HPC计算。FPGA只是作为协处理器的角色,本身还有一些局限性。包括基本单元的计算能力有限,为了实现可重构特性,FPGA 内部有大量极细粒度的基本单元,但是每个单元的计算能力(主要依靠LUT 查找表)都远远低于CPU 和GPU 中的ALU模块。速度与功耗相对专用定制芯片(ASIC)仍然存在不小差距。FPGA 价格较为昂贵,在规模放量的情况下单块FPGA 的成本要远高于专用定制芯片。所以目前的观点认为,FPGA是异构计算里面一个很好的补充,有可能原来需要采购10块GPU,现在改为8块GPU加1块FPGA。但即便如此,由于整个市场在快速增长,也仍然是可观的。

就新进入者而言,起码到现在为止,由于FPGA的整个开发环境的复杂度,以及在算法、模型集成、优化方面仍然需要有较大的门槛,能够进来的厂商不多。但是随着FPGA芯片厂商、云服务厂商的不断推进、甚至部分开源,未来会不会把进入的门槛拉低,还有很大的不确定性。

就客户来说,刚才有提到很多的云服务厂商本身也是客户。但是基于FPGA的云服务,未来会有更多的客户,随着基于云端SaaS部署的全面推进,基于云服务的使用者会越来越多。而且大数据和人工智能的更广泛应用,对FPGA的使用场景会越来越广泛,而这正是FPGA技术提供商未来之所在。每个客户的需求不一样,比如图像压缩、ADAS、人脸识别、医疗、工业数据处理等,基于他们的需求,对FPGA内各功能单元的部署及划分、算法模型的设计等会有很大的不同。对FPGA技术提供商来说,如果云服务商限定在只提供硬件资源,或简单的通用服务内,那未来想象空间会非常大。当然这是整个格局反复博弈的结果。

综上所述,上图是针对刚才分析的雷达图。未来格局的走向,需要我们时刻保持关注。