史上最强FPGA来了!7nm工艺性能逆天

作者: 电子创新网张国斌

今天上午,FPGA发领头羊赛灵思公司以在线发布形式宣布推出 Versal ACAP 产品组合第三大产品系列—— Versal™ Premium,这款FPGA堪称是史上最强大FPGA,它有高度集成且功耗优化的网络硬核,是业界带宽最高、计算密度最高的自适应平台,主打应用是那些在散热条件和空间受限的环境下需要运行最高带宽网络以及需要可扩展、灵活应变的应用。

图1全球带宽最高、计算密度最高的自适应平台——Versal Premium

图1全球带宽最高、计算密度最高的自适应平台——Versal Premium

ACAP 是赛灵思继 1984 年发明 FPGA 之后又一颠覆性技术发明。FPGA 曾经被行业列为震撼世界的 25 款芯片之一,而 ACAP 作为一项业界重大技术颠覆,为之前硬件工程师才能受益的灵活应变的 FPGA 走入软件、科学家等开发者开启了大门,对当今大数据与人工智能领域的创新具有深远意义。

ACAP 和 FPGA 一样是一类器件,而 Versal就是业界首款 ACAP 自适应计算加速平台。ACAP目前已经发布了两个系列--分别是 AI Core 系列和 Prime 系列。今天发布的Versal™ Premium是ACAP的第三个产品系列。

图2  Versal™ Premium是ACAP的第三个产品系列

图2 Versal™ Premium是ACAP的第三个产品系列

2019年6月,赛灵思首款自适应计算加速平台(ACAP)——Versal开始向一线客户出货,ACAP项目代号“珠穆朗玛”,是赛灵思公司研发四年投入超过10亿美元的成果,该项目出自赛灵思现任CEO Victor Peng 之手,这样的大手笔投入彻底拉开了赛灵思和当年FPGA二当家Altera(已经被英特尔收购)的差距 。

FPGA是大小还是比强悍?

我经常被问到FPGA的未来发展趋势是什么? 我想应该回归到FPGA的本质---就是要拥有大量的可编程逻辑资源以及更高的带宽和速度。一款强大的FPGA必须拥有足够多的逻辑资源,足够多的接口、硬核IP以及DSP等资源当然还要有高带宽。

2019年8月赛灵思公司在总部宣布推出号称全球最大容量的 FPGA – Virtex UltraScale+ VU19P,VU19P拥有 350 亿个晶体管,是当时全球单颗芯片最高逻辑密度和最大I/O 数量的FPGA,它除了可以支持未来最先进 ASIC 和 SoC 技术的仿真与原型设计外,也将广泛支持测试测量、计算、网络、航空航天和国防等相关应用。详见《xilinx推出史上最大FPGA》。

图3 赛灵思发布Virtex UltraScale+ VU19P

图3 赛灵思发布Virtex UltraScale+ VU19P

2019年11月,英特尔(Altera)推出了超过千万逻辑门拥有433亿晶体管的全球最大的FPGA --看来FPGA老大老二在FPGA大小方面掐上了。但实际上这是英特尔利用EMIB技术把两个高密度Stratix 10 GX FPGA核心逻辑芯片(每颗芯片容量为510万个逻辑单元)以及相应的I/O单元融合而成的怪物级FPGA,在架构上毫无亮点,而且如此大容量的FPGA配了一个17.4Gbps的收发器,这样的比大小我看意义不大。

图4  英特尔的Stratix 10 GX FPGA配置

图4 英特尔的Stratix 10 GX FPGA配置

这就好比20世纪初期各国海军强国攀比自己战列舰的口径大小,当时日本造了全球口径最大的战列舰大和号,该舰装备有3座三联装94式45倍径460毫米口径舰炮以及各种副炮和对空机关炮,全舰覆盖大量装甲,舰身的重要部位都能经受460毫米大炮的轰击,其烟囱也在开口处和侧面装上了蜂窝状钢板和防护装甲,堪称攻击和防护都巨牛的战舰,结果,它被美国航母舰载机击沉了!

图5   大和号1945年在冲绳战役中被舰载机击沉

图5 大和号1945年在冲绳战役中被舰载机击沉

所以,我看这样的比大小没有多少实际意义,因为新的计算需求和范式需要新的处理器架构需要高速的通信带宽,仅仅提升逻辑单元没有意义,FPGA需要综合的强悍性能。

Versal™ Premium的性能一览

那么Versal™ Premium的性能如何呢?今天,赛灵思的三位发言人给我们做了详细的介绍。

图6  赛灵思的三位发言人

图6 赛灵思的三位发言人

赛灵思产品线营销与管理高级总监Sumit Shah介绍说来自多元化应用与工作负载的数据爆炸性增长驱动网络转型,赛灵思估计子核心网方面,随着5G商用,核心网复合增长率是 313%!而在安全则需要最高等级,在计算与带宽方面,端口速度增长超过摩尔定律。


图7图8 数据爆炸性增长驱动网络转型

而赛灵思的Versal™ Premium可以助力实现实现速度最快、最安全的网络它把带宽提升了3倍,计算密度提升了2倍,并集成了大量的硬IP。

图9     Versal™ Premiume构成

图9 Versal™ Premiume构成

赛灵思高端 ACAP 和 FPGA 产品线高级经理Mike Thompson介绍说Versal™ Premium采用的是台积电7nm 工艺制程,作为Versal ACAP 的最新产品系列, Versal Premium 系列可提供比当前FPGA高达三倍的吞吐量,且内置以太网、Interlaken 和加密引擎以打造快速、安全的网络。

图10 Versal™ Premiume 有112Gbps收发器

图10 Versal™ Premiume 有112Gbps收发器

据介绍,Versal™ Premium有 112Gbps PAM4 收发器、数百 GbE (千兆位以太网)和 Interlaken 连接、高速加密以及内置 DMA、同时支持CCIX 和 CXL 支持的 PCIe® Gen5等,可以实现单芯片 400G 和 800G 解决方案。

图11  Versal Premium集成的IP非常多

图11 Versal Premium集成的IP非常多

Mike表示Versal™ Premium集成的 IP (主要是各类存储控制器、接口等)等效于22个16nm工艺 FPGA 的逻辑密度!集成如此多IP的目的是让开发者能够专注于差异化(相对于分散精力在设计基础架构与连接上)。他举例要在Virtex® UltraScale+TM VU9P开发这些资源需要20万个LUT ,而现在,需要的数量是0!

图12 Versal™ Premiume集成 IP优势对比

图12 Versal™ Premiume集成 IP优势对比

在应用开发上,Mike表示Versal™ Premium是面向各种开发者的软硬件集成平台,硬件开发者、软件开发者以及数据科学家都可以利用这个平台开发应用。配合 Vitis™ 统一软件平台与 Vivado® 设计套件,Versal™ Premium可为软件与硬件开发者提供完整的解决方案堆栈,尤其是针对人工智能应用,ACAP有专门的引擎可以加速AI运算。

图13 Versal™ Premiume是面向各种开发者的软硬件集成平台

图13 Versal™ Premiume是面向各种开发者的软硬件集成平台

这是Versal™ Premium和特斯拉上GPU性能对比。在图像检测上是GPU的2.3倍,在对象检测上最高提高了7.7倍,自异常检测(随机森林算法)上是英特尔至强CPU的65倍!

图14 Versal™ Premiume性能对比

图14 Versal™ Premiume性能对比

在片上存储器带宽与容量方面,Versal™ Premium与GPU对比最高可以提升25倍!

图15  片上存储器带宽与容量对比

图15 片上存储器带宽与容量对比

与ASIC、ASSP在吞吐量上对比,Versal™ Premium也远远胜出。

图16  Versal™ Premium和ASSP的吞吐量对比

图16 Versal™ Premium和ASSP的吞吐量对比

Versal™ Premium 在提升性能的同时,功耗降低一半以上,可以在低于 100 瓦功耗下提供单芯片 800G DCI (数据中心互联)吞吐量!

图17  Versal™ Premium的功耗降低很多

图17 Versal™ Premium的功耗降低很多

Mike表示随着 5G 网络投入运营,网络流量大幅增长,导致现有空间和功耗范围内功耗优化吞吐量与计算密度的需求不断提高。为支持业界应对这一挑战,Versal Premium 系列提供了高达 9Tb/s 的可扩展、自适应串行带宽。具体方法是将 112G PAM4 收发器与集成的网络功能模块用于核心网、城域网和数据中心互联( DCI )基础设施,将每端口带宽密度提高两倍,并降低时延高达 50%。

图18  Versal Premium 系列提供了高达 9Tb/s 带宽

图18 Versal Premium 系列提供了高达 9Tb/s 带宽

另外,这种预制连接可实现安全的多太位以太网( multi-terabit Ethernet ),灵活支持各种数据速率与协议。通道化以太网硬核能够以最小占板空间提供高达 5Tb/s 的吞吐量,同时高速加密引擎可提供高达 1.6Tb/s 的加密线路速率吞吐量,并支持 AES-GCM-256/128、MACsec 和 IPsec 。

图19  Versal Premium 系列可实现安全的多太位以太网

图19 Versal Premium 系列可实现安全的多太位以太网

Mike表示Versal Premium 系列AI方面也有一些独特优势,例如在网络异常检测AI上,支持入侵检测、恶意软件识别,它有应对新兴威胁的自适应 AI 算法,而赛灵思随机森林算法(Random Forest)IP 现已供货。在配置与网络性能 AI上,可以自动检测与性能瓶颈纠正,还能自动配置,最大限度延长正常运行时间 (MLP)。

 图20  Versal Premium 系列AI方面也有一些独特优势

图20 Versal Premium 系列AI方面也有一些独特优势

供货情况

据介绍,Versal Premium 系列旨在帮助超大规模数据中心用户为多元化的数据中心工作负载实现最高加速水平。将超过 120TB/s 的片上存储器带宽与可定制存储器层级相结合,能够减少数据移动从而消除相应的关键瓶颈,与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的 AI 推断。

Versal Premium 有VP1102、VP1202、VP1402、VP1502、VP1552、VP1702、VP11802 七个系列,在系统逻辑单元,IP核的配置上有所差异。

图21  Versal Premium产品系列组合

图21 Versal Premium产品系列组合

据悉,Versal Premium系列将于 2021 年上半年开始为早期用户提供样品。目前已提供文档,客户可立即使用 Versal Prime 评估套件开始原型设计。Versal Prime 器件与 Versal Premium 器件拥有众多相同的架构模块,支持引脚迁移至 Versal Premium。

图22  Versal Premium供应情况

图22 Versal Premium供应情况

推荐阅读