亚马逊选用Xilinx UltraScale+ FPGA加速AWS云服务, 发布每个配置8 个FPGA 的 F1 实例

作者:Steve Leibson, Xilinx

亚马逊网络服务(AWS)首席布道者(Chief Evangelist)Jeff Barr在一个开发者预告  (Developer Preview)中公布了AWS ( Amazon Web Services ) F1 实例,该预告是以一篇博文的形式发布的, 博文名为《“开发者预告—— 基于可编程硬件的EC2实例(F1)》。

Barr在博文中写到:

“基于硬件的可定制化解决方案中一个最具吸引力的方法就是可编程门阵列,即FPGA。专为某种功能而设计的专用芯片往往功能单一,电路连接也比较死板固定,与之相比FPGA则更加的灵活。把FPGA板卡插到PC主板的卡槽里,我们可以对其进行现场编程。每款FPGA器件都有一定的可编程逻辑门资源。对FPGA编程操作非常“简单”,只需与之建立连接,我们就可以利用“与(AND)、或(OR)、异或(XOR)”等创建想要的逻辑功能,或者利用触发器(flip-flop)、移位寄存器来实现存储模块。众所周知CPU是串行执行命令的(也有一些并行元素),指令集也是有限的,而且数据宽度一般是32位或者64位,而FPGA则可以执行任何并行操作,而且数据宽度几乎是可以任意的,可大可小。

“这种高度并行的计算模式非常适合搭建自定义加速器来处理计算密集型应用。例如对于基因组排序、地震分析、金融风险分析、大数据搜索和加密算法等应用,采用FPGA解决方案能够带来30倍的速度提升。”

“我希望这听起来非常棒,而且你也迫不及待的想用FPGA来加速你的应用。
...

“今天我们在预告中发布的最新F1实例,除了用它来构建你自己的应用和服务外,你还可以将其打包在AWS云市场进行出售和复用。将其整合在一起,你就可以避免所有曾经单独使用FPGA所不得不面对的费钱费力的步骤,用一种和使用其他所有类型的软件都非常类似的商业模式。我们为用户提供了使用云工具设计自己的逻辑功能、仿真以及验证,然后将自己的设计在几天内玄素上市的能力。”

F1采用的是Intel Broadwell E5 2686 V4处理器(普通模式2.3 GHz,Turbo模式所有核可达2.7 GHz,单核可达3.0 GHz),高达976GB的内存,以及4TB NVMe SSD 内存,集成1到8个FPGA芯片,因此可以说给用户提供了丰富的可用资源和强大的性能。 FPGA器件为每个F1实例专用,不支持多用户共享使用。

F1采用的FPGA规格(每个F1实例最高可支持8个这种类型的FPGA):

  • Xilinx UltraScale+ VU9P,16nm工艺
  • 2.64GiB ECC (错误检查与纠错)保护内存,288位总线带宽,4个DDR4通道
  • 专用的PCIe x16接口,实现与CPU通信
  • 大约2.5百万个逻辑元件
  • 大约6800 个 DSP模块
  • 虚拟的JTAG接口,用于调试

“实例中不只有一个FPGA, 专用的PCIe接口支持不同FPGA之间共享同一存储地址空间,互相之间可以通过PCIe架构进行高速通信,每个方向上数据通信传输速率可达12Gbps。一个实例中的所有FPGA可以实现400Gbps的双向通信环路,低延迟高带宽,当然这需要用户自定义协议来充分利用这一高级特性。

“除此之外Amazon还发布了一个开发者工具:AMI,“一套你可以在AWS云服务器免费使用的开发工具”,用以支持AWS F1应用开发。”

你可以点击注册深入了解Amazon EC2 F1

注:想了解更多关于在云服务环境下Xilinx锁提供的硬件加速技术支持,可以访问链接(Xilinx Acceleration Zone),你会找到很多有用的信息,很多是关于最新推出的“可重配置加速技术栈”的。 (也可以浏览文章“Xilinx 可重配置加速技术栈加速机器学习、数据分析和视频流应用”)。