FPGA加速卡

5月4日,阿里云宣布新一代FPGA计算实例F3启动邀测。该产品基于自研超高性能FPGA加速卡打造,可在云上实现FPGA加速业务的快速研发、安全分发、一键部署和弹性伸缩,为人工智能产业、图片视频转码、基因计算提供加速服务,在特定场景下的处理效率比CPU高百倍。

官网显示F3采用阿里云自研超高性能FPGA加速卡,搭载Xilinx 16nm Virtex UltraScale+ 器件VU9P,提供最高16个VU9P芯片的实例规格,此次对外发布邀测的实例规格支持4个VU9P芯片,此实例提供超过一千万逻辑单元,和高达47 TeraMACs 的DSP计算能力。

据了解,阿里云自主研发的高性能FPGA加速卡在诸多技术方面进行了创新:

1. 采用了创新的单卡双芯片设计,提高了计算密度,降低单位计算力的成本;

2. 卡内双芯片高速互联,带宽高达600Gbps,支持多种轻量级传输协议,传输效率95%

3. 卡间互连,通过硬核支持100Gbps Mac协议;

4. 提供实时健康监控能力,可感知底层故障,实时报警;

5. 首创的统一FPGA SHELL架构快速支持OpenCL,HLS以及RTL的开发流程,支持多种DMA访存加速,能够让多种应用程序开发的工程师更快捷的完成异构计算的定制开发工作;

百度云FPGA标准开发环境

FPGA标准开发环境
镜像是云服务器实例运行环境的模板,包括操作系统和预装软件等配置。百度云为每个FPGA实例默认提供了专属公共镜像,用户可以按需选择适合的镜像类型。

概述
基于百度云自研的FPGA加速卡,提供了一套FPGA标准开发环境。您可以使用百度云提供的镜像工具包,在FPGA上开发与调试自己的业务功能,或者将已有的功能模块移植到FPGA加速卡上。

百度自研FPGA加速卡使用Xilinx 20nm KU115 FPGA。FPGA板卡带有4通道DDR4,每个通道72bit,带ECC,容量2GB,速率2400Mhz。FPGA通过PCIE 3.0x8和CPU相连。板卡的结构框图如下所示:

基于上面的FPGA板卡,百度还提供的FPGA标准开发环境,其系统结构如下图:

视频: Xilinx@SC15:OpenCL, C/C++ 软件开发环境演示

该视频展示了赛灵思 SDAccel 开发环境的运行情况,并演示了一个软件程序员是如何在OpenCL中捕获一个应用,并利用 FPGA 对其完成加速的。整个过程中该程序员完全不需要是一个FPGA专家或对赛灵思器件设计流程特别熟悉即可独立完成。视频展示了SDAccel编译、调试和监测的功能,还有FPGA加速卡的展示。

该视频演示了FFmpeg OpenCL扩展了FPGA加速功能后的视频无缝加速,可应用于广播电视以及视频分发服务等。该应用采用赛灵思 SDAccel 开发环境开发,运行于IBM POWER8 服务器搭配Alpha Data公司的FPGA加速卡实现。

同步内容