Virtex UltraScale

赛灵思 FPGA 助力 NGCodec H.265 标准尽快进驻华为云

赛灵思公司(Xilinx, Inc.,(NASDAQ: XLNX))、华为和 NGCodec 今天宣布开发中国首款云端高效率视频编码 (HVEC) 解决方案。该解决方案独家采用赛灵思 Virtex UltraScale+™ FPGA 和 NGCodec 的全新 H.265 视频编码器。该技术将进驻华为云 FACS(FPGA 加速云服务器)并在年底前投入使用。这将在中国的可扩展云基础设施中实现首个使用FPGA的广播质量级的实时流媒体解决方案。

赛灵思云视频高级市场营销经理Sean Gardner 表示:“把赛灵思功能强大、灵活应变的 FPGA 技术与 NGCodec 全新 HEVC 编码器相结合所形成的这种独特组合能实现一系列以往无法实现的解决方案。华为率先把这种解决方案运用在了自己的云基础设施上,并把该技术引进中国——世界上规模最大的实时视频流市场,华为引领着这个行业的发展。”

在中国,视频流是一项主要工作负载,企业正在纷纷努力推出基础设施,以满足强劲视频流快速增长或者高峰需求。传统上,企业采用 GPU 运行 HVEC,但赛灵思 FPGA 能以相同的视觉质量将比特率降低 35-45%,从而带来了带宽和存储成本的巨大改善。

赛灵思最新深度神经网络推理器xDNN参数曝光

继年初发布新一代FPGA框架后,FPGA巨头赛灵思在Hot Chips大会揭露了最新一代深度神经网络推理装置xDNN的部分规格参数。随着更多定制芯片的发展,现如今AI芯片的战火已经蔓延到推理领域。赛灵思的xDNN可配置、可复写,进行多任务处理,还配有Tensor内存。

目前来看,FPGA可能没有像一些人预期的那样在深度学习的训练空间中占据一席之地,但AI推理的低功耗、高频率需求非常适合可重复编程硬件的性能曲线。

然而,现在人们越来越专注于推理与训练的新体系架构,FPGA也在努力在定制化硬件领域保持领先,而这要靠一些高级编程工具来降低编程的复杂度。

目前,要判断通用CPU、GPU、FPGA及定制芯片如何才能吸引最广泛的用户群还为时尚早,但基于云的FPGA以及不断发展的高级FPGA集,越来越多地作为实验工具使用,让FPGA在面向推理的任务中占据了一席之地。

考虑到所有这些因素,FPGA制造商Xilinx近日在Hot Chips大会上发布了Xilinx深度神经网络推理(xDNN)设备的一些参数细节,公司将在接下来10月1日举行的开发者大会上发布更多信息和性能基准。

【视频】动态调整Xilinx FPGA收发器电源1V±0.25%

ADI Guneet Chadha演示如何使用电源系统管理使FPGA内核或I/O(例如:高速收发器)的电源输出电压(1V)保持在很小的容差范围内(0.25%)还显示了“如何确定电源裕量”

近期,华为云携手峰科计算(以下简称“峰科”)发布基于FPGA的基因加速云解决方案,该方案采用GATK(The Genome Analysis Toolkit)标准分析流程,将全基因组测序(WGS)性能提升5倍,比传统模式提升3~5倍,同时测序精度可达99.95%以上,在大幅缩短测序时间的同时实现TCO大幅降低。

基因测序数据分析加速面临的挑战

首先,基因测序分析流程BWT+GATK当前被业界广泛采纳,但采用此流程的传统测序方法需要消耗高额算力及存储资源,且耗时较长。

其次,针对基因测序中高算力需求的smith-waterman,pair-hmm等算法处理,其具有计算并行性,不连续,非规则的存储访问,低bit操作等特性,计算依赖不规则区域的操作会对CPU消耗很大,性能难以提升。

华为云FPGA基因加速解决方案的三大优势

新思科技推出新一代ZeBu Server-4

提供比原系统快2倍的硬件仿真速度

重点:
• 业界最快的硬件仿真系统,将性能提升2倍。
• 业界最大容量,可扩展至超过190亿个逻辑门的设计。
• 业界最低的总体拥有成本,只需1/5的使用能耗和一半的机房空间。。
• 相较其他的硬件仿真平台,拥有无可匹敌的硬件可靠性。
• 支持汽车、5G、网络、人工智能和数据中心SoC研发所需的复杂软件工作负载。
• 创新的软件功能,可加快编译、高级调试、功耗分析、仿真加速以及混合硬件仿真。

新思科技(Synopsys, Inc.,纳斯达克股票市场代码: SNPS)宣布,旗下业界性能最高的硬件仿真系统ZeBu® Server 4面向用户开放。ZeBu Server 4基于久经考验的ZeBu快速硬件仿真架构而开发,硬件仿真性能是竞品解决方案的两倍,能够实现片上系统(SoC)验证和软件研发,以满足汽车、5G、网络、人工智能(AI)和数据中心SoC爆发式增长的验证需求。ZeBu Server 4对机房的空间需求减少了一半,同时功耗降低了5倍,实现了业界最低的拥有成本。此外,ZeBu Server 4还提供创新的软件功能,可以加快编译、高级调试、功耗分析、仿真加速和混合硬件仿真。

Xilinx Virtex UltraScale FPGA VCU1287 特性描述套件

VCU1287 功能描述套件可为您提供描述和评估 Virtex® UltraScale™ XCVU095-FFVB2104E FPGA 上可用 32 GTH (16Gbps) 和 32 GTY (30Gbps) 收发器所需的一切功能。每个 GTH 与 GTY Quad 及其相关参考时钟均从 FPGA 路由至 SMA 及 Samtec BullsEye 连接器。 BullsEye 连接器可连接各种评估平台,从背板与光学评估板到高速测试设备不一而足。每个 BullsEye 连接器都会处理一个完整的 GTH 或 GTY Quad、4 个发送/接收对,从而实现以最灵活的方式来测试定制应用。了解更多信息,查看套件所含配件。

点击了解更多详细信息

FPGA资源平民化的新晋- F3 技术解析

FPGA (现场可编程门阵列)由于其硬件并行加速能力和可编程特性,在传统通信领域和IC设计领域大放异彩。一路走来,FPGA并非一个新兴的硬件器件,由于其开发门槛过高,硬件加速算法的发布和部署保护要求非常高,FPGA的使用一直是高冷的美人,没有走入平常百姓家。也就导致FPGA的计算潜力还没有得到深入的挖掘。

阿里云虚拟化团队异构计算和高性能计算团队一直致力于将计算资源"平民化";高性能计算团队在做的E-HPC就是要让所有云上用户都能够瞬间拥有一个小型的超算集群,使得使用超算不再仅仅是一些超算中心和高校的特权;而异构计算团队则致力于将目前最快,最新的计算设备在云上提供给用户,使得曾经高冷的计算资源不再拒人千里之外:推出了FPGA云服务器FaaS 服务,其中的F1和F2实例已经对外提供服务,可以通过一键部署的方式把Intel和Xilinx的小规格的器件计算能力赋予客户。

2018年5月,新晋的大规格FPGA实例,基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的实例F3正式发布。下面将对阿里云FPGA计算(下面简称FaaS)服务本身,以及这次发布的F3实例的底层硬件架构和平台架构进行技术解读。

FaaS

5月4日,阿里云宣布新一代FPGA计算实例F3启动邀测。该产品基于自研超高性能FPGA加速卡打造,可在云上实现FPGA加速业务的快速研发、安全分发、一键部署和弹性伸缩,为人工智能产业、图片视频转码、基因计算提供加速服务,在特定场景下的处理效率比CPU高百倍。

官网显示F3采用阿里云自研超高性能FPGA加速卡,搭载Xilinx 16nm Virtex UltraScale+ 器件VU9P,提供最高16个VU9P芯片的实例规格,此次对外发布邀测的实例规格支持4个VU9P芯片,此实例提供超过一千万逻辑单元,和高达47 TeraMACs 的DSP计算能力。

据了解,阿里云自主研发的高性能FPGA加速卡在诸多技术方面进行了创新:

1. 采用了创新的单卡双芯片设计,提高了计算密度,降低单位计算力的成本;

2. 卡内双芯片高速互联,带宽高达600Gbps,支持多种轻量级传输协议,传输效率95%

3. 卡间互连,通过硬核支持100Gbps Mac协议;

4. 提供实时健康监控能力,可感知底层故障,实时报警;

5. 首创的统一FPGA SHELL架构快速支持OpenCL,HLS以及RTL的开发流程,支持多种DMA访存加速,能够让多种应用程序开发的工程师更快捷的完成异构计算的定制开发工作;

业界领先的 Xilinx 58G PAM4 技术演示

为帮助推进新一轮以太网部署,Xilinx 将 58Gb/s 收发器集成于其 16nm FinFET+ Virtex UltraScale+ FPGA 系列。全新收发器架构具有以下优势:

  • 以 50G+ 线路速率突破数据传输的物理极限
  • 采用新一代均衡技术,最大程度减少通道损耗
  • 支持芯片间、模块、直接附加线缆以及背板通信
  • PAM4 调制是大势所趋

    PAM4(或 4 级脉冲幅度调制)被公认为是目前实现新一代线路速率的可扩展性最高的多级信号协议,而且 Xilinx 正在通过光学互联网论坛 (OIF) 及电气电子工程师协会 (IEEE) 帮助推动 58G PAM4 标准化工作的发展。

    为实现新一代以太网铺平了道路

    云计算、工业物联网以及软件定义网络应用等都将继续加速和推动对无限带宽需求的发展。最新收发器架构将帮助各大厂商:

  • 在现有基础架构上让带宽翻番
  • 扩展 50G、100G、400G 端口以及太比特接口
  • 评估用于开发其新一代解决方案的技术
  • 新一代标准化线路速率是满足这些不断提高的带宽需求的关键

    Xilinx推出Virtex UltraScale+ HBM FPGA!

    作者:Steve Leibson,编译:stark

    早在2016年Xilinx就提出了开发Virtex UltraScale+ HBM FPGA器件,在上周举办的硅谷大会上Xilinx首次亮相了Virtex UltraScale+ HBM XCVU37P FPGA器件,Xilinx已经对其进行了测试,支持全速460Gbytes/sec的带宽通信,此外它的资源也是相当的丰富:

  • 2852K 系统逻辑单元
  • 9Mbits BRAM资源
  • 270Mbits 的UltraRAM资源
  • 9024 DSP48E2 slices
  • 集成8GB HBM DRAM
  • 96个32.75Gbps GTY SerDes 收发器
  • 图1:Xilinx推出的Virtex UltraScale+ HBM系列FPGA

    同步内容