Virtex UltraScale

Virtex UltraScale+ 58G PAM4 FPGA 能够在最具挑战性的信道上传输和接收数据。在 XDF 硅谷场的现场演示中,通过超过 5 米的 QSFP28 直接连接铜线传输了 58Gb/s 的信息,由 GTM PAM4 收发器接收。经过该加强通道并在收发器最大速率下运行后,在 XDF 上经过几天的现场运行,没有发现前向纠错后的错误。

浪潮在美发布集成HBM2的FPGA AI加速卡F37X

在达拉斯举行的全球超算大会SC18上,浪潮发布集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,实现高性能、高带宽、低延迟、低功耗的AI计算加速。

  F37X是浪潮专为AI极致性能设计的尖端FPGA加速卡。它采用Xilinx Virtex UltraScale+架构,INT8计算性能达到了28.1TOPS,集成8GB HBM2高速缓存,带宽达460GB/s。F37X典型应用功耗仅为75瓦,性能功耗比高达375Gops/W。性能数据显示,浪潮F37X在AI图像识别实时推理场景,基于GoogLeNet深度学习网络模型,当BatchSize=1时性能高达8600 images/s,是CPU性能的40倍。同时F37X可支持SDAccel 开发环境与C/C++、OpenCL和RTL三种主流的编程语言,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型AI应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的AI定制算法应用,在软件生产力上实现了质的飞跃。

赛灵思开发人员论坛 (XDF) 上,我们的首席执行官 Victor Peng 和 Twitch 首席研究工程师 Yueshi Shen 博士一道登台。在五分钟的交流中,Twitch 透露,他们已选定赛灵思的 FPGA,借助全新视频编码格式 VP9,实现业界首款广播质量级的实时流媒体视频平台。

Twitch 是北美规模最大、发展速度最快的实时流媒体视频平台,也是首家提供观看游戏和 eSports 内容的免费交互网络的视频平台。Shen 博士及其团队的任务是为 Twitch 社区中的数百万观众和发行人提供绝佳的实时流媒体视频观看体验。。他表示:能够顺畅地,以超低时延提供广播级质量的视频至关重要。

为满足 Twitch 观众群体的这一苛刻需求,Shen 博士与他的团队使用借助赛灵思应用合作伙伴 NGCodec 提供的编码器 IP 开发的全新 VP9 编码标准,实现由赛灵思注入强劲动力的解决方案。VP9 是由谷歌开发的一种开源视频编码格式。最初是用于支持 YouTube ,但由于它免版税,并且能在保证高画质的同时,帮助用户降低流比特率,所以 VP9发展势头强劲。NGCodec 的 VP9 编码器实现方案通过加速编码过程,同时保证像 LibVPX 等这些较慢速实现方案的压缩效率,从而为用户创造了更多价值。

10月16日,在北京举行的2018XDF赛灵思开发者大会上,浪潮联合赛灵思宣布推出全球首款集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,适合于机器学习推理、视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、NFV、大数据分析查询等各类应用场景,实现高性能、高带宽、低延迟、低功耗的AI计算加速。

浪潮集团副总裁李金在XDF大会做主题演讲

浪潮集团副总裁李金在XDF大会做主题演讲

赛灵思 FPGA 助力 NGCodec H.265 标准尽快进驻华为云

赛灵思公司(Xilinx, Inc.,(NASDAQ: XLNX))、华为和 NGCodec 今天宣布开发中国首款云端高效率视频编码 (HVEC) 解决方案。该解决方案独家采用赛灵思 Virtex UltraScale+™ FPGA 和 NGCodec 的全新 H.265 视频编码器。该技术将进驻华为云 FACS(FPGA 加速云服务器)并在年底前投入使用。这将在中国的可扩展云基础设施中实现首个使用FPGA的广播质量级的实时流媒体解决方案。

赛灵思云视频高级市场营销经理Sean Gardner 表示:“把赛灵思功能强大、灵活应变的 FPGA 技术与 NGCodec 全新 HEVC 编码器相结合所形成的这种独特组合能实现一系列以往无法实现的解决方案。华为率先把这种解决方案运用在了自己的云基础设施上,并把该技术引进中国——世界上规模最大的实时视频流市场,华为引领着这个行业的发展。”

在中国,视频流是一项主要工作负载,企业正在纷纷努力推出基础设施,以满足强劲视频流快速增长或者高峰需求。传统上,企业采用 GPU 运行 HVEC,但赛灵思 FPGA 能以相同的视觉质量将比特率降低 35-45%,从而带来了带宽和存储成本的巨大改善。

赛灵思最新深度神经网络推理器xDNN参数曝光

继年初发布新一代FPGA框架后,FPGA巨头赛灵思在Hot Chips大会揭露了最新一代深度神经网络推理装置xDNN的部分规格参数。随着更多定制芯片的发展,现如今AI芯片的战火已经蔓延到推理领域。赛灵思的xDNN可配置、可复写,进行多任务处理,还配有Tensor内存。

目前来看,FPGA可能没有像一些人预期的那样在深度学习的训练空间中占据一席之地,但AI推理的低功耗、高频率需求非常适合可重复编程硬件的性能曲线。

然而,现在人们越来越专注于推理与训练的新体系架构,FPGA也在努力在定制化硬件领域保持领先,而这要靠一些高级编程工具来降低编程的复杂度。

目前,要判断通用CPU、GPU、FPGA及定制芯片如何才能吸引最广泛的用户群还为时尚早,但基于云的FPGA以及不断发展的高级FPGA集,越来越多地作为实验工具使用,让FPGA在面向推理的任务中占据了一席之地。

考虑到所有这些因素,FPGA制造商Xilinx近日在Hot Chips大会上发布了Xilinx深度神经网络推理(xDNN)设备的一些参数细节,公司将在接下来10月1日举行的开发者大会上发布更多信息和性能基准。

【视频】动态调整Xilinx FPGA收发器电源1V±0.25%

ADI Guneet Chadha演示如何使用电源系统管理使FPGA内核或I/O(例如:高速收发器)的电源输出电压(1V)保持在很小的容差范围内(0.25%)还显示了“如何确定电源裕量”

近期,华为云携手峰科计算(以下简称“峰科”)发布基于FPGA的基因加速云解决方案,该方案采用GATK(The Genome Analysis Toolkit)标准分析流程,将全基因组测序(WGS)性能提升5倍,比传统模式提升3~5倍,同时测序精度可达99.95%以上,在大幅缩短测序时间的同时实现TCO大幅降低。

基因测序数据分析加速面临的挑战

首先,基因测序分析流程BWT+GATK当前被业界广泛采纳,但采用此流程的传统测序方法需要消耗高额算力及存储资源,且耗时较长。

其次,针对基因测序中高算力需求的smith-waterman,pair-hmm等算法处理,其具有计算并行性,不连续,非规则的存储访问,低bit操作等特性,计算依赖不规则区域的操作会对CPU消耗很大,性能难以提升。

华为云FPGA基因加速解决方案的三大优势

新思科技推出新一代ZeBu Server-4

提供比原系统快2倍的硬件仿真速度

重点:
• 业界最快的硬件仿真系统,将性能提升2倍。
• 业界最大容量,可扩展至超过190亿个逻辑门的设计。
• 业界最低的总体拥有成本,只需1/5的使用能耗和一半的机房空间。。
• 相较其他的硬件仿真平台,拥有无可匹敌的硬件可靠性。
• 支持汽车、5G、网络、人工智能和数据中心SoC研发所需的复杂软件工作负载。
• 创新的软件功能,可加快编译、高级调试、功耗分析、仿真加速以及混合硬件仿真。

新思科技(Synopsys, Inc.,纳斯达克股票市场代码: SNPS)宣布,旗下业界性能最高的硬件仿真系统ZeBu® Server 4面向用户开放。ZeBu Server 4基于久经考验的ZeBu快速硬件仿真架构而开发,硬件仿真性能是竞品解决方案的两倍,能够实现片上系统(SoC)验证和软件研发,以满足汽车、5G、网络、人工智能(AI)和数据中心SoC爆发式增长的验证需求。ZeBu Server 4对机房的空间需求减少了一半,同时功耗降低了5倍,实现了业界最低的拥有成本。此外,ZeBu Server 4还提供创新的软件功能,可以加快编译、高级调试、功耗分析、仿真加速和混合硬件仿真。

Xilinx Virtex UltraScale FPGA VCU1287 特性描述套件

VCU1287 功能描述套件可为您提供描述和评估 Virtex® UltraScale™ XCVU095-FFVB2104E FPGA 上可用 32 GTH (16Gbps) 和 32 GTY (30Gbps) 收发器所需的一切功能。每个 GTH 与 GTY Quad 及其相关参考时钟均从 FPGA 路由至 SMA 及 Samtec BullsEye 连接器。 BullsEye 连接器可连接各种评估平台,从背板与光学评估板到高速测试设备不一而足。每个 BullsEye 连接器都会处理一个完整的 GTH 或 GTY Quad、4 个发送/接收对,从而实现以最灵活的方式来测试定制应用。了解更多信息,查看套件所含配件。

点击了解更多详细信息

同步内容