Kintex UltraScale

作者:蒙面侠客

微处理器快速读取内存,双倍和四倍的数据速率同步SRAM,网络和电信系统的快速数据交换,用于支持高端数位讯号处理器以及其在VoIP、蜂巢式基站台、DSL线卡及数据机等方面的应用,低延迟DRAM的应用。这些方面都需要快速的读写性能。怎么才能获得更快的读写速度呢?

遇上了内存传输速度的问题?想要更高的内存速度?GSI科技提供了一个好的解决方案,这款神器的读写速度能够同时达到7.2Gbyte/sec。当然这是在结合了SigmaQuad-IIIe SRAM和Xilinx Kintex UltraScale FPGA之后表现出现的强大性能,同时还要依靠36-bit的读写速度和800MHz的时钟速度。如图1所示,可见板子上的SigmaQuad-IIIe SRAM直接和Xilinx Kintex UltraScale KU040 FPGA相连接。GSI是怎么实现这种性能的呢?此公司发展了自己的内存控制器IP来实现这个惊人的传输速度,而且这个IP是对GSI的用户免费开放的。

FPGA资源平民化 - 阿里云FaaS F2使用指南

前言
阿里云虚拟化团队异构计算和高性能计算团队一直致力于将计算资源"平民化";平民化这个词我第一次是从高性能计算团队何万青老师那边听到的,他们在做的E-HPC就是要让所有云上用户都能够瞬间拥有一个小型的超算集群,使得使用超算不再仅仅是一些超算中心和高校的特权;我们异构计算团队则致力于将目前最快,最新的计算设备在云上提供给用户,之前的产品为GPU云服务器EGS;大概半年前我们正式推出了FPGA云服务器FaaS;经过内测,公测,现在终于正式上线,用户只需要开通白名单就可以和使用ECS虚拟机一样使用FPGA资源了!

IBM打造的新服务器架构之中的中流砥柱Xilinx FPGA

作者:蒙面侠客

背景:
FPGA(Filed Programmable Gate Arrays)在数据中心服务器中开辟道路,他们被用作加速器来促进单个服务器节点的计算能力,从而增加了整体服务器的计算效率。与此同时,数据中心的服务器基础架构被重新设计,在同样的体积和同样的功耗的情况下能够使承载更多的计算量。这种重新设计将不同于传统的服务器,服务器由多个服务器节点组成,每一个服务器节点用独立的处理器,FPGA,内存,存储模块等组成。

为了跟随服务器发展的潮流,IBM公司发展了一种平台,将FPGA和服务器的CPU分离,直接将FPGA连接到数据中心的网络之中。这种解决方案将会使FPGA作为一种单独的计算单元,将多个FPGA单元形成的集群用于新兴的超大规模数据中心中使用的服务器。IBM的研究室里,科研人员将64个Xilinx公司的Kintex UltraScale XCKU060 型号的FPGA集成到一起形成一个服务器插片单元,能够达到最大带宽640Gb/s。将16个基本的插片单元集成在一个服务器的柜子上,便形成了一个有着1024个FPGA和16TB的2400Mb/s的DDR4内存的服务器。这个平台充分考虑了成本效率,使用水冷的方式实现了最优的能量效率。

PON:数据传输至家庭的演变

作者:Paolo Novellini、Antonello Di Fresco/赛灵思

15年前,连接因特网最常见的方式是透过模拟调制解调器,再经标准电话语音信道发送数据。这种技术采用已经部署的现有标准双绞电话线,无需对「最后一哩(last mile)」技术做任何更改,因此对使用者来说这种方式非常廉价,并迅速主导整个通讯市场。不用挖路铺线、不用改变中央机房(CO),这种方式极具吸引力。

模拟调制解调器的峰值速度为56Kbps。为什么是56Kbps?为什么不再高一点?简单地说:这不是「理论上」的可能,而是这种理论极限局限了ADSL技术的发展舞台。

模拟调制解调器使用经ITU-T委员会严格规范的现有语音信道。该通道具有限定带宽(4kHz,包含防护频段),进入Muldex(多任务器/解多任务器,Multiplexer Demultiplexer)之前在中央机房进行硬件滤波。Muldex是中央机房中与电话连接的设备。

透过4kHz模拟通道可传输的最大数据速率是多少?这个问题的关键是了解ADSL。

SDAccel 项目可针对目标平台进行编译。SDAccel 平台参考设计是电路板和软硬件架构组件的完美结合,可通过它执行 OpenCL 应用内核。 该参考设计可作为帮助平台开发人员为其定制 PCIe 电路板添加 DAccel 支持的起点。

作者:清风流云

随着各大处理器处理速度的提高,特别是前几年Intel和IBM在CPU运行速度的竞争环境下,整个CPU运行速度的发展基本符合摩尔定律,但是近十年来,CPU的速度提升就变得十分缓慢了,个人认为最主要的原因有两点,其一就是工艺,其二就是访存,数据放在存取区域中,很难快速的load到core中。同样在各大设计应用中,存储器的IO速度问题越来越突出,那么到今天为止,在memory access上的的IO速度是否出现了一些突破呢?

Everspin’s nvNITRO NVMe card:

支持 JESD204B 高速模拟的 Xilinx Kintex® UltraScale™ FPGA DSP 开发套件可提供一个综合平台,用于通过宽带模拟数据采集对高性能数字信号处理应用进行快速原型设计。高级设计方法、IP 和经过确认的参考设计都包含进来,可加速开发进程。该系统将具有 Kintex UltraScale XCKU040 FPGA 的 Xilinx KCU105 评估板与 Analog Devices 的 AD-FMCDAQ2 高速模拟 FMC 卡相结合,可采用 Kintex UltraScale FPGA 的 GTX 千兆位收发器通过 JESD204B 高速串行连接实现宽带数据采集。数据采集在 Ubuntu Linux(在 FPGA 中 MicroBlaze 软处理器上运行)下管理,可实现通过以太网与 Analog Devices 的 IIO Oscilloscope 和 MATLAB / Simulink 进行快速数据交换。 有了可立即使用的完整 JESD204B 宽带数据采集系统,您可将开发工作主要投入为系统添加差异化特性。交付周期 = 2 周

主要性能和优势
包含 JESD204B 的 Analog Devices AD-FMCDAQ2-EBZ 高速模拟 FMC 模块

作者:清风流云

对于VadaTech科技团队,我们已经不陌生了,但其实它是一个较为动态的公司,主要是为当前一些技术研发瓶颈来提供一些push性的技术。比如说,他们可以为用户提供一些可以保证高速、低成本、低风险情况下进行配置、集成、开发的突破性技术,同时,为了可以在第一时间获得最新的创新技术并迅速以开发板卡的形式进入市场,VadaTech科技团队往往和一些Silicon供应商保持较为亲密的关系,比如我们Xilinx。

AMC583 FPGA Dual FMC+载板:

百度云FPGA标准开发环境

FPGA标准开发环境
镜像是云服务器实例运行环境的模板,包括操作系统和预装软件等配置。百度云为每个FPGA实例默认提供了专属公共镜像,用户可以按需选择适合的镜像类型。

概述
基于百度云自研的FPGA加速卡,提供了一套FPGA标准开发环境。您可以使用百度云提供的镜像工具包,在FPGA上开发与调试自己的业务功能,或者将已有的功能模块移植到FPGA加速卡上。

百度自研FPGA加速卡使用Xilinx 20nm KU115 FPGA。FPGA板卡带有4通道DDR4,每个通道72bit,带ECC,容量2GB,速率2400Mhz。FPGA通过PCIE 3.0x8和CPU相连。板卡的结构框图如下所示:

基于上面的FPGA板卡,百度还提供的FPGA标准开发环境,其系统结构如下图:

全面加速机器学习、数据安全等应用

赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布,百度已在其公有云中部署了基于赛灵思 FPGA 的应用加速服务。百度 FPGA 云服务器是百度云推出的一项全新服务,借助高效的赛灵思Kintex® FPGA、工具和软件,致力于满足企业和开发者开发和部署机器学习和数据安全等硬件加速的数据中心应用的需求,加速人工智能和大数据应用。

百度云联合总经理兼百度基础技术体系负责人刘炀指出:“FPGA 能为深度学习推断、安全等各种高速增长的数据中心应用提供强大的性能。百度在FPGA领域拥有多年的研究经验和专业的 FPGA 工程技术,这使得我们最终推出了业经验证的加速基础架构,为满足产业界和学术界的需求做出了贡献。”

百度 FPGA 云服务器可以提供完整的 FPGA 软硬件开发环境和丰富的软硬件代码实例,能帮助用户实现快速开发和迁移,同时还能够降低开发成本。百度云FPGA云服务器可以为每个用户提供一个独享的FPGA加速平台,每个 FPGA 实例都是一款专用的加速平台,实例和用户之间不共享。同时还提供了功能丰富的高性能FPGA加速实例,如深度学习加速实例、加解密实例等。

同步内容