Virtex UltraScale

惊呆! 数据中心加速神器---1680核处理器+FPGA !

作者:蒙面侠客

背景:
数据中心采用FPGA做加速器已经成为主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,Intel的Altera,Baidu公司等。数据中心具有大规模并行数据处理,高数据吞吐量,低延时,能效高等特点。但是存在两个问题,第一个是软件的问题,软件移植和保证一定加速的工作负荷;第二个是硬件的问题,配备众核处理器,25-100G的网络接口卡,一些DRAM/HBM通道,容易时序收敛等。

现介绍一种GRVI Phalanx FPGA加速器结构。其中,GRVI是一种基于FPGA的有效的RISC-V运算单元,即RISC-V RV321软处理器核;Phalanx是一种并行FPGA加速器框架,由PE集群,SRAM,加速器,DRAM,I/O控制器等组成,减少在开发和管理FPGA加速器时所需付出的消耗和努力;还需要Hoplite NoC,它是一种基于FPGA优化的定向2D环形片上网络系统,用到的技术还有局部内存共享和全局信息流通等。

SoC开发周期大大缩短

S2C公司,业内领先的 FPGA 快速原型验证系统供应商,今日宣布FADU, 一家致力于内存和存储体系架构的初创公司,已经借助S2C VU440 Prodigy Logic Module完成了他们新一代NVMe (Non-Volatile Memory Express) eSSD的验证。FADU使用S2C的PCIe Gen3开发套件实现了高速的数据传输,并通过S2C定制的接口子卡与VU440 Prodigy Logic Module互连,进而实现整个的eSSD系统的验证。

​​ 在9月5日-7日举办的HUAWEI CONNECT 2017大会上,华为云正式发布FPGA 加速云服务器(FACS) 平台及FP1实例。FACS 提供一套完整的FPGA基础设施服务,可将目前最热门的机器学习、数据分析和视频处理等计算密集型云应用的效率提升十倍到数十倍以上。

华为云此次推出的FP1实例,基于FPGA 行业的领导者Xilinx公司目前最先进的16nm Virtex® UltraScale+™ VU9P,这一高性能的硬件可以支持高带宽的Mesh互联结构。

FP1实例支持两种X86与FPGA的交互框架:

1.自研的高性能框架,可满足用户高带宽低时延的要求; 

2.通用的Xilinx SDAccel交互框架,基于Xilinx的解决方案,并配套相关驱动和Runtime。未来FP1实例可以支持更多规格类型的硬件、框架和服务,满足各类型用户需求。

赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天宣布其软件定义开发环境SDAccel现已上线亚马逊AWS,可与亚马逊弹性计算云(Amazon EC2)F1实例配合使用。Amazon EC2 F1实例借助赛灵思16nm Virtex®UltraScale+™FPGA,可提供可重配置的定制硬件加速功能,能够满足数据分析、视频处理和机器学习等计算密集型工作负载的种种需求。

随着面向Amazon EC2 F1实例的SDAccel开发环境的部署,使不太熟悉FPGA的软件开发人员现在也能够将工作负载的性能提升高达50倍之多。

SDAccel通过为Amazon EC2 F1构建专用的FPGA内核,可以自动加速使用C、C++或OpenCL编写的软件应用。SDAccel还支持传统硬件设计师用VHDL Verilog等底层硬件描述语言编写优化加速器。

SDAccel通过AWS FPGA开发人员亚马逊机器映像AMI(Amazon Machine Image) 提供,这样开发人员就能够快速在云端构建应用,且无需购买或安装任何软件或硬件。开发人员还可以利用AWS的全方位的服务来部署并灵活扩展其应用,以满足客户任何需求。

作者:蒙面侠客

背景:
对大多数数据中心和网络服务供应商来说,如果想要保持竞争力,就必须不断地提高网络速率来满足人们日益增长的网络需求。据权威机构统计,到2018年,全球将会有38%的服务供应商部署100G网络,这意味着100G时代已经到来。传统的以太网升级路径是10G-40G-100G,然而一项新的调研报告表明,最新的服务器升级路径将是10G-25G-100G,甚至未来可升级到400G。但是为什么是25G呢?因为从10G到40G是一次大的跳跃,而且事实表明从10G升级到25G的增量成本并不高。我们需要使用升级的线缆和光模块来支持这个新的以太网速率,而这无疑会推动像QSFP28这种25G光模块和相对应的网络数据处理芯片的发展。

Hitech Global的HTC-910 PCIe:
随着可编程硬件平台的发展,为硬件产品的开发带来了更多便利。来自Hitech Global的HTC-910 PCIe开发平台具有很好的可编程性能,组合了Virtex UltraScale+(VU9P,VU13P)或Virtex UltraScale VU190和两个QSFP28(4x25G)光模块插槽,为100G数据中心网的进展可谓是增加了一名悍将。

PLDA的XpressRICH4™和XpressRICH4-AXI™为Xilinx® Virtex® Ultrascale+™ FPGA提供PCIe 4.0 v0.9支持,为FPGA技术提供最先进、最高性能的互连技术。

PLDA今日宣布推出业界首创在FPGA上支持PCIe® 4.0 v0.9的PCIe软IP解决方案。PLDA的XpressRICH4™和XpressRICH4-AXI™ IP解决方案已证明具有可靠的可靠性,许多ASIC和SoC已经投入生产。

PLDA PCIe 4.0软IP解决方案现在支持最新功能,这些功能已强制纳入PCIe 4.0规范,包括支持EIEOS。

此外,经在由PCIe 4.0 x86提供支持的早期平台(具有端到端DMA流量)上验证,面向Virtex Ultrascale+的PLDA PCIe 4.0软IP在硬件中的运行速度为16GT/s。这些测试证明PLDA PCIe 4.0 IP在PLDA的PCIe 3.0至PCIe 4.0透明模式交换机上运行时可实现最大的吞吐量。

欢迎光临TSMC OIP圣克拉拉(9月13日)和IP SoC上海(9月14日)研讨会,您将有机会认识我们的团队、参观我们的演示会并了解我们的PCIe 4.0解决方案

赛灵思、Arm、Cadence和台积公司今日宣布一项合作,将共同构建首款基于台积7纳米FinFET工艺的支持芯片间缓存一致性(CCIX)的加速器测试芯片,并计划在2018年交付。这一测试芯片旨在从硅芯片层面证明CCIX能够支持多核高性能Arm CPU和FPGA加速器实现一致性互联。

关于CCIX
出于功耗及空间方面的考虑,在数据中心内对应用进行加速的需求日益增长,诸如大数据分析、搜索、机器学习、4G/5G无线、内存内数据处理、视频分析及网络处理等应用,都已受益于可在多个系统部件中无缝移动数据的加速器引擎。CCIX将支持部件在无需复杂编程环境的情况下,获取并处理位于任何地方的数据。

CCIX将利用现有的服务器互连基础架构,实现对共享内存更高带宽、更低延迟和缓存一致性的访问。这将大幅提升加速器的可用性以及数据中心平台的整体性能和效率,降低进入现有服务器系统的壁垒,并改善加速系统的总拥有成本(TCO)。

关于测试芯片

作者: 电子创新网张国斌

电子产品与人工智能技术结合后变得更加智慧已经是其未来发展必然趋势,而人工智能需要端、云大数据的“喂养”尤其是利用云端的计算力完成大量数据的处理,年初,目睹本土公司在智能产品开发上云端支持的缺失,我写了一篇文章《BAT已成本土物联网发展的绊脚石》,本来我想题目用《狗日的BAT》的,不过考虑到这样的题目有点太泼妇,所以换了点温和的题目,不过现在嵌入式业者不用考虑BAT了,华为已经在2017大会上正式发布了多个行业加速实例,而且其首发的FP1实例选择赛灵思高性能Virtex® UltraScale+™ FPGA 为其最新加速云服务,感觉嵌入式开发者终于可以欢呼了!耶!

Xilinx 助力华为FPGA 加速云服务器

将机器学习、数据分析与视频处理速度提升10 倍

赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))今天在华为全联接大会(HUAWEI CONNECT 2017)上宣布,华为首发的FP1实例选择赛灵思高性能Virtex®UltraScale+™ FPGA为其最新加速云服务提供强大动力。华为 FPGA 加速云服务器(FACS)平台可支持其用户在华为公有云上开发、部署和发布基于 FPGA 的新型服务和应用。

本视频重点介绍首款构建在可编程逻辑器件中的 Gen3 x16 PCI Express 解决方案,该方案通过了 4/2016 PCI SIG 合规性测试。该演示展示了 PCIe 在 Virtex® UltraScale+™ FPGA 电路板上启动和运行,并连接至 Intel Skylake 处理器。

同步内容