全球首台基于AMD EPYC处理器和AMD Instinct加速器的Exascale超级计算机
judy 在 周四, 06/02/2022 - 09:48 提交
基于AMD EPYC CPU和AMD Instinct加速器的Frontier超级计算机在Top500、Green500和HPL-AI性能排行榜上获得第一名
Xilinx 7-系列 FPGA 和 SoC 能为航空航天与军用、医疗、科学、石油天然气、金融、通信以及生命科学等应用提供节能型高性能处理解决方案。FPGA 架构固有的平行结构和定制架构适合高吞吐量数据处理和软件加速。这些器件以 28nm 芯片工艺为基础,集成 HKMG 技术以更低的功耗将系统性能实现最大化。所有 Xilinx 器件都具有很长的产品生命周期,可降低淘汰风险。这些因素的综合使基于 Xilinx 器件的 HPC 平台能以单芯片提供高达 2 TFLOPS 的高处理性能,且功耗远低于 GPU 和多核 DSP
基于AMD EPYC CPU和AMD Instinct加速器的Frontier超级计算机在Top500、Green500和HPL-AI性能排行榜上获得第一名
近年来,向基于NAND闪存的存储迁移和非易失性存储器快车®(NVMe™)的引入,为技术公司以不同的方式"做存储"增加了许多机会。实时数字业务的快速增长和多样性要求这种创新,以便实现新的产品和服务。本应用说明介绍了BittWare支持FPGA和MPSoC的250系列加速器产品如何用于让客户为下一代物联网和云基础设施构建高性能、可扩展的NVMe基础架构。
Versal Premium ACAP 系列符合 PCIe 规范修订版 5.0,并且通过每通道 32 GT/s 的传输速度支持全部链路速率。 本视频演示了 Versal Premium ACAP 中面向 PCIe 的两个可用子系统,这在下一代网络和云基础架构中至关重要。
本白皮书探讨了深度卷积深度学习操作在Xilinx自适应设备上实现。 本白皮书旨在提供针对不同Xilinx器件的多种优化策略,以满足各种任务要求。 在边缘方面,Xilinx实现了轻量级的深度卷积引擎,该引擎支持相应的计算要求。
本文针对上海证券交易所的行情发布系统,采用Verilog硬件描述语言,在FPGA加速卡上开发了对行情信息流的以太网,IP和UDP以及FAST协议的硬件解码,设计了支持指令集编程的微指令加速引擎。与传统的基于软件的方法相比,本文提出的专用硬件处理方案延时可降低10倍以上。
随着5G时代的到来,用户能直观感受到在网络电子产品上的应用会得到更多享受,智能化的3D技术、游戏、高清画质的视频与电影、直播互动都可以升级体验的娱乐方式,而以上应用对低时延要求的使用场景需要适应日益加快的生活节奏和人与网络间更高交互要求的挑战。
该设计示例演示了如何使用二进制神经网络 (BNN) 加速软件实现的神经网络及可编程逻辑。该演示显示,与纯 CPU 相比,基于 Zynq® UltraScale+™ MPSoC 的电路板可将图像分类速度提高 6000 (Ultra96) 到 8000 倍 (ZCU102)。用户可通过图形用户界面查看指标、图像和分类结果。
Xilinx 和 Hewlett Packard Enterprise(HPE)建立了最终用户解决方案,该解决方案使用 HPE ProLiant DL385 Gen10 Plus 服务器和第二代 AMD EPYC 处理器实现革命性的性能。
随着在数据驻留位置附近对数据进行处理的性能优势得到充分体现,计算存储持续受到广泛关注。行业的发展势头正在形成,存储网络工业协会 (SNIA) 等组织正在通过计算、存储器和存计划帮助定义计算存储的方式、内容、位置和原因。SNIA 帮助确定的计算存储类型之一是计算存储处理器 (CSP)
在此视频中,我们展示了一个 Xilinx 实时视频服务器一体机参考架构,该一体机使用 8 个 Alveo™U50 数据中心加速卡构建。使用此架构,在带有 AMDEPYC® 处理器的 HPE Proliant DL-385 服务器上实现高质量 1080p 实时视频流的实时解码/编码。