数据存储与处理

赛灵思可编程器件针对SAN和NAS提供优化的以应用为中心的数据处理解决方案

Alveo U250 数据中心加速器卡

Xilinx® Alveo™ U250 数据中心加速器卡旨在满足现代数据中心不断变化的需求,为重要工作负载(包括机器学习推断、视频转码和数据库搜索与分析)提供比 CPU 高 90 倍的性能。Alveo 加速器卡建立在 Xilinx 16 nm UltraScale™ 架构基础之上,能适应不断变化的加速要求和算法标准,能在不改变硬件的情况下,加速任何工作负载,并能降低总体拥有成本。

启用 Alveo 加速器卡是 Xilinx 及合作伙伴应用的一个生态系统,主要面向数据中心的工作负载。对于定制解决方案,Xilinx 应用开发工具套件 (SDAccel™) 和机器学习套件可为开发人员提供将差异化应用推向市场的各种工具。

主要性能和优势

快速 — 最高性能
就重要工作负载而言,性能比 CPU 高 90 倍,成本仅为 CPU 的 1/3
与基于 GPU 的解决方案相比,推断吞吐量提高 4 倍以上并具有 3 倍的时延优势

灵活应变 — 加速任何工作负载
使用相同的加速器卡对视频处理至任何工作负载进行机器学习推断
随着工作负载算法的发展,使用可重配置硬件,适应性比固定功能加速器卡产品使用周期更快

Alveo U200 数据中心加速器卡

Xilinx® Alveo™ U200 数据中心加速器卡旨在满足现代数据中心不断变化的需求,为重要工作负载(包括机器学习推断、视频转码和数据库搜索与分析)提供比 CPU 高 90 倍的性能。Alveo 加速器卡建立在 Xilinx 16 nm UltraScale™ 架构基础之上,能适应不断变化的加速要求和算法标准,能在不改变硬件的情况下,加速任何工作负载,并能降低总体拥有成本。

启用 Alveo 加速器卡是 Xilinx 及合作伙伴应用的一个生态系统,主要面向数据中心的工作负载。对于定制解决方案,Xilinx 应用开发工具套件 (SDAccel™) 和机器学习套件可为开发人员提供将差异化应用推向市场的各种工具。

主要性能和优势

快速 — 最高性能

  • 就重要工作负载而言,性能比 CPU 高 90 倍,成本仅为 CPU 的 1/3
  • 与基于 GPU 的解决方案相比,推断吞吐量 提升 3 倍以上并具有 3 倍的时延优势
  • 灵活应变 — 加速任何工作负载

  • 使用相同的加速器卡对视频处理至任何工作负载进行机器学习推断
  • 适用于包处理的 Xilinx 智能解决方案

    在开放式协作服务爆炸性增长以及移动和社交网络不断发展的推动下,结合智能设备的普及以及不同服务供应商和企业领域内体验质量 (QoE) 需求一致化的大趋势,动态托管数据包处理的需求正在不断快速发展。

    Xilinx 推出了各种丰富的 Smarter Solution(智能解决方案),将流量控制、优先级和监控功能扩展到单个数据包、会话或应用的粒度级上。这些解决方案支持网络设备检查和操控数据包报头和负载内容,并动态应用高级路由策略。此外,这些 Xilinx 智能方案还能与安全、加密和 RegEx 功能方便集成。

    【视频】PBX: 基于云实现的数据存储加速服务

    本视频由 rENIAC 公司 带来,rENIAC 公司是一家专业从事数据中心业务的公司。他们的产品可通过亚马逊 AWS F1 实例实现数据存储加速服务,采用赛灵思 FPGA 后,无需重新构建或重新编译应用代码,便可解决客户数据中心的低效率问题。

    5月4日,阿里云宣布新一代FPGA计算实例F3启动邀测。该产品基于自研超高性能FPGA加速卡打造,可在云上实现FPGA加速业务的快速研发、安全分发、一键部署和弹性伸缩,为人工智能产业、图片视频转码、基因计算提供加速服务,在特定场景下的处理效率比CPU高百倍。

    官网显示F3采用阿里云自研超高性能FPGA加速卡,搭载Xilinx 16nm Virtex UltraScale+ 器件VU9P,提供最高16个VU9P芯片的实例规格,此次对外发布邀测的实例规格支持4个VU9P芯片,此实例提供超过一千万逻辑单元,和高达47 TeraMACs 的DSP计算能力。

    据了解,阿里云自主研发的高性能FPGA加速卡在诸多技术方面进行了创新:

    1. 采用了创新的单卡双芯片设计,提高了计算密度,降低单位计算力的成本;

    2. 卡内双芯片高速互联,带宽高达600Gbps,支持多种轻量级传输协议,传输效率95%

    3. 卡间互连,通过硬核支持100Gbps Mac协议;

    4. 提供实时健康监控能力,可感知底层故障,实时报警;

    5. 首创的统一FPGA SHELL架构快速支持OpenCL,HLS以及RTL的开发流程,支持多种DMA访存加速,能够让多种应用程序开发的工程师更快捷的完成异构计算的定制开发工作;

    欢迎参加国际数据中心可重配置加速研讨会

    时间:2018 年 6 月 12 日

    地点:北京国家会议中心 | 北京市朝阳区天辰东路 7 号

    第 32 届 ACM 国际超级计算会议(ICS 2018)同期研讨会之一。

    在第 32 届 ACM 国际超级计算会议(ICS 2018)在北京举行之际, 由美国赛灵思公司主导的为期一天的“国际数据中心可重配置加速研讨会”将于 6 月 12 日同期举行。

    研 讨 会 概 述
    随着通用处理器的规模由于“暗硅 ( Dark Silicon)”的局限性而不断缩减,定制化的硬件加速器(如 FPGA,CGRA和ASIC )在现代数据中心得到了越来越多的关注,因为它们的功耗更低,性能更高而延迟时间更短,能效更高。微软在其数据中心部署FPGA,亚马逊、阿里巴巴、百度、华为和腾讯支持FPGA公有云的发布,以及Google的TPU云的部署,所有的这些都在证明,将定制硬件加速器集成到数据中心被认为是维持未来数据中心增长的最有前景的方法之一。

    作者:北楼

    阿里妹导读:X-Engine 是集团数据库事业部研发的新一代存储引擎,也是新一代分布式数据库X-DB的根基。在线事务处理的数据库存储引擎中,如何有效率的回收多版本的旧数据一直是一个难题,尤其在write intensive的应用中,事务处理无可避免受到后台任务的干扰(compaction or vacuum),引入异构计算设备来offloading这些任务的想法由来已久,但是真正想要应用起来确有难度。

    今天,我们将为大家详细介绍带有FPGA加速的X-Engine存储引擎。这篇文章不仅仅讲述如何设计并实现出更高效的FPGA逻辑,还有如何提升I/O,做好混合负载调度、容错等。"平稳"二字,看似波澜不惊,实则暗藏巨浪。

    前言

    Xilinx推出Virtex UltraScale+ HBM FPGA!

    作者:Steve Leibson,编译:stark

    早在2016年Xilinx就提出了开发Virtex UltraScale+ HBM FPGA器件,在上周举办的硅谷大会上Xilinx首次亮相了Virtex UltraScale+ HBM XCVU37P FPGA器件,Xilinx已经对其进行了测试,支持全速460Gbytes/sec的带宽通信,此外它的资源也是相当的丰富:

  • 2852K 系统逻辑单元
  • 9Mbits BRAM资源
  • 270Mbits 的UltraRAM资源
  • 9024 DSP48E2 slices
  • 集成8GB HBM DRAM
  • 96个32.75Gbps GTY SerDes 收发器
  • 图1:Xilinx推出的Virtex UltraScale+ HBM系列FPGA

    Zynq的BRAM操作及PS端操作Bug思考

    作者: 高视,FPGA2嵌入式

    1. BRAM介绍

    BRAM 就是Block Memory,是Zynq的PL端的存储RAM单元,可以配置为双口RAM,用于实现Zynq中PS端到PL端的数据交互和共享,类似为Linux中的内存共享,也就是将数据写入共同可访问的数据空间,PS和PL端各自访问来达到信息交流的目的。

    在这里我们有这样一种比较好的思维推荐:可以在一个BRAM中将一部分地址空间用于PS只写PL只读,剩下的地址空间用于PL只写PS只读。这样PS和PL之间的访问就不会出现读写冲突错误,当然,你也可以用2个BRAM来实现。

    2. BRAM的PL端使用

    BRAM的访问可以通过AXI总线访问或者把它当做RAM用读写逻辑操作。

    rENIAC 可通过 AWS F1 实例实现数据存储加速即服务,无需重新构建或重新编译应用代码,便可解决客户数据中心的低效率问题。

    同步内容