数据存储与处理

赛灵思可编程器件针对SAN和NAS提供优化的以应用为中心的数据处理解决方案

欢迎参加国际数据中心可重配置加速研讨会

时间:2018 年 6 月 12 日

地点:北京国家会议中心 | 北京市朝阳区天辰东路 7 号

第 32 届 ACM 国际超级计算会议(ICS 2018)同期研讨会之一。

在第 32 届 ACM 国际超级计算会议(ICS 2018)在北京举行之际, 由美国赛灵思公司主导的为期一天的“国际数据中心可重配置加速研讨会”将于 6 月 12 日同期举行。

研 讨 会 概 述
随着通用处理器的规模由于“暗硅 ( Dark Silicon)”的局限性而不断缩减,定制化的硬件加速器(如 FPGA,CGRA和ASIC )在现代数据中心得到了越来越多的关注,因为它们的功耗更低,性能更高而延迟时间更短,能效更高。微软在其数据中心部署FPGA,亚马逊、阿里巴巴、百度、华为和腾讯支持FPGA公有云的发布,以及Google的TPU云的部署,所有的这些都在证明,将定制硬件加速器集成到数据中心被认为是维持未来数据中心增长的最有前景的方法之一。

作者:北楼

阿里妹导读:X-Engine 是集团数据库事业部研发的新一代存储引擎,也是新一代分布式数据库X-DB的根基。在线事务处理的数据库存储引擎中,如何有效率的回收多版本的旧数据一直是一个难题,尤其在write intensive的应用中,事务处理无可避免受到后台任务的干扰(compaction or vacuum),引入异构计算设备来offloading这些任务的想法由来已久,但是真正想要应用起来确有难度。

今天,我们将为大家详细介绍带有FPGA加速的X-Engine存储引擎。这篇文章不仅仅讲述如何设计并实现出更高效的FPGA逻辑,还有如何提升I/O,做好混合负载调度、容错等。"平稳"二字,看似波澜不惊,实则暗藏巨浪。

前言

Xilinx推出Virtex UltraScale+ HBM FPGA!

作者:Steve Leibson,编译:stark

早在2016年Xilinx就提出了开发Virtex UltraScale+ HBM FPGA器件,在上周举办的硅谷大会上Xilinx首次亮相了Virtex UltraScale+ HBM XCVU37P FPGA器件,Xilinx已经对其进行了测试,支持全速460Gbytes/sec的带宽通信,此外它的资源也是相当的丰富:

  • 2852K 系统逻辑单元
  • 9Mbits BRAM资源
  • 270Mbits 的UltraRAM资源
  • 9024 DSP48E2 slices
  • 集成8GB HBM DRAM
  • 96个32.75Gbps GTY SerDes 收发器
  • 图1:Xilinx推出的Virtex UltraScale+ HBM系列FPGA

    Zynq的BRAM操作及PS端操作Bug思考

    作者: 高视,FPGA2嵌入式

    1. BRAM介绍

    BRAM 就是Block Memory,是Zynq的PL端的存储RAM单元,可以配置为双口RAM,用于实现Zynq中PS端到PL端的数据交互和共享,类似为Linux中的内存共享,也就是将数据写入共同可访问的数据空间,PS和PL端各自访问来达到信息交流的目的。

    在这里我们有这样一种比较好的思维推荐:可以在一个BRAM中将一部分地址空间用于PS只写PL只读,剩下的地址空间用于PL只写PS只读。这样PS和PL之间的访问就不会出现读写冲突错误,当然,你也可以用2个BRAM来实现。

    2. BRAM的PL端使用

    BRAM的访问可以通过AXI总线访问或者把它当做RAM用读写逻辑操作。

    rENIAC 可通过 AWS F1 实例实现数据存储加速即服务,无需重新构建或重新编译应用代码,便可解决客户数据中心的低效率问题。

    可编程逻辑实现数据中心互连

    作者:Faisal Dada , Adam Taylor

     随着实施基于云的服务和机器到机器通信所产生的数据呈指数级增长,数据中心面临重重挑战。

      这种增长毫无减缓态势,有业界专家预测内部数据中心机器对机器流量将会超出所有其他类型流量多个数量级。这种显著增长给数据中心带来三个主要挑战:

  • 数据速度 - 接收与处理数据所需的时间增强了数据的接收和处理能力,实现高速传输。这使数据中心可支持近乎实时的性能。
  • 数据种类 - 从图像与视频这样的结构化数据到传感器与日志数据这样的非结构化数据,可将不同格式的数据传输进来。
  • 数据量 - 所有用户提供的数据量。
  •   对于众多应用来说,应对这些挑战需要数据中心之间的直接通信。例如,提供索引、分析、数据同步、备份与恢复服务。为支持数据中心间的通信,需要使用非常大的数据管道,同时,用于在这些管道间传输数据的网络通常称为数据中心互连 (DCI)。

      DCI 发挥着举足轻重的作用,有助于数据中心部署规模扩展,支持更多数数据中心以在给定地理区域内铺开服务。当然,随着数据中心数量的增加,它们之间的互连程度也会随之增强。

    作者:Steve Leibson ,蒙面侠客

    背景:
    在大数据的时代背景下,不仅需要强大的云服务器来进行数据的处理和存储,在数据通道上也需要重兵把控,因为,一不小心数据中心就可能受到恶意数据的侵扰,如果造成了云服务器的网络攻击或者秘密的泄露,那么对云服务器厂家和用户都会带来不可估量的损失。那么,这个“重兵”需要有什么样的素质呢?今天本侠就带各位来领略一下Accolade的新款ANIC-200Kq网卡数据处理适配器。

    ANIC-200Kq是一件艺术品,如图.1所示,有两个100G的PCIe接口的适配器,满足了网络监控和安全的应用。Accolade的新款ANIC-200Kq数据流分类、过滤适配器在100GbE的带宽下通过QSFP28光笼进行数据包的处理、存储优化和可扩展数据流的分类。与去年介绍的这家公司的ANIC-200Ku丢失数据包捕获适配器相比较,ANIC-200Kq板卡是基于Xilinx UltraScale+ FPGA的产品,所以它能够运行多种线性速度的数据包处理算法,这包括公司新的数据流分流特色算法。

    【视频】基于 Xilinx FPGA 的加速板演示

    在 2017 超算大会上,Bittware 公司向大家展示了其基于赛灵思 Virtex UltraScale+ VU9P FPGA 的板上加速技术,其中还包括了与 AWS F1 实例当中相同的功能集。

    在该演示中,Eideticom 描述 NoLoad,它是一个主要针对 Xilinx FPGA 的存储与计算加速平台。NoLoad 的 NVMe 兼容接口有助于功能加速,从而可通过 NVMe-over-Fabrics 从远程客户端访问。NoLoad 架构随后可用于在整个基于 RDMA的 NVME-over-Fabrics 以太网网络中访问纠删码加速器。

    【视频】:Kortiq 小型高效 CNN 加速器

    Kortiq 提供一款易于使用的、可扩展的小型 CNN 加速器。该器件不仅支持所有类型的 CNN,而且还可动态加速网络中不同类型的层。Xilinx Zynq 系列 SoC 及 MPSoC 不仅可帮助 Kortiq 器件实现所需的性能水平和灵活性,同时还具有低成本优势。

    同步内容