存储器

赛灵思存储器接口解决方案基于硬件验证的参考设计和软件工具,让工程师能够迅速生成您自己的定制设计

作者:北楼

阿里妹导读:X-Engine 是集团数据库事业部研发的新一代存储引擎,也是新一代分布式数据库X-DB的根基。在线事务处理的数据库存储引擎中,如何有效率的回收多版本的旧数据一直是一个难题,尤其在write intensive的应用中,事务处理无可避免受到后台任务的干扰(compaction or vacuum),引入异构计算设备来offloading这些任务的想法由来已久,但是真正想要应用起来确有难度。

今天,我们将为大家详细介绍带有FPGA加速的X-Engine存储引擎。这篇文章不仅仅讲述如何设计并实现出更高效的FPGA逻辑,还有如何提升I/O,做好混合负载调度、容错等。"平稳"二字,看似波澜不惊,实则暗藏巨浪。

前言

在该演示中,Eideticom 描述 NoLoad,它是一个主要针对 Xilinx FPGA 的存储与计算加速平台。NoLoad 的 NVMe 兼容接口有助于功能加速,从而可通过 NVMe-over-Fabrics 从远程客户端访问。NoLoad 架构随后可用于在整个基于 RDMA的 NVME-over-Fabrics 以太网网络中访问纠删码加速器。

Nallatech推出250S+ 高性能NVMe SSD PCIe加速器板卡

作者:Sleibso,编译:Stark

SSD(Solid State Drives,固态硬盘)由于其能够提供更好的性能在越来越多的场合普及开来,早期的SSD采用SATA1.0/2.0/3.0接口,我们只需要在启动BIOS里面把SATA控制器模式切换成AHCI就可以获得更好的性能,但是最新的SSD存储接口开始采用M.2和SATA-E方式走的都是PCI-E通道,那么AHCI就成了性能瓶颈,因此推出了新的标准NVMe(Non-Volatile Memory express,非易失性存储器标准,是使用PCI-E通道的SSD一种规范)。

NVMe在设计上充分利用了PCIe SSD的低延迟和并行处理的特性,NVMe精简了指令调用方式其延迟只是AHCI的一半不到,此外NVMe标准还提供了不同平台的驱动,目前Windows、Linux、Solaris、Unix、VMware、UEFI等都加入了对NVMe SSD的支持。随着三星、Intel等各大厂商的推动NVMe标准的产品也开始不断从企业级产品进入到消费级市场。

Xilinx Virtex UltraScale+ FPGA VCU1525 加速开发套件

是想要充分利用 Virtex® UltraScale+™ FPGA 高级功能的数据中心应用开发人员的理想选择。这款 PCIe® 开发板可在云端访问,也可通过框架、库、驱动程序和开发工具进行内部访问,从而可通过 Xilinx SDAccel™ 开发环境使用 OpenCL™、C、C++ 和 RTL 轻松进行应用编程。

被动式冷却版本

主要性能和优势

  • 可重新编程的专用硬件适应于计算密集型应用,专门针对实况视频转码、数据分析、基因组学以及机器学习的快速增长市场
  • 符合双插槽 PCIe 全长全高外形标准
  • 可采用支持达 225W 的电路板通过服务器 CPU 实现 10 至 100 倍的性能加速
  • 定制电路板支持的 SDAccel 平台参考设计
  • 采用 SDAccel 开发环境,支持 OpenCL、C、C++ 和 RTL
  • VU9P Virtex UltraScale+ FPGA
  • 21 个 TOP(8 位整数精度)
  • [PBX]:基于云的基因组分析算法实现

    本实例由 Edico Genome 公司带来,基于“云”的基因组分析算法演示。该演示使用了基于赛灵思 All Programmable FPGA 的 AWS F1 实例实现,在使用 AWS F1 实例后,Edico Genome 可以以更低的成本为更为广泛的用户群体提供兼具高准确度,硬件加速的基因组流水线算法实现 —— 只需一个 F1 实例,即可替代多达 80 个的传统计算实例以及相关成本。

    作者:Sleibso,编译:Stark

    Edico Genome公司之前就曾开发出了基因组分析算法,为了实现算法加速,该公司原本打算开发一个ASIC(精简指令集)处理器,但是这种方案灵活性太差,尤其是随着算法的更新,计算性能需求的增加这种方案可能就不能够满足需求了,此外开发一个ASIC处理器也需要较长的时间周期。因此Edico Genome公司将注意力转移到FPGA上,FPGA的灵活性非常适合这种不断迭代开发的需要,随后该公司推出了基于Xilinx 28nm FPGA的Dragen加速器板卡用于基因组分析算法的加速。

    图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

    图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

    作者:Sleibso,编译:Stark

    Accolade公司推出了第三代双端口100G网络ANIC-200Ku PCIe无损数据包采集适配器,该板卡是基于Xilinx UltraScale FPGA,能够从3200万网络数据流中实时分析每一个数据包,系统正常运行情况下功耗只需要50W左右,能够在4纳秒的精度内为每一个网络数据包打上时间戳。ANIC-200Ku集成了两个CFP4网线适配器接口(Optical Cage),我们可以将两个ANIC-200Ku进行直连来实现200Gbps无损高聚合数据流的网络。

    作者:清风流云

    随着各大处理器处理速度的提高,特别是前几年Intel和IBM在CPU运行速度的竞争环境下,整个CPU运行速度的发展基本符合摩尔定律,但是近十年来,CPU的速度提升就变得十分缓慢了,个人认为最主要的原因有两点,其一就是工艺,其二就是访存,数据放在存取区域中,很难快速的load到core中。同样在各大设计应用中,存储器的IO速度问题越来越突出,那么到今天为止,在memory access上的的IO速度是否出现了一些突破呢?

    Everspin’s nvNITRO NVMe card:

    赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))在2017 年闪存峰会上展示了可重配置存储加速解决方案。通过一系列的演示和介绍,赛灵思及其生态系统重点展示了用于当前和下一代企业和数据中心应用的高性能存储解决方案。在今年的闪存峰会上首次公开亮相的赛灵思NVMe-over-Fabrics参考设计为设计人员提供了灵活的平台,不仅可以帮助设计者实现可扩展的存储解决方案,而且还能帮助他们将定制加速功能集成到其存储阵列中。该参考设计无需专用 x86 处理器或外接网卡,因此能开发出高度集成、稳健可靠的低成本解决方案。

    赛灵思在展会上的演示与参与的小组讨论包括

  • 面向下一代 NVMe 平台的可重配置存储加速
  • Virtex UltraScale+ HBM FPGA:革命性提升存储器的性能

    作者 :Mike Wissolik、Darren Zacher、Anthony Torza 和 Brandon Day

    数据中心、有线应用及其它带宽密集型应用所需的性能,远远高于传统的 DRAM 技术。和市场上已有的存储器相比,HBM 存储器在性能、功耗和尺寸上,能为系统架构师和 FPGA 设计人员带来前所未有的优势。

    摘要
    在过去的十年里,电子系统在计算带宽上呈现出指数级的增长。计算带宽的大幅提升,也显著提高了存储带宽要求,以满足计算需求。这类系统的设计人员经常发现市场上的并行存储器(例如 DDR4)再也无法满足应用的带宽需求。赛灵思支持高带宽存储器 (HBM) 的 FPGA 能够以最低的功耗、尺寸和系统成本提供高带宽,显然能够轻松应对这类挑战。在设计这款 FPGA 的过程中,赛灵思与其他领先半导体厂商一样,选择了业界唯一经过证明的堆叠硅片互联技术(即台积电 (TSMC) 的 CoWoS 集成工艺)。这篇白皮书将介绍赛灵思 Virtex®UltraScale+ ™ HBM 器件如何满足大幅提升的系统存储带宽需求,同时保持功耗、尺寸和成本在限定范围内。

    同步内容