GPU

作者 :Cathal Murphy 和 Yao Fu

赛灵思 All Programmable FPGA 和 SoC 针对一系列计算密集型工作负载提供最高效、最具成本效益、时延最低、最具设计灵活性并且满足未来需求的计算平台。

摘要:为了满足不断攀升的数据处理需求,未来系统需要在计算能力上大幅改进。传统解决方案(例如 x86 处理器)再也无法以高效、低成本的方式提供所需的计算带宽,系统设计人员必须寻找新的计算平台。FPGA 和 GPU 越来越多地被系统设计人员看好,认为它们能够满足未来需求的计算平台。为新时代提供必要的计算效率和灵活性,本文将对 GPU 以及赛灵思 FPGA和 SoC 器件进行分析。

简介
未来系统(例如云数据中心 [DC] 和自动驾驶汽车)需要在计算能力上大幅改进,以支持不断增多的工作负载以及不断演进的底层算法 [ 参考资料 1]。例如,大数据分析、机器学习、视觉处理、基因组以及高级驾驶员辅助系统 (ADAS) 传感器融合工作负载都在促使计算性能能以低成本、高效的方式实现提升,并且超出现有系统(例如 x86 系统)的极限。

为了满足数据处理日益增长的需求,未来的系统应该在计算能力上有阶跃性的提升,传统的解决方案(如X86处理器)在计算带宽上显得捉襟见肘,不再是一种高效的方式,因此系统工程师亟待寻找新的计算平台。FPGA和GPU越来越受到系统工程师的关注,它们作为计算平台能够满足未来计算业务的需求,这篇白皮书以高效灵活的计算需求为背景详细分析了GPU、Xilinx FPGA和SoC器件的各种特性。

认识多种处理芯片的特性和实战

注:本文仅代表个人观点不代表本网观点

作者:高剑林,腾讯架构平台部,平台开发中心基础研发组组长。先后从事过通讯设备的开发和存储设备的研发工作。目前致力于一体化的涉及—从硬件和软件的结合,以及OS多个层面综合考虑系统设计,找出最优路径的设计思想。

以x86体系为代表的CPU已经占有了桌面和服务器处理器的绝大部分份额,而且这个趋势还在不断增强。CPU具有兼容性强、易编程、应用资源丰富、价格低廉的优势,但是在某些领域,CPU存在天然的缺陷,以FPGA、GPU为代表的硬件可以克服CPU的缺陷,因此也拥有自己的市场。

1.1 图解各类型芯片

从设计软件进行计算任务的软件工程人员的角度,可以将芯片分为CPU、GPU、FPGA和ASIC等类型。

面向 OpenCL C++  SDAccel 开发环境现已符合 Khronos OpenCL 1.0 标准要求,OpenCL 标准为软件开发人员提供了统一的编程环境,能编写高效的可移植代码,从而能在Xilinx FPGA 上方便地加速各种算法 。

作者:Steve Leibson, 赛灵思战略营销与业务规划总监

在本周新奥尔良市SC14展中,来自Auviz系统的图像处理、计算机视觉、和线性代数库是Xilinx SDAccel开发环境关键要素。(请看“类似于CPU/GPU软件开发环境为OpenCL,C,C++实现基于FPGA的加速应用,使性能/瓦特得到了25倍的提升”)Nagesh Gupta,Auviz的创始人兼CEO,给了我下面2分钟关于他公司产品的视频介绍:

使用LabVIEW进行GPU计算

具有并行处理架构的平台,例如FPGA和GPU,在快速分析大型数据集方面得到了广泛应用。这两项技术可以减轻运算密集型算法对CPU造成的负担,在高度并行的平台上进行处理。FPGA灵活性高、处理延迟低,但是由于容量不足,在浮点运算方面具有一定的局限性。GPU因为其灵活性、便捷性以及低成本的特点,已经成为并行处理的普遍选择。它们可以成功地与FPGA协同工作,优化一个算法的执行速度。举例来说,在一个算法中,当 GPU分析浮点数据时,内联(Inline)计算能够在FPGA上快速地执行。NVIDIA®计算统一设备架构(Compute Unified Device Architecture)CUDA™,,可以帮助创建基于GPU计算的算法,CUDA™允许用户使用C编程语言及其NVIDIA扩展创建程序代码。

同步内容