CPU

CPU vs FPGA?图像处理谁更“应景”?

作者:Brandon Treece,NI总部数据采集和控制产品市场经理

机器视觉在工业自动化系统中的应用已经有一定的历史,它取代了传统的人工检查,提高了生产质量和产量。 我们已经看到了相机在计算机、移动设备和汽车等日常生活设备中的迅速普及,但是机器视觉的最大进步莫过于处理能力。随着处理器的性能以每两年翻一番的速度不断提升,以及多核CPU和FPGA等并行处理技术日益受到关注,视觉系统设计人员现在可以应用复杂的算法来可视化数据,并创建出更加智能的系统。

性能的提高意味着设计人员可以获得更高的数据吞吐量,从而实现更快速的图像采集,使用更高分辨率的传感器,并充分利用市场上具有最高动态范围的一些新款相机。性能的提高不仅可让设计人员更快速地采集图像,而且还能更快速地处理图像。预处理算法(如阈值和滤波)或处理算法(如模式匹配)也可以更快速地执行。最终设计人员能够比以往更快地基于可视化数据制定决策。

德州奥斯汀NI总部数据采集和控制产品市场经理,主要负责机器视觉领域的Brandon Treece认为,随着视觉系统越来越多地集成最新一代多核CPU和强大FPGA,视觉系统设计人员需要了解使用这些处理元件的好处和得失。他们不仅需要在正确的硬件上运行正确的算法,还需要了解哪些架构最适合作为其设计的基础。

认识多种处理芯片的特性和实战

注:本文仅代表个人观点不代表本网观点

作者:高剑林,腾讯架构平台部,平台开发中心基础研发组组长。先后从事过通讯设备的开发和存储设备的研发工作。目前致力于一体化的涉及—从硬件和软件的结合,以及OS多个层面综合考虑系统设计,找出最优路径的设计思想。

以x86体系为代表的CPU已经占有了桌面和服务器处理器的绝大部分份额,而且这个趋势还在不断增强。CPU具有兼容性强、易编程、应用资源丰富、价格低廉的优势,但是在某些领域,CPU存在天然的缺陷,以FPGA、GPU为代表的硬件可以克服CPU的缺陷,因此也拥有自己的市场。

1.1 图解各类型芯片

从设计软件进行计算任务的软件工程人员的角度,可以将芯片分为CPU、GPU、FPGA和ASIC等类型。

看Mellanox公司如何降低服务器CPU负载!

作者:Stark

Mellanox科技公司成立于1999年,总部位于美国加州的圣塔克拉拉市。目前Mellanox是全球领先的数据中心高速网络解决方案提供商,在全球范围内为服务器和存储提供端到端InfiniBand和以太网互联解决方案。Mellanox提供网卡、交换机、软件和芯片,其高速网络解决方案可以极大的提升数据中心效率,在应用和系统之间快速的传递数据,提升系统可用性,我国的华为公司也是其重要的合作伙伴。

最近Mellanox公司发布了一款新产品,即Innova IPSec 4 Lx EN 40GbE网络适配器板卡。该板卡上集成了Xilinx Kintex UltraScale FPGA器件,将IPsec网络算法的处理任务从服务器CPU中剥离出来放到FPGA中来完成,这无疑降低了CPU负载,打破了网络瓶颈。在FPGA中实现了40 GbE ConnectX-4 Lx EN网络控制器IP,借助其无与伦比的可伸缩性能和高效性为IPSec网络提供安全性和加速功能。(图1:Mellanxo推出的Innova IPSec 4 Lx EN 40GbE网络适配器板卡)

当CPU遭遇能力“天花板”

2014年,联想并购IBM x86服务器业务和摩托罗拉移动(Motorola Mobility)智能手机业务在业界引起广泛的关注。但请注意,其收购金额不过 23亿美元和29亿美元。去年底,一笔涉及167亿美元的并购,却没有在国内引起更多的关注。其实,参与并购的是大名鼎鼎的英特尔,收购的是Altera,一家FPFA的领导厂商,这意味着什么?FPGA和CPU的碰撞会演绎出怎样的火花?

带着这样的疑问,记者独家采访了Xilinx 数据中心营销高级总监Andrew Walsh先生,他和我们分享了FPGA产业发展的最新观点。此前Walsh 担任Nvidia企业和数据中心营销高级总监。


Xilinx 数据中心营销高级总监Andrew Walsh

问:如何看待未来FPGA市场的发展变化?在产品的定位上,FPGA仍然会是Intel CPU、Power和ARM处理器协处理器的角色吗?

这个套件让Power8服务器硬件加速更简单

作者:haoxingheng

在CAPI规范问世之前,使用FPGA来做硬件加速的过程很费劲。它是把FPGA做到一块PCIe板卡里,FPGA通过CPU的PCIe控制器访问主机内存空间。因为所有的CPU线程看到的都是单一虚拟地址空间,CPU不能直接访问PCIe的地址,要先做物理地址映射;反之CPU的物理地址也需要映射到PCIe地址空间。PCIe板卡和处理器之间交互执行路径长而且全程软件参与,同时为了保证Cache一致性,也需要软件做映射。这种处理方式做了太多的工作,开销很大,这样就需要寻求其他的技术来解决,CAPI规范便应运而生。

那么,这里以最快的速度简单的描述下 OpenPOWER CAPI 规范是什么:它提供了一种加速卡和CPU间内存、存储一致性连接的方式,加速卡计算资源和CPU间不再需要CPU线程参与搬运数据。

CAPI体系(图片来自IBM)

赛灵思认证联盟成员 ClusterTech 公司在本视频展示了他们的JPEG图像解码加速方案,包括缩放,裁剪以及编码等。演示板卡使用赛灵思 Kintex-7 FPGA,其执行速度比一个典型的CPU架构服务器快了一个数量级。

Mellanox 公司演示了他们的 ConnectX-4 LX 可编程适配器,该产品通过将部分数据处理逻辑迁移至板载FPGA上,可以为用户提供降低CPU负载的最大限度的灵活性,并同时可以用到Mellanox网络控制器的基于硬件I/O隔离优势和无与伦比的可扩展性和效率。

使用C++库开发OpenCL图像应用

作者:
Stephen Neuendorffer,赛灵思公司 Vivado HLS 首席工程师 stephenn@xilinx.com
Thomas Li 赛灵思公司 Vivado HLS 软件工程师 thl@xilinx.com
Fernando Martinez Vallina 赛灵思公司 SDAccel 开发经理 vallina@xilinx.com

赛灵思 SDAccel 开发环境借助现有库之力加快应用设计速度。

随着线上图片与视频、机器人和驾驶员辅助应用的快速推广,近年来成像应用的规模和普及率均在提升。这些领域的核心算法非常相似,都需要一种能够让应用开发人员根据市场和部署目标迅速实现产品重构与差异化的开发方法。

针对这样的需求,成像应用一般先从针对 CPU 的软件程序开始,使用库调用功能来调用标准函数。软件设计方法与随时可用的库相结合,不仅可以轻松启动开发工作,而且还容易在桌面上开发出功能正确的应用。

作者:赵效民 来源:ZD至顶网服务器频道 

什么是异构计算?可能在很多人看来感觉高深莫测,我们可以先用一个比喻来简单的解释一下。比如在做简单的整数算数时,知道算法口诀的人,心算即可,但遇到比较复杂的算数问题时,就得需要一个计算器了,但在这个运算过程中,一些简单的计算可以提前由心算完成再输入计算器,比如计算“(5+2)÷26”,可能我们直接就输入“7÷26”了。又或者是完全交给计算器进行计算,但这也需要人脑控制手指进行计算器的数值输入,此时你的大脑与计算器就构成了完成这道数学计算任务的“异构计算系统”。

日常生活中最常见的异构计算——人脑+计算器

日常生活中最常见的异构计算——人脑+计算器

问题:CPU的频率和DDR频率不相同时,对PL的部分会有什么影响吗专家答复:没有特别的影响,因为AXI Interconnect有FIFO, 允许Master和Slave有不同的时钟频率。

同步内容