嵌入式处理

赛灵思致力于通过其目标设计平台提供嵌入式开发工具、方法、IP 和技术支持。面向嵌入式处理的目标设计平台将这些元素带入了产品化解决方案,为有经验的用户加快了开发速度,并且为新用户简化了 FPGA 应用。赛灵思嵌入式处理解决方案得到了大量 Virtex 和 Spartan FPGA 平台的支持。

欢迎参加国际数据中心可重配置加速研讨会

时间:2018 年 6 月 12 日

地点:北京国家会议中心 | 北京市朝阳区天辰东路 7 号

第 32 届 ACM 国际超级计算会议(ICS 2018)同期研讨会之一。

在第 32 届 ACM 国际超级计算会议(ICS 2018)在北京举行之际, 由美国赛灵思公司主导的为期一天的“国际数据中心可重配置加速研讨会”将于 6 月 12 日同期举行。

研 讨 会 概 述
随着通用处理器的规模由于“暗硅 ( Dark Silicon)”的局限性而不断缩减,定制化的硬件加速器(如 FPGA,CGRA和ASIC )在现代数据中心得到了越来越多的关注,因为它们的功耗更低,性能更高而延迟时间更短,能效更高。微软在其数据中心部署FPGA,亚马逊、阿里巴巴、百度、华为和腾讯支持FPGA公有云的发布,以及Google的TPU云的部署,所有的这些都在证明,将定制硬件加速器集成到数据中心被认为是维持未来数据中心增长的最有前景的方法之一。

Xilinx推出Virtex UltraScale+ HBM FPGA!

作者:Steve Leibson,编译:stark

早在2016年Xilinx就提出了开发Virtex UltraScale+ HBM FPGA器件,在上周举办的硅谷大会上Xilinx首次亮相了Virtex UltraScale+ HBM XCVU37P FPGA器件,Xilinx已经对其进行了测试,支持全速460Gbytes/sec的带宽通信,此外它的资源也是相当的丰富:

  • 2852K 系统逻辑单元
  • 9Mbits BRAM资源
  • 270Mbits 的UltraRAM资源
  • 9024 DSP48E2 slices
  • 集成8GB HBM DRAM
  • 96个32.75Gbps GTY SerDes 收发器
  • 图1:Xilinx推出的Virtex UltraScale+ HBM系列FPGA

    rENIAC 可通过 AWS F1 实例实现数据存储加速即服务,无需重新构建或重新编译应用代码,便可解决客户数据中心的低效率问题。

    使用系统优化编译器加速汽车电子产品设计

    作者:Giles Peckham 和 Adam Taylor

    得益于摩尔定律,汽车电气系统经历了快速的技术增长。现代化的汽车已获得长足发展,不再是耦合了 AM 无线电的简单发动机电气系统。如今现代化的汽车搭载了多种高级电子系统,能够执行发动机控制、高级驾驶员辅助系统 (ADAS)、牵引力与稳定性控制、信息娱乐等功能,此外还针对某些尖端应用提供了自主操作能力。

    这种汽车内电子系统部署的显著增长也带来了几个必须由设计人员解决的挑战:
    ● 性能 – 需要实时、低时延与高确定性的性能以实现例如 ADAS、ECU、牵引力与稳定性控制等多种车载功能。
    ● 安全 – 汽车电子系统实现关键功能,故障会导致受伤或死亡。因此,系统必须实现信息安全保障与防篡改技术,以防止未授权的修改。
    ● 安全性 – 必须符合 ISO26262 规定的汽车安全完整性水平。
    ● 接口 – 必须能够连接多种传感器、驱动器与其他制动器。
    ● 功率效率 – 必须在有限的功耗预算内高效运行。
    ● 软件定义 – 具备高灵活性以适应多种市场中的不同标准与条件。

    基于Zynq Z-7100的工业级SoM:TE0782-02-100-2I

    作者:Steve Leibson,编译:Stark

    TE0782 SoM是Trenz电子推出的一款基于Xilinx Zynq Z-7100 SoC(XC7Z100-2FFG900I)的高性能工业级核心模块,Xilinx Zynq Z-7100 SoC目前是Zynq-7000系列中资源最为丰富的一款器件,除了双核ARM Cortex-A9 MPCore处理器,其他资源包括444K逻辑单元、26.5Mbits BRAM内部存储、2020个DSP48 slices。此外它还集成了1GBytes DDR3 SDRAM、4 GByte eMMC、 16 GTX高性能收发器、 32 MBytes QSPI Flash 存储等,板卡的背面是三个160-pin高速I/O扩展连接器,整体尺寸仅为8.5 x 8.5 cm:

    图1:Trenz TE0782-02-100-2I SOM的正面

    Vivado HLS嵌入式实时图像处理系统的构建与实现

    作者:张艳辉,郭洺宇,何 宾

    摘 要: 传统的基于CPU、GPU和DSP的处理平台难以满足图像实时处理的要求,而FPGA在并行图像处理上有着独一无二的优势,在性能和成本之间提供更加灵活的选择。通过Xilinx最新的Vivado HLS工具,设计实现了可变参数的拉普拉斯算子图像滤波算法,并且在ZYNQ-7000 SoC上构建了可视化的实时嵌入式图像处理系统。实验结果表明,系统可以实现不同的图像处理算法,很好地满足了图像处理的实时性、高性能、低成本要求,对未来高性能图像处理系统的设计和实现提供了很好的借鉴。

    0 引言

    CPU vs FPGA?图像处理谁更“应景”?

    作者:Brandon Treece,NI总部数据采集和控制产品市场经理

    机器视觉在工业自动化系统中的应用已经有一定的历史,它取代了传统的人工检查,提高了生产质量和产量。 我们已经看到了相机在计算机、移动设备和汽车等日常生活设备中的迅速普及,但是机器视觉的最大进步莫过于处理能力。随着处理器的性能以每两年翻一番的速度不断提升,以及多核CPU和FPGA等并行处理技术日益受到关注,视觉系统设计人员现在可以应用复杂的算法来可视化数据,并创建出更加智能的系统。

    性能的提高意味着设计人员可以获得更高的数据吞吐量,从而实现更快速的图像采集,使用更高分辨率的传感器,并充分利用市场上具有最高动态范围的一些新款相机。性能的提高不仅可让设计人员更快速地采集图像,而且还能更快速地处理图像。预处理算法(如阈值和滤波)或处理算法(如模式匹配)也可以更快速地执行。最终设计人员能够比以往更快地基于可视化数据制定决策。

    德州奥斯汀NI总部数据采集和控制产品市场经理,主要负责机器视觉领域的Brandon Treece认为,随着视觉系统越来越多地集成最新一代多核CPU和强大FPGA,视觉系统设计人员需要了解使用这些处理元件的好处和得失。他们不仅需要在正确的硬件上运行正确的算法,还需要了解哪些架构最适合作为其设计的基础。

    作者:Sleibso,编译:csc57

    TEWS科技的TXMC638型号24通道,16位,每通道5M样本/秒采样率的XMC卡将24个ADC通道 (采用凌力尔特LTC2323-16 模数转换芯片,采样率5Msps,逐次逼近型寄存器) 集成到可编程数据采集系统上,板卡上载有赛灵思的Kintex-7 FPGA(K160T,K325T或K410T)与1GB32位宽的板上DDR3 SDRAM芯片。除此之外,TXMC638还提供三个100欧姆交流耦合,宽输入电压范围的差分输入端子,所有的输入输出口和三个100欧姆的输入端子都连接在98个引脚的Samtec ERF8-049接插件端子。TXMC638上的FPGA已经装载了参考设计,用户除了可以使用赛灵思的USB编程器对FPGA编程,还可以通过板上的配置控制器(BCC)下载设计。对于在系统编程,FPGA通过串口SPI闪存配置,实时调试与读取可以通过JTAG口。对于PCIe标准,Xilinx Tandem配置可以用来配置FPGA, ”Tandem PROM“ 是推荐的方法集。XMC采集卡的框图如下:

    在Arty Z7上入门Xilinx SDSoC开发工具

    作者:阿Q 来源:开源硬件创客坊微信公众号

    细心的小伙伴们可能早已留意到,在Digilent今年全新出品的Zynq评估板中,无论是第二代经典入门级的Zynq™ Board - ZYBO Z7,还是创客最爱的ARTY Z7,都全面支持Xilinx SDSoC开发环境。意味着如果你是一名系统或软件工程师,现在无需深度的硬件专业知识,就能广泛地利用Zynq® SoC,畅享超过100倍的软件性能加速。

    本篇干货教程中,我们就将带你入门了解如何使用Xilinx SDSoC工具来创建嵌入式C/C++/OpenCL应用开发,并实现直接在ARTY Z7嵌入式视觉开发平台的器件上进行软件设计。

    SDSoC软硬协同设计与其开发流程

    由于集成了ARM处理器内核与可编程逻辑,对于众多应用开发而言,Zynq 非常的灵活。这意味着开发人员可以将设计按不同的元素来优化划分,例如将其中那些高层次决策的部分放入ARM内核(PS端),并将诸如图像处理流水线等需要加速的部分用可编程逻辑(PL端)来实现。

    当然,传统的Zynq开发流程会将Vivado和SDK分离开来,这种方法很难在可编程逻辑(PL)和处理系统(PS)之间分配功能,因此无法获得最优的系统性能。

    作者 张国斌
    今天,全球第一款采用16nm FinFET+工艺的异构多核处理器投片了!这就是赛灵思公司采用台积电16nm 16FF+ (FinFET plus)工艺的Zynq UltraScale+MPSoC,这款异构多核处理器整合了四核ARM Cortex A53处理器、双核ARM Cortex R5处理器,还有ARM Mali-400 MP GPU 和H.265/264 视频编解码单元,并有支持DDR4, LPDDR4, DDR3, DDR3L和LPDDR3 的内存控制器!当然它还有大量FPGA处理单元和大量UltraScale DSP48E2 DSPslices以及硬化的PCIeGen2/Gen3/Gen4 个100G 以太网模块!毫不夸张地说,这是迄今最强大最高级工艺的异构处理器。

    16FF+是标准的16nm FinFET的增强版本,号称可比20nmSoC平面工艺性能提升多达40%,或者同频功耗降低最多50%。在次工艺节点上,Cortex-A57大核心能够跑到2.3GHz,Cortex-A53小核心则能做到75mW。

    同步内容