对标英伟达!赛灵思发布Versal AI Edge系列,软硬件均可升级

本文转载自: 高工智能汽车微信公众号

边缘计算芯片领域已经成为了各大巨头的必争之地。

6月10日,赛灵思针对边缘市场推出了Versal AI Edge系列产品。该产品是一款自适应SoC,采用了7nm Versal架构,是面向下一代分布式智能系统的全球最具可扩展性且灵活应变的产品组合。

根据赛灵思相关负责人透露,Versal AI Edge系列产品将在汽车、工业等领域使用。目前该系列产品的设计文档和支持已对早期试样用户开放,预计在2022年上半年进行早期的量产。

赛灵思一直在强调“自适应计算”这一概念,并定义其为当今创新的驱动力。早在2018年,赛灵思就推出了完全软件可编程的自适应SoC——Versal ACAP(中央计算加速平台),性能与灵活性远超传统CPU\GPU和FPGA,可以在硬件和软件层进行修改。

截止目前,基于Versal ACAP这个异构处理器计算平台,赛灵思已经推出了VersalAI Core、Versal Prime、Versal Premium等系列产品,用于云端和网络。

此次推出的Versal AI Edge系列,便是Versal ACAP产品组合的最新成员,针对低时延AI计算进行了微型化处理,可以实现前所有未的最优化单位功耗性能。

“与英伟达Xavier相比,赛灵思Versal AI Edge系列器件在智能边缘传感器的单位功耗性能、自主系统或边缘聚合单位功耗性能、CPU加速器单位功耗性能等方面均有优势。”赛灵思Versal AI Edge系列高级产品线经理Rehan Tahir介绍。

总体来看,与竞争对手的同类型产品相比,Versal AI Edge系列器件具备AI单位功耗性能优于GPU四倍、能够实现10倍计算密度、提供全球最具可扩展性且灵活应变的边缘平台三大差异化竞争优势:

一、AI单位功耗性能是GPU的4倍

现阶段,边缘AI芯片市场正在快速发展,增长速度已经超过芯片市场整体平均水平,预计到2025年将达到650亿美元,由此也迎来了MCU、GPU、DSP、FPGA的多方角力。
与其他芯片企业不同,赛灵思凭借FPGA的可编程性和灵活性,在安全性、可扩展性、实时性等层面打造差异化竞争优势,能够在严苛的散热与时延限制下提供一系列灵活的计算处理架构。

Rehan Tahir介绍,Versal AI Edge系列器件采用了全新的专为机器学习优化的AI引擎:AIE-ML,并且在存储器层级进行了加速器RAM的创新。

一方面,在AI引擎架构当中,赛灵思设置了一个计算核心阵列,能够将乘法器翻倍,使得INT8的性能翻倍,另外还提供了原生地支持INT4和BFLOAT 16,实现了数据和存储的本地化。

“所有的本地化存储都能够和AI引擎的阵列和块进行分享,并且通过全新的分布式数据存储器块进行互联。” Rehan Tahir表示,整个AI引擎阵列最大38兆字节,阵列可以加乘,也可以非常紧密的耦合。

另一方面,赛灵思在存储器层面方面还进行了加速器RAM的创新。据介绍,灵活应变的存储器层级包含标量存储器、自适应引擎、智能引擎三大部分,能够为大规模的带宽提供一个4MB片上RAM。

基于这样一个计算核心阵列、新分布式数据存储器的灵活互联等,就能够实现软件的可编程、硬件的灵活应变等功能,从而带来相比GPU高达4倍的ML算力,在具备低时延和功耗的同时,支持多样化工作负载。

例如,雷达/激光雷达处理等高级信号处理、以标量引擎支持嵌入式计算等。

Rehan Tahir提到,与英伟达Jetson AGX Xavier(同为最高配置)相比,Versal AI Edge的单位功耗性能是Jetson AGX Xavier的4.4倍。而在其他配置下,Versal AI Edge也占有功耗与性能的优势。

二、能够实现10倍计算密度

根据赛灵思公布的数据显示,与上一代自适应SoC相比,Versal AI Edge系列产品的算力由4TOPS提升至17.4TOPS,算力提升了4.4倍;面积则由3个器件减少至1个器件,大幅缩小了近60%的面积。

Rehan Tahir介绍,相比此前推出的Zynq® UltraScale+™MPSoC,Versal AI Edge系列产品能够提供10倍计算密度,并且均推出了车规级产品。

不可否认,汽车将是Versal AI Edge系列产品最大的应用市场之一。

“从传感器到AI、再到实时控制,Versal AI Edge系列能够加速整体应用。” Rehan Tahir补充说道,Versal AI Edge系列可用于ADAS与自动驾驶的各个方面。

例如,自适应引擎可以用于传感器融合和预处理,而智能引擎则可以用于信号调理和低时延AI,标量引擎则用于决策和车辆控制……

目前,Versal AI Edge已经通过ISO 26262安全认证,并且支持Caffe、TensorFlow、PyTorch等软件栈。

三、全球最具灵活应变且可拓展的边缘平台:软硬件均可升级

当前,包括理想、小鹏等越来越多主机厂都在追求更多的软件系统自定义能力,因而选择更加开放的硬件平台。

Rehan Tahir强调,Versal AI Edge系列产品是全球最灵活应变且可扩展性的边缘平台,同时也是当前唯一可在单个架构上从传感器扩展到加速器的边缘AI平台。

这主要得益于Versal AI Edge系列采用了特定领域架构(DSA),以及提供软硬件OTA升级、动态功能交换(DFx)的灵活应变能力。

其中,动态功能切换(DFx)可以用于汽车的车道偏离预警、停车辅助、驾驶员监测系统等场景,可以实现毫秒级的功能切换。

另一方面,Versal AI Edge系列可以根据不同需求和产品特性进行扩展,例如在单一平台上实现从L2级ADAS扩展到L3级、甚至是L5级自动驾驶。

“客户只需要设计一次,即可使用相同的工具、软件、生态系统、安全认证等将产品组合从低端扩展到高端。” Rehan Tahir补充表示,英伟达给出的ADAS解决方案需要同时使用两个器件才能满足相应的功能,但使用赛灵思Versal AIEdge系列的单一器件即可满足客户的各类需求。

这无疑大幅降低了客户的开发成本、功耗以及简化了系统设计的复杂性。

Rehan Tahir提到,软件和硬件开发者均可运用Versal AI Edge器件,它所提供的设计入门渠道适用于所有开发者,包括面向硬件开发者的Vivado、面向软件开发者的Vitis统一软件平台、面向平台目标应用的完整软件协议栈……

过去几年,得益于赛灵思在摄像头、激光雷达等各类传感器设备的融合计算和机器学习能力,以及对处理器的灵活应变能力,赛灵思的汽车业务一直保持着稳步增长态势。截止目前,赛灵思汽车芯片的出货量已经达到2.05亿颗,其中有8000万用于ADAS领域。

根据《高工智能汽车》了解,赛灵思的上一代自适应SoC——Zynq® UltraScale+™,目前已经在宏景智驾、英恒科技等的自动驾驶域控制器产品实现了成功应用。

现阶段,汽车数据处理芯片不断异构化,并且通过不断添加神经网络单元实现AI运算,已经成为未来发展的主要方向。例如华为、地平线等AI芯片均添加了神经网络单元,而英伟达的自动驾驶芯片同样也添加了神经网络单元,以实现对AI的更高效处理。

很显然,作为一款搭载多样化处理器的异构平台,赛灵思全新推出的Versal AI Edge系列产品凭借自身在单位功耗性能、可灵活应变、软硬件均可升级等方面的优势,将迅速在未来的智能汽车领域打开局面。

最新文章