Xilinx AI 方案与资源更新一览(二)

接上文:Xilinx AI 方案与资源更新一览(一)


全新成功案例

百度将赛灵思 ZU5 用于 Apollo ACU Advanced

百度在 2019 年 7 月于北京举办的年度 AI 开发者大会上推出用于自动代客泊车 (AVP) 的 Apollo ACU Advanced。


产品特性:

  • 赛灵思车规级 ZU5 SoC
  • 与百度 PaddlePaddle 框架兼容
  • 8 部摄像头,12 部超声波雷达
  • -40~85℃ 的工作温度范围
  • ASIL-D FuSa 级
  • 完全支持AUTOSAR

AVP 应用需要先进强大的深度学习推理能耐来处理复杂的驾驶环境,这使我们要应对下列主要设计挑战:

  • 用于快速算法升级的敏捷迭代
  • 用于感知的多个不同帧率 (5/10/30Hz) 的视频源
  • 多个算法,包括 CNN 算法和基于规则的算法
  • 针对分类、检测、识别、分割等不同任务的多个低层次运算符


通过与赛灵思密切合作,采用大量的创新软硬件协同优化技术,充分发挥赛灵思 SoC 的功能,包括:

  • 动态量化
  • 具备 Supertile 功能的脉动阵列
  • 异构计算分配
  • 多线程并行异构计算
  • FPGA 定制计算分配
  • 灵活的帧率分配

这在由赛灵思提供支持的 AI 推理领域,是技术与工程创新的出色范例!

产品和方案更新

演示与示例设计新闻

目标与姿态检测演示

该高性能对象与姿态检测演示采用赛灵思 AI Model Zoo 发布在 Github 上的两个即用型模型(https://github.com/ Xilinx/AI-Model-Zoo):

1. OpenPose,使用公开数据集训练,并通过赛灵思 AI 优化器进行进一步优化 (https://www.xilinx.com/member/ai_optimizer.html)

2. MobilenetV2-SSD (480*360),使用公开数据集训练,无剪枝。

该演示在 Ultra96 和 ZCU104 上都进行过测试。在 Ultra96 上的运行结果显示如下:


通过初始软件优化,并且在 Openpose 模型的精度和输入大小之间进行权衡取舍,我们能够实现下列端到端性能:

• 使用 480*360 MobilenetV2-SSD 和 128*128 Openpose,在 Ultra96 上实现 18 FPS

• 使用 480*360 MobilenetV2-SSD 和 136*136 Openpose,在 ZCU104 上实现 24 FPS

进一步优化将重点解决已知的瓶颈,包括 Mobilenetv2-SSD 和 OpenCV Gaussian 的预处理以及 OpenPose 的后处理中的缩放功能。

如需了解有关本演示的更多信息,请联系您的赛灵思代表。

推荐阅读