Xilinx AI 让边缘工业 “没有最智能,只有更智能”

作者:赛灵思工业、视觉、医疗和科学市场 AI 系统架构师 Quenton Hall

全球范围内,每年会安装数千万个 IP 摄像头。如果我们假设全球已经安装了1亿个 IP 摄像头(保守估计),且每台摄像机都在 7x24x365 (当然也有可能上是366)的工作频率下以 30fps 的速度采用非智能方式传输 H.264 编码高清视频,那么,每年所需的总带宽将为约 859Tbps 或 3.4ZB。如果这些摄像头中有一半连接至云端,就表明IP 摄像头的互联网流量目前可能占全球总互联网流量的 1/12 以上。显然,这些数字都是估值,但它依然可以形象地描绘出眼下问题的规模之大。

只有将这些数据存储起来以供将来检索和检查,或者利用人工或算法进行全天候不间断的视频监测,这些数据才能提供有意义的洞察。人们只需采集那些能够受监测并可提供深度情报的像素。因此我们或许可以认为,将全部上述海量视频数据传输并存储这种天真的想法效率实在低下。而这也让我想起 Bruce Cockburn 的名言:“如果森林里有一棵树倒下,会有人听见吗?有没有人听到森林倒下的声音?”。

过去数年中始终有一种趋势,就是通过自主 AI 算法监控视频并发送警报。无论其目标是确保家庭或孩童的安全、探测犯罪行为、探测交通事故或化学品泄漏、确保患者安全、翻译手语,还是用人脸识别取代“人肉”打卡以将病毒的接触性传播降至最低,似乎总有一款训练有素的 AI 模型可以支持这些应用。

为了降低存储成本,业界已经从 H.264 迁移至 H.265,同时,业界也在考虑如何通过云端 AI 处理解决电力和带宽成本。通过在网络边缘部署高效 AI 推断,我们可以从这些可视化数据中获取有益洞察,并精确决定对其进行编码与传输进而存储的时间、方式以及具体数据内容。这样岂不是“更加智能”吗?

举个例子:赛灵思与安森美半导体合作开发的全新 SmartCamera+ 演示平台,可实现低时延人脸检测和视频编码,最高可达 200fps,且功耗低于 10W (Ta=60C)。

该平台提供了充足的 AI 推断性能,不仅能够处理单个视频流,还可以处理多个视频流。MPSoC 器件中的片上 VCU 可以支持多流同时编码和解码,并且在此前提下也可以支持传统方式布局 IP 摄像头数据的 AI 推断:

如果您将此功能与赛灵思的感兴趣区域 (ROI) 编码和多裁剪 IP 相结合,我们的技术便能支持您只将应该存储或重新查看的数据传输到云中。换言之,如果森林里的一棵树倒下了,一定会有人听见。

现在,我们可以回答最初提出的问题了:“数据到底是终极目标,还是一切的开端?”。我的答案是——毫无疑问,数据只是一个开端,是一种达到目的的手段。至于制造商如何在这些数据的传输和存储方面采用“更智能”的方式,他们的举措将决定他们的命运。但是相信我,我们确实可以让您“更智能”!

如果您希望申请体验 SmartCamera+ 演示,就给小编留言吧。

推荐阅读