授之以渔:教机器看什么不如教机器怎么看,Xilinx AI 方案闪耀 ISE2020

每年二月,阿姆斯特丹都会举办世界上规模最大的音视频与系统集成展会 - 欧洲集成系统展(ISE)。在这里,全球音视频行业齐聚一堂,共同分享业界领先的音视频项目以及尖端技术、产品与解决方案。

AI/ML 相关的话题依然是各个行业的焦点所在,人工智能领域日益扮演领导角色的赛灵思,在 ISE2020 上有什么亮点和表现呢?

让我们来看看赛灵思面向专业音视频 (Pro AV) 和广播的最新解决方案,其中包括全新推出的 AI 功能和首款在 7nm Versal ACAP 器件上实现的 HDMI 2.1 实现方案。

感兴趣区域 (ROI) 编码

视频流传输成本和存储成本对广播行业来说至关重要。感兴趣区域 (ROI) 编码通过保持眼睛自然关注区域(尤其是人脸和人物)的高质量视频画质 (VQ),同时降低背景等关注度较低区域的画质,达到降低内容总比特率的目标,进而降低成本。

AI 模型能够自动检测和跟踪面部,并动态地将目标的窗口坐标传递给编码器,以判断在什么位置可以使更较低的 QP(量化参数)来提高画质,同时让图像场景的其余部分采用较高的 QP(较低比特率)。

智能数字标牌

针对性高的广告宣传是市场营销机构的成功要诀。使用 AI 功能在数字标牌前进行受众分析,便可以根据年龄和性别等指标,提供更相关、更有针对性的广告宣传。这样能使标牌提供商在广告商面前更具吸引力,因为后者愿意为特定的目标受众支付更多费用。此外,这种方法还能为广告商提供有价值的数据,如观众兴趣。这种数据也可以商品化。

对象跟踪与窗口化

使用 AI 进行人脸检测在广播行业有大量应用。例如,试想在一所当地的大学里现场直播一场有关艺术家作品的小组讨论。这是个针对小众的活动,预算低,制作成本也应压低。很有可能只使用一个摄像头,通过间断的缩放和平移,将整个小组纳入画面。

借助 AI 功能,就可以使用静态 4K 摄像头拍摄整个小组,然后围绕每个小组成员自动创建额外的较低分辨率高清窗口输出,并在对话过程中全程跟踪这些窗口。这样一来,使用单个 4K 摄像头就可以在现场直播过程中切换多个输出镜头,其中包括广角镜头和多个特写镜头。这种方法无需使用更多摄像头就可以营造出更有感染力的观感。摄影师还可以兼任视频混合师,只需选择要输出的帧。

此外,这种 AI 技术也可以用于视频会议应用,使用自动跟踪强化数字缩放能力。

语音识别

使用自然语言处理 (NLP) AI 模型的语音识别是我们演示的另一大领域。这种类型的 AI 已经在能够听取语音命令的智能设备上得到使用。无论在云端还是在边缘进行处理,与 CPU 实现方案相比,赛灵思提供的自适应技术都能显著降低功耗。

总结

我们很高兴能够将这些全新的 AI 功能添加到赛灵思的自适应平台上,为 Pro AV 和广播市场的客户提供高级功能,助力开展商业化分析、提高工作流效率并增强可用性。最终这些集成 AI 功能将帮助企业强化创新、实现自身差异化,并加快市场投放速度。

如需了解有关赛灵思 AI 解决方案的更多信息,请点击 : https://china.xilinx.com/products/design-tools/vitis/vitis-ai.html

文章来源:Xilinx赛灵思官微

最新文章

最新文章