授之以渔：教机器看什么不如教机器怎么看，Xilinx AI 方案闪耀 ISE2020

judy 在周四, 03/05/2020 - 10:08 提交

每年二月，阿姆斯特丹都会举办世界上规模最大的音视频与系统集成展会 - 欧洲集成系统展（ISE）。在这里，全球音视频行业齐聚一堂，共同分享业界领先的音视频项目以及尖端技术、产品与解决方案。

AI/ML 相关的话题依然是各个行业的焦点所在，人工智能领域日益扮演领导角色的赛灵思，在 ISE2020 上有什么亮点和表现呢？

让我们来看看赛灵思面向专业音视频 (Pro AV) 和广播的最新解决方案，其中包括全新推出的 AI 功能和首款在 7nm Versal ACAP 器件上实现的 HDMI 2.1 实现方案。

感兴趣区域 (ROI) 编码

视频流传输成本和存储成本对广播行业来说至关重要。感兴趣区域 (ROI) 编码通过保持眼睛自然关注区域（尤其是人脸和人物）的高质量视频画质 (VQ)，同时降低背景等关注度较低区域的画质，达到降低内容总比特率的目标，进而降低成本。

AI 模型能够自动检测和跟踪面部，并动态地将目标的窗口坐标传递给编码器，以判断在什么位置可以使更较低的 QP（量化参数）来提高画质，同时让图像场景的其余部分采用较高的 QP（较低比特率）。

智能数字标牌

针对性高的广告宣传是市场营销机构的成功要诀。使用 AI 功能在数字标牌前进行受众分析，便可以根据年龄和性别等指标，提供更相关、更有针对性的广告宣传。这样能使标牌提供商在广告商面前更具吸引力，因为后者愿意为特定的目标受众支付更多费用。此外，这种方法还能为广告商提供有价值的数据，如观众兴趣。这种数据也可以商品化。

对象跟踪与窗口化

使用 AI 进行人脸检测在广播行业有大量应用。例如，试想在一所当地的大学里现场直播一场有关艺术家作品的小组讨论。这是个针对小众的活动，预算低，制作成本也应压低。很有可能只使用一个摄像头，通过间断的缩放和平移，将整个小组纳入画面。

借助 AI 功能，就可以使用静态 4K 摄像头拍摄整个小组，然后围绕每个小组成员自动创建额外的较低分辨率高清窗口输出，并在对话过程中全程跟踪这些窗口。这样一来，使用单个 4K 摄像头就可以在现场直播过程中切换多个输出镜头，其中包括广角镜头和多个特写镜头。这种方法无需使用更多摄像头就可以营造出更有感染力的观感。摄影师还可以兼任视频混合师，只需选择要输出的帧。

此外，这种 AI 技术也可以用于视频会议应用，使用自动跟踪强化数字缩放能力。

语音识别

使用自然语言处理 (NLP) AI 模型的语音识别是我们演示的另一大领域。这种类型的 AI 已经在能够听取语音命令的智能设备上得到使用。无论在云端还是在边缘进行处理，与 CPU 实现方案相比，赛灵思提供的自适应技术都能显著降低功耗。

总结

我们很高兴能够将这些全新的 AI 功能添加到赛灵思的自适应平台上，为 Pro AV 和广播市场的客户提供高级功能，助力开展商业化分析、提高工作流效率并增强可用性。最终这些集成 AI 功能将帮助企业强化创新、实现自身差异化，并加快市场投放速度。

如需了解有关赛灵思 AI 解决方案的更多信息，请点击： https://china.xilinx.com/products/design-tools/vitis/vitis-ai.html

文章来源：Xilinx赛灵思官微

ISE2020

Vitis 视觉 AI 引擎 (AIE) 的设计方法	新一代直播场景下，视频加速卡在狂奔	“海量图片轻松搞定” \| 深维科技将在赛灵思开发者大会现场演绎超强算力
IDC：2022年全球AI市场规模达到4328亿美元增长近20%	业界第一颗 Versal ACAP 到达 Xilinx 之后发生了什么？	AMD推出Alveo MA35D媒体加速器

授之以渔：教机器看什么不如教机器怎么看，Xilinx AI 方案闪耀 ISE2020

最新文章

最新文章