深鉴发布基于AWS EC2 F1实例的自动语音识别加速解决方案

作者:stark

深鉴科技(DeePhi Tech)由斯坦福与清华大学的深度学习硬件加速研究者创立,致力于为全世界提供更便捷、更高效、更经济的深度学习平台解决方案。人工智能是现在最热门的领域,最为该领域的一匹黑马,深鉴科技凭借原创技术实力不仅获得了资本的认可也获得了市场的欢迎,与Xilinx、亚马逊、蚂蚁金服、国家电网、搜狗搜索等公司保持着密切的合作。在近期举办的深鉴发布会上发布了多款神经网络(NN)相关硬件和软件产品,其中一款就是基于亚马逊AWS EC2 F1实例的自动语音识别加速系统DP-S64 ASR。

图1:深鉴发布DP-S64自动语音识别加速方案

图1:深鉴发布DP-S64自动语音识别加速方案

亚马逊AWS EC2是一种灵活的Web服务,可以在云服务器中提供安全并且大小可调的计算容量,该服务为帮助开发者更轻松的进行Web规模的云计算。2017年4月 Xilinx宣布其高性能Virtex UltraScale+系列FPGA器件已经在亚马逊弹性计算云(AWS EC2)F1实例中获得全面的应用,该实例除了利用 FPGA 提供可编程的硬件加速器之外,还支持用户最佳化他们的计算资源以满足其作业负载的特殊需求,尤其对于基因组分析、金融交易、影像实时处理、安全防护、机器学习等需求高带宽、高性能计算的应用非常的有利。

除了DP-S64语音识别加速解决方案,深鉴科技还推出了相关硬件产品,它们都与神经网络和AI开发相关,比如下面的红色PCIe模块就是基于Xilinx Zynq Z-7020 SoC器件,这个模块主要用于视觉处理,能够处理CNN视频分析,比如人脸检测,以1080P的画质能够识别出超过30张人脸,功耗仅2~4瓦。此外深鉴推出的DNNDK(Deep Neural Network Development Kit,深度神经网络开发套件)也方便了开发流程,它是一个高度集成的工具和数据库架构,包括CaffeTensorFlowMXnet等流行的神经网络训练库。

图2:深鉴科技推出的神经网络PCIe处理模块

图2:深鉴科技推出的神经网络PCIe处理模块

图3:深鉴科技定制的DNNDK设计框架

图3:深鉴科技定制的DNNDK设计框架

我们发现由于传统CPU、GPU在性能、成本、灵活性等方便的缺陷,越来越多的厂商将注意力转向FPGA,基于FPGA的机器学习平台能够有效的解决各种问题,支持灵活的自定义架构设计,尤其在高数据带宽和高性能计算方面提供可靠的保证。

声明:本文为原创文章,转载需注明作者、出处及原文链接