云计算

提供赛灵思公司在云计算领域的解决方案,帮助工程师加速产品创新设计。

阿里云FAAS平台,极大简化FPGA开发部署流程

FPGA (现场可编程门阵列)由于其硬件并行加速能力和可编程特性,在传统通信领域和IC设计领域大放异彩。一路走来,FPGA的技术并不是一个新兴的硬件器件,由于其开发门槛过高,硬件加速算法的发布和部署保护要求非常高,FPGA的使用一直是高冷的美人,没有走入平常百姓家。也就导致FPGA的计算潜力还没有得到深入的挖掘。

阿里FPGA云服务器平台FaaS(FPGA as a Service)在云端提供统一硬件平台与中间件,可大大降低加速器的开发与部署成本。用户可以直接使用部署加速器提供商提供的加速服务;也可以在无需了解底层硬件的情况下,快速开发和部署自己的定制加速器。

FaaS平台提供给所有的加速器开发者统一的FPGA硬件接口Shell,提前帮用户解决了FPGA开发难度最大的高速接口开发及调试,例如PCIe,Fiber接口, DDR控制器等等,大大简化了开发的时间;用户能够直接得到硬件平台和FPGA接口的最大性能,不会因为团队开发能力和经验的欠缺,造成硬件平台性能浪费。

【QTV】实例演示 — 基于FPGA的AWS F1实例

在本视频中,我们将通过一个 Step by step 的设计案例,详细向您介绍如何上手开始使用基于赛灵思 UltraScale+ FPGA 的亚马逊(Amazon) EC2 F1 实例开始您的工作。

近期,阿里云 全新一代 FPGA 云服务器 F3 正式上线邀测。

该产品基于自研超高性能 FPGA 加速卡打造,可在云上实现 FPGA 加速业务的快速研发、安全分发、一键部署和弹性伸缩,为人工智能产业、图片视频转码、基因计算提供加速服务,在特定场景下的处理效率比 CPU 高百倍。

F3 产品特性:

  • 采用 Xilinx 最新 16nm Virtex UltraScale+器件 VU9P
  • 最大实例 支持 16 个 VU9P 芯片,邀测开放 4 个 VU9P 实例
  • 邀测实例提供高达 47 TeraMACs的 DSP 计算能力

F3 产品结构特性

  • 在 FPGA Shell 架构上,F3 在沿用前代技术基础上,充分支持 OpenCL,HLS 以及 RTL 的开发流程,能够让多种应用程序开发的工程师,在不需要关注底层硬件细节的情况下,很好地完成异构计算的定制开发工作。

[PBX]:基于云的基因组分析算法实现

本实例由 Edico Genome 公司带来,基于“云”的基因组分析算法演示。该演示使用了基于赛灵思 All Programmable FPGA 的 AWS F1 实例实现,在使用 AWS F1 实例后,Edico Genome 可以以更低的成本为更为广泛的用户群体提供兼具高准确度,硬件加速的基因组流水线算法实现 —— 只需一个 F1 实例,即可替代多达 80 个的传统计算实例以及相关成本。

作者:Sleibso,编译:Stark

Edico Genome公司之前就曾开发出了基因组分析算法,为了实现算法加速,该公司原本打算开发一个ASIC(精简指令集)处理器,但是这种方案灵活性太差,尤其是随着算法的更新,计算性能需求的增加这种方案可能就不能够满足需求了,此外开发一个ASIC处理器也需要较长的时间周期。因此Edico Genome公司将注意力转移到FPGA上,FPGA的灵活性非常适合这种不断迭代开发的需要,随后该公司推出了基于Xilinx 28nm FPGA的Dragen加速器板卡用于基因组分析算法的加速。

图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

作者:Sleibso,编译:蒙面侠客

高性能的语音控制系统在智能家具和机器人的发展过程中显得越来越重要。语音控制系统的信号采集端使用麦克风阵列会得到更丰富的声音信号,为声音定位提供了可能,处理语音的硬件的性能和相应的软件算法直接决定了语音控制系统的处理效率和精确度。亚马逊和谷歌等大型互联网公司都在努力的研究高性能的语音控制系统,作为极客的你是不是也想入手一个硬件平台,开始自己的智能硬件的开发之旅呢?好的平台是成功的一半!

给AI换个“大动力小心脏”之OCR异构加速

作者: derick,腾讯架构师

OCR在通用文字识别等场景下有广泛应用,基于FPGA异构加速的OCR识别相比CPU/GPU实现具有延时小、成本低的优势。我们设计了多FPGA芯片协同的异构加速架构,能快速适配业务OCR模型变化,检测识别整体性能为GPU P4 130%,处理延时仅为P4的1/10,CPU的1/30。

1.文字识别技术- OCR

OCR技术,通俗来讲就是从图像中检测并识别字符的一种方法,在证通用文字识别、书籍电子化、自动信息采集、证照类识别等应用场景中得到了广泛应用。通用场景的OCR因此通用场景下的OCR技术一直都是人工智能领域挑战性极强的研究领域,不需要针对特殊场景进行定制,可以识别任意场景图片中的文字。

通用OCR技术包含两大关键技术:文本检测和文字识别。检测模型的作用简单来说就是确定图片中哪里有字,并把有字的区域框出来。文字识别是将文本检测box作为输入,识别出其中的字符。

美英两国科学家联合开发了一款运算速度超快的电脑芯片,使当前台式机的运算能力提升20倍。当前的个人电脑使用双核、4核、16核处理器来执行各项任务。如今,美英研究人员开发的中央处理器(CPU)将1000个内核有效集成于一个芯片上。这项突破或将在今后几年开启一个超高速运算的新时代,使家庭用户不再对运行缓慢的电脑系统感到沮丧。虽然速度更快,但由于新型“超级”电脑的能耗远低于当前电脑,所以更加环保。

作者:王晟中,陈伟男,彭澄廉
(复旦大学计算机科学技术学院,上海 200433)
目前已有的大多可重构计算硬件平台采用多FPGA结构,根据应用的不同,可能还包含多CPU或专用存储器,FPGA的配置往往是整片重构或是一维重构,且需要一块独立的开发板来提供外设和控制重构过程。可重构计算是介于通用处理器和专用集成电路之间的计算实现方式,既能保留硬件计算速度快、效率高的优点,又兼具软件的灵活性和开发周期短的特性。本文设计并实现了一款基于单片Xilinx Virtex-4现场可编程门阵列的可重构计算硬件平台,介绍了其功能、体系结构以及开发调试流程。该平台还提供运行操作系统所必要的环境,可作为研究可重构计算及面向可重构操作系统的硬件基础。

FPGA与云计算中的芯片级存储

用户对于云计算的个性化服务要求更高,这就要求供应商和服务商应具备更迅捷的市场响应能力。传统架构的存储要实现市场的快速响应,则意味着高昂的设计成本,否则就要忍受较长的开发周期。而芯片级存储能够改变传统存储设计的局限性。带有各种处理器内核和集成更多处理能力的芯片,借助通常被称为“软核处理器—硬件加速器”的FPGA技术,将大幅提升系统性能,同时具有最高的设计灵活性,特别适于个性化产品开发。

同步内容