Edico Genome推出基于AWS EC2 F1实例的基因组分析应用

作者:Sleibso,编译:Stark

Edico Genome公司之前就曾开发出了基因组分析算法,为了实现算法加速,该公司原本打算开发一个ASIC(精简指令集)处理器,但是这种方案灵活性太差,尤其是随着算法的更新,计算性能需求的增加这种方案可能就不能够满足需求了,此外开发一个ASIC处理器也需要较长的时间周期。因此Edico Genome公司将注意力转移到FPGA上,FPGA的灵活性非常适合这种不断迭代开发的需要,随后该公司推出了基于Xilinx 28nm FPGA的Dragen加速器板卡用于基因组分析算法的加速。

图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

图1:Edico Genome公司于2015年推出的DRAGEN加速器板卡

最近几年云计算取得了巨大的发展,Edico Genome公司也将DRAGEN方案移植到AWS EC2 F1实例上,借助云服务器强大的处理能力,数据压缩效果相比之前从2x提升到了4x。现在Edico Genome公司面向用户提供基于云服务器的基因组数据处理和存储服务。

DNAnexus公司与Edico Genome展开了密切的合作推出了DNAnexus平台,它能够了一个全局的网络来分享和管理基因组数据,这个平台解决了各实验室/研究机构面临的安全性、可扩展性和协作性等问题。新老用户都可以借助这个平台来利用DRAGEN的计算资源,基于AWS EC2 F1实例的技术方案大大降低了实现成本,用户完全可以将这个平台作为一体式的解决方案。

DRAGEN基因组分析技术是一个端到端的解决方案,包括映射、调整对齐、排序、特征标记、变异检测、数据压缩/解压缩等高级算法,提供超快的(ultra-rapid)基因组数据分析。今年截至到目前DRAGEN平台已经处理了12petabytes(10的15次方字节)的数据,在未来的云计算中将会涉及更多的应用,基因组数据分析只是其中之一。

关于AWS EC2 F1实例

AWS EC2 F1实例是一种云计算服务,基于Xilinx Virtex UltraScale+ VU9P FPGA,用户可以进行编程为自己的应用程序创建自定义硬件加速。F1 实例易于编程,并且配备了开发、模拟、调试和编译硬件加速代码所需的各种资源,其中包括 FPGA 开发人员 AMI硬件开发工具包 (HDK)等。

声明:本文来源于Xilinx Xcell Daily Blog,由创新网赛灵思中文社区编译,转载请注明作者、出处及原文链接