AMD与Ranovus合作开发数据中心光子模块

本文转载自:本文由半导体产业纵横编译自EETimes

Ranovus 与AMD共同展示了一个模块,该模块结合了前者的Odin Analog DriveCPO 2.0和被已AMD收购的赛灵思研发的800G运行Versal ACAP。简而言之,这个模块可以让数据中心的人工智能 (AI) 工作负载运行得更快,而不会消耗太多的电力,而且能花更少的钱。

Ranovu和AMD不仅证明了他们自己的技术是有效的,而且他们的演示进一步证明了共同封装光学器件(即 Odin 描述中的“CPO”)是一个成功制定的概念。


由AMD和Ranovus构建的联合封装光学 (CPO) 演示系统。它结合了前者的Versal ACAP 和后者的Odin Analog-Drive CPO 2.0。(来源:Ranovus)

“联合封装正在顺利进行,”Ranovus总裁兼首席执行官HamidArabzadeh说。他还提到,这一趋势有三个推动力,分别是:帮助提高传统以太网网络的性能;满足人工智能训练日益增长的需求;以及支持内存和I/O分解的趋势。

Odin是一种单片光电芯片,它结合了驱动器和其他基于晶体管的电路以及波导和激光器。Ranovus在2021年底推出了2.0版本。

Versal ACAP不仅仅是AMD FPGA片上系统 (SoC)。它包含可编程逻辑、处理器内核、接口电路和其他支持功能。AMD将其Versal称为自适应计算加速平台或ACAP。顾名思义,它旨在通过强大的功能和灵活性来加速工作负载——特别是AI工作负载。

Odin和Versal ACAP都是CPO实例化的关键元素。该概念旨在解决数据中心面临的多重挑战。

由于涌入数据中心的数据量不断增加,数据中心需要更快地传输数据。然而,功耗的增加与数据传输速率的提高相关,并且随着互联网流量以当前的速度增长,当今数据中心架构的功耗将在5到10年内变得无法维持。

光电子厂商在制造激光器和波导管方面有不同的技术方法,但他们的数据中心客户没有兴趣被迫从几种专有方法中进行选择。更重要的是,他们不想被锁定在任何特定的供应商身上——数据中心运营商希望随时随地都能获得即插即用。因此,CPO模块的想法是,可以进行更换或维修。

开放式互联网论坛(OIF,一组数据中心运营商及其供应商)在2020年末建立了其共同打包框架实施协议(IA)项目,以“研究与一个或多个ASIC共同打包通信接口的应用空间和相关技术考虑”。

2021年底,OIF在联合封装框架下定义了第一个项目:3.2T共封装光模块IA,该组织称“定义一个针对以太网的 3.2T 联合封装光模块利用 100G 电气通道切换应用。”就在几周前,OIF发布了联合封装框架文件。总括概念是,该组织希望鼓励联合封装模块内部的创新,但任何CPO模块都必须从I/O角度看与其他任何模块一样。

Ranovus和AMD在OFC展会上宣布了他们的联合CPO演示,正如Ranovus所说的,“用于 AI/ML 平台的 CPO 2.0 解决方案的到来这需要高能效、高吞吐量和高密度的光互连。”

Arabzadeh观察到,许多现有接口的峰值约为200G。他解释说,Odin在相同的占地空间内从800Gbps扩展到3.2Tbps,这在很大程度上是因为该公司能够将激光器直接嵌入其IC的硅基板中。Arabzadeh认为,他的公司的方法是非常独特的,首先是该公司的量子点激光器,然后是该模块在单个封装组件中为以太网交换机和ML/AI硅提供Nx100Gbps PAM4光学I/O通道的能力。

AMD和Ranovus表示,通过使用Versal Premium ACAP将光学元件集成到封装中,可以大幅降低功耗、简化电路板布线并降低成本。

在被问及成本时,Arabzadeh说,现有的400G模块的价格约为每台800美元, “我们的价格将是其中的十分之一,”他说,“由于封装原因,这台激光器的成本高于模块。”

Ranovus 还通过其生产方法控制成本。该公司在晶圆上识别出已知良好的芯片,保证一切都是晶圆级的。

关于功率,Arabzadeh 说该模块消耗大约4瓦,而模块替换的电子设备大约消耗14W-17W。

Ranovus 也有一个没有集成激光器的芯片版本。AMD演示的模块针对AI工作负载进行了优化,但Arabzadeh 说:“如果你看一下以太网,它都是基于模块的。”因此,包括 Facebook 和微软在内的数据中心运营商仍然想要一个带有独立外部激光器的版本。

Ranovus有一种方法可以进入以太网市场,并且刚刚展示了另一种针对AI市场的方法。Arabzadeh表示,Ranovus 稍后将发布“关于具有池化内存并依赖于CXL的分类服务器架构的公告”。

最新文章

最新文章