关于Chiplet,Lisa Su罕见分享

文章来源:内容由半导体行业观察(ID:icbank) 编译自hpcwire,谢谢。

换掉几个硅部件,瞧,你有一个全新的芯片,不需要太多的设计工作。

这就是 AMD 的首席执行官 Lisa Su 描述公司制造其新的 MI300X GPU 和代号为 Bergamo 的 128 核 Epyc CPU 的方式,该 CPU 的目标是密集的服务器环境。

Su 出人意料地深入探讨了如何使用该公司多年来一直使用的小芯片来构建这些芯片。所有芯片均使用提供小芯片和封装技术的台积电制造。

这也是 AMD 吹嘘自己领先于英特尔的一种方式,后者正在大肆宣传在 PC 和服务器芯片中实施小芯片的更广泛战略。Intel 的 Ponte Vecchio GPU 基于 chiplet 方法,在 Intel 中使用 47 个“tile”。

针对 AI 应用程序的纯 GPU MI300X 是通过从其具有 GPU 和 CPU 的 MI300A 超级计算芯片中配置 CPU 小芯片并用 GPU 小芯片替换它们而制成的。

MI300X 直接定位为 Nvidia 的 H100 GPU 的竞争对手。MI300A 将用于即将推出的 El Capitan 超级计算机,预计其性能将超过 2 exaflops。

“我们在我们的产品中使用小芯片引领了行业,我们在这个产品中使用小芯片实际上非常非常具有战略意义。我们创造了一系列产品,”Su 说。

AMD 采用了 MI300A 超级计算芯片,移除了三个 Zen 4 CPU 芯片,并保留了 GPU 芯片。然后 MI300X 在公司在 Mi300A 继承的芯片之上再插入两个 CDNA 3 GPU 芯片后诞生。

MI300X 拥有 1530 亿个晶体管,12 个 5 纳米和 6 纳米小芯片,包括新增的两个 GPU 小芯片。MI300A 超级计算芯片有 13 个小芯片,三个 Zen 4 CPU 内核。AMD 在 MI300X 中堆叠了更多的 HBM3 内存,使其总容量达到 192GB。

“为了 MI300X 解决大型语言模型的更大内存需求,我们实际上增加了额外的 64 GB HBM3 内存,”Su 说。

AMD 还推出了 Bergamo 芯片,该芯片拥有 128 个内核,更像是亚马逊和 Ampere Computing 开发的基于 Arm 的低功耗芯片的 x86 版本。这是该公司的第一款专为通过云为网络应用程序提供服务的应用程序而设计的芯片。

AMD 移除了 Genoa 芯片(基于 Zen 4 架构)并换入了 Bergamo 芯片。Bergamo 芯片基于 Zen 4c 内核,这是 Zen 4 架构的功率优化版本。

Bergamo 拥有 820 亿个晶体管,每个插槽支持 128 个内核。它有八个计算芯片和 16 个 Zen 4c 内核,这是 Zen 4 的变体,针对功率和性能进行了优化

真正的工作是设计 Zen 4c 内核,以确保它与 Genoa 芯片的插槽兼容。

芯片设计从与Zen 4相同的RTL设计开始,带来了插座和软件的兼容性。然后,该公司针对功率和面积优化了 Zen 4c 的物理实现,并重新设计了 L3 缓存层次结构以获得更大的吞吐量。

“如果将所有这些放在一起,结果是设计面积缩小 35%,每瓦性能显着提高,”Su 说。

Meta 将在其数据中心部署 Bergamo,为 WhatsApp、Instagram 和 Facebook 等网络应用程序提供服务。这家社交媒体公司正在重新设计其数据中心以服务于人工智能和网络应用程序,并且似乎在贝加莫的设计中拥有很大的发言权。

Meta 与 AMD 合作,针对他们的工作负载优化 Bergamo,包括“密集计算小芯片、核心与缓存比率、电源管理和制造优化,帮助我们将大量此类服务器装入机架,”副总裁 Alexis Black Bjorlin 说Meta 的基础设施。

Black Bjorlin 说:“凭借 Bergamo 小芯片策略的灵活性,我们也很高兴拥有一个 IO 密集型服务器选项,我们可以将其用于 HDD 和闪存存储平台。”

顶级 Bergamo 芯片称为 Epyc 9754,拥有 128 个内核,运行 256 个线程,功率高达 360W。该芯片拥有 256MB 的三级缓存,运行频率高达 3.10GHz。中端 9754S 每个代码仅运行一个线程。该系列中的第三款芯片 Epyc 9734 拥有 112 个内核,每个内核运行两个线程,功耗为 320 瓦。

Bergamo 将面临来自英特尔名为 Sierra Forest 的高密度服务器芯片的竞争,该芯片将于明年上市。Sierra Forest 拥有英特尔的 e-cores,也称为效率核心。

最新文章

最新文章