AMD在高性能计算和AI训练中的30x25能效目标

作者:MARK PAPERMASTER,AMD高级副总裁兼首席技术官

随着越来越多的设备正在智能化,例如具备互联网连接功能、通常还有摄像头的嵌入式处理器,数据创建正以指数级的速度呈爆炸式增长。人工智能(AI)和高性能计算(HPC)正在改变计算领域,使这个庞大的数据库能够得到分析,从而实现更高质量的分析、自动化服务、更高级别的安全性以及更多其他优势。但仍需要面临一个挑战:如此庞大规模的高级计算所需要的能耗与日俱增。

作为制造高性能处理器以应对世界上最为严苛的分析问题的领导者,AMD在产品研发过程中便优先考虑了能效。我们通过对架构、封装、连接性和软件进行了全面的设计来实现电源优化。我们对能效的潜心贯注旨在为降低成本、保护自然资源,并减缓气候影响。

在AMD,优先考虑能效早已不是新鲜事。事实上,我们在2014年便自发性的为自己定下了一个目标,即到2020年,将移动处理器的典型使用能效提高25倍。我们不仅实现了这一目标,更是达到了31.7倍的提升进而超越了这一目标。

去年,我们宣布了一个新的愿景 – 30x25目标 – 到2025年,我们的加速数据中心计算节点要在2020年的基础上实现30倍的能效提升。基于AMD EPYC(霄龙)CPU和AMD Instinct加速器,这些节点旨在为AI训练和HPC应用程序中那些世界上增长最快的计算需求而设计。这些应用程序对气候预测、基因组学和药物发现等方面的科学研究,以及训练用于语音识别、语言翻译和专家推荐系统的AI神经网络至关重要。幸运的是,我们相信通过架构创新,可以为这些及其他加速计算节点的应用程序优化能源。

图注: 特定于应用程序的加速计算节点可实现更高效率

AMD和我们整个行业都深知提高数据中心效率可以帮助减少温室气体排放并提高环境可持续性。例如,如果全球所有AI和HPC服务器节点都能取得类似的提升,我们预计2021年到2025年期间,相对于基准行业趋势可节省多达510亿千瓦时(kWh)电力,这相当于62亿美元的电力节约,以及6亿棵生长了十年的树木所带来的碳效益。

实际上,实现30倍目标意味着在2025年,这些AMD加速计算节点完成一次计算所需的能耗将比2020年低97%。想要达到这个目标并非易事。为了实现这一目标,我们需要以比2015-2020年期间全行业总体提升快2.5倍以上的速度提高加速计算节点的能效。

一年来的最新进展

那么我们进展如何?接近2022年中期,我们正朝着实现30x25的目标前进,仅通过使用基于一颗第三代AMD EPYC CPU和四个AMD Instinct MI250x GPU的加速节点,便可以在2020年的基准水平之上提高6.79倍能效。我们的进展报告采用了由著名计算能源效率研究人员和作者Jonathan Koomey博士证实过的测量方法。

图注: 2022年,关于30x25能效目标进展. AMD的实绩有望实现30X目标,并远高于2015-2020年行业提升趋势。

图注: 全球范围内运行AI训练和HPC工作负载的数据中心节点的能源使用比较预测。(数据来源:AMD内部数据)

如上图所示,根据2015-2020年数据中观察到的历史趋势,假设一切照旧的“基准行业趋势”预测了2020-2025年全球能源使用量。AMD的目标趋势线展示了基于力争降低能耗的AMD 30x25目标所带来的效率增益的全球能源使用情况。而AMD的实际趋势线则显示了基于迄今为止报告中的AMD计算节点能效提升的全球能源使用情况。

尽管距离实现我们的30x25目标还有很多工作要做,但我对我们工程师的工作进展感到十分高兴,并深受迄今为止的成果鼓舞。我们将继续每年对进展进行报告,并邀请您保持关注。

最新文章