被AMD收购后的DPU厂商Pensando

作者: 周凯扬,来源: 电子发烧友网微信公众号

如果你有关注市面上的一些DPU公司的话,你会发现他们面世的时机都比较一致,都是在云服务基础设施开始急速扩大规模之际。在虚拟化、遥测、网络、安全和存储等多需求融合下,云服务厂商们纷纷购置更多的设备来保证自己的硬件跟得上业务增长的速度。根据AMD的分析,如今30%到80%的CPU都是运行在云服务器上,这还不算企业自己搭建的私有云。

即便如此,企业也还是想拥有公有云一般的容量,不是为了部署成千上万台服务器,而是为了灵活度考虑。在本地服务器的服务部署可能需要花上几天乃至几周的时间,而在云端只需几分钟,最长也只要数小时就能把你所需的服务容器搭建好,而且这个过程已经基本趋于自动化了。

企业再也不用担心本地服务器不够用的问题,不用下订单等待机器抵达,或者遇到服务器有富余的情况,只能变卖二手服务器,云端的服务器可以按需动态扩展,完美解决用量上的痛点。

DPU究竟解决了什么问题?

然而CPU,尤其是x86 CPU在云端的运行效率并不算高,但总占比又这么高,所以这就促成了很大程度的浪费。根据AMD对IDC服务器出货数据的分析,每年浪费的服务器数量接近1000万台,如此低效的配置等同于每年浪费了近750亿美元的设备,浪费的电力更是高达65TWh以上。

现在这几大云服务厂商赚得盆满钵满的同时,自然想要实现利益最大化,如果能将用户手中的CPU资源全部释放出来,云服务厂商可以提供同样硬件资源下超过竞争对手的性能。所以亚马逊率先迈出这一步,以专用硬件来释放宝贵的CPU资源,但不只是像智能网卡那样卸载网络,还要将存储、管理、安全和监控等负载一并卸载,这些占据CPU近30%的资源的工作将全部由专用硬件接管。

Nitro System架构 / 亚马逊

这其实也就是DPU的最早的形态,或者说第一个投入市场并广泛使用的案例,但亚马逊作为先行者,选择了Nitro System这个名字,包含的专用硬件除了用于各种分流和加速IO的Nitro卡以外,还有额外的Nitro安全芯片。正因如此,亚马逊的AWS在客户数量本就领先一步的前提下,再多了一张王牌,也造就了AWS如今34%的市场份额。

收购来的DPU公司

这两年来,AMD已经从英特尔的口中抢下了不少x86服务器CPU的蛋糕,连英特尔自己也都承认了这一点。但无论是英特尔的IPU,还是英伟达的DPU,都早已开始布局,单靠Xilinx的Alveo智能网卡还不足以完成所有的CPU卸载任务,所以AMD决定直接收购一家DPU独角兽Pensando 。

如今IBM云、微软Azure、甲骨文云和VMware等厂商,都已经部署了Pensando的第一代和第二代DPU,不过他们选择的部署方式并不相同。比如微软的Azure主要是用基于DPU的智能交换机来完成SDN(软件定义网络)解耦,而甲骨文云和IBM云则是硬件上用到DPU卡,软件上除了使用Pensando提供的SDK和库,还有定制的逻辑应用,方便客户添加软件定义的服务。

Pensando DPU路线图 / AMD

从路线图来看,AMD Pensando DPU的架构进化是根据网络性能逐渐提升的,直到第三代架构代号名为“Salina”的DPU推出时,才会支持到最高800G的网络,而给出的2024年时间节点估计也是出于AMD对800G网络开始铺设的预测了。另外值得一提的是,AMD Pensando DPU是支持软件前向兼容的,也就是老版本的软件可以使用新的硬件产生的数据。

AMD Pensando的另一大特色在于它的分布式服务平台(DSP),AMD称其为可以用于任何环境中的下一代基础设施。在DPS底层的DPU可编程处理器上,Pensando的要求是做到低功耗、低延迟/抖动、高带宽和高扩展性。

同时,DSP要提供一个芯片内软件的服务,从软件、安全、存储、监控和遥测上提供灵活的卸载方案,取代掉数据中心已有的设备和黑盒。最后,DSP要给云服务厂商提供一个策略和服务管理器,打造一个容器化的管理平台,但同时也要能够集成到已有的基础设施和控制器中去。

写在最后

AMD作为x86擂台仅存的几位参赛选手,为了把CPU发挥出极致的性能,一直在先进工艺、3D封装等领域率先出击。但如今性能的提升变慢已经成为既定事实,芯片堆料而没有实质上的架构改进很难让客户买单,所以像DPU这样提高CPU利用率的方案成了数据中心的首选。在这样的趋势下,即便英伟达没有收购Mellanox打出DPU这张牌,AMD最终也一定会走上这条路。

最新文章