聚焦SC15:探访爱尔兰高端计算中心(ICHEC)

作者:Kenshin

2015年度全球超级计算大会(Supercomputing Conference,简称SC15)于11月15日至20日在美国的德克萨斯州奥斯汀举办,全球超级计算大会是由IEEE计算机学会、美国计算机学会联合主办,旨在探讨全球IT科技领域在高性能计算(HPC)、网络、存储和分析方面的最新技术、产品及发展趋势。随着互联网技术的日益发展,大数据概念及应用的兴起,高性能计算正在改变着世界。

爱尔兰超级计算中心成立于2005年,是国家级高性能计算中心,它的任务是提供高性能计算资源、支持和教育培训等。在SC15博览会上他们不仅展出了基于FPGA的硬件加速器同时推出了加速器能耗管理系统(SEMA),这个能耗管理系统的硬件核心是多个德州仪器公司的INA226型电流分流监控器,其内部的ADC转换器采样率可达到500KHZ,上位机采用一个服务器工作站,能够实时监控多达三个PCIe板卡形式的高性能计算加速器设备,这个系统能够测量PCIe板卡的功耗,分辨率可达1毫秒/次,精确度高达99.9%。

图1 ICHEC工程师装扮成爱尔兰传说人物绿色小矮妖Leprechaun

图1 ICHEC工程师装扮成爱尔兰传说人物绿色小矮妖Leprechaun

ICHEC的工作人员演示了测量三种不同形式的PCIe板卡,第一种是基于Intel Xeon Phi 7120 CPU,第二种是基于Tesla K40 GPGPU,第三种是基于Xilinx Virtex-7 FPGA的Alpha Data ADM7V3板卡,测试程序采用统一的SHOC BenchMark,主要是矢量乘法运算操作。下面的SEMA系统给出三种不同形式PCIe板卡的监测结果:

图2 SEMA的实时监测结果

图2 SEMA的实时监测结果

每个波形图中的波峰表示大量数据正向内存中传输同时执行SHOC核心运算,从波形图中我们也可以看到每个设备从高速执行运算状态过渡到空闲状态的过程,以及能耗的变化情况。

  • 基于 FPGA的Alpha Data加速器板卡空闲状态下功耗低于19W,并且波峰状态是的平均功耗在20W左右,执行SHOC算法的时间少于2秒,功耗是三个PCIe板卡中最低的。
  • Intel Xeon Phi 720 CPU板卡空闲状态时功耗也只有20W,但是在执行SHOC测试程序时,功耗却达到了100-150W,这也是符合微处理器型加速器的功耗情况的。
  • 英伟达Tesla K40GPGPU型PCIe板卡空闲状态时功耗30W,执行测试程序时功耗在60-120W,同样符合并行处理器GPU的功耗情况
  • 从以上分析来看我们可以初步得知,在处理一定计算负荷时,FPGA相比CPU和GPU具有明显的优势。不过从当前各大IT企业如Intel、百度等都开始关注FPGA,打算将他们的超级服务器及数据中心从传统的ASIC处理器转移到FPGA架构上来,FPGA在高性能计算这个领域将逐渐成为主角,FPGA用于超级计算是当前大数据时代的发展趋势。

    不光是ICHEC,其他厂商如联科、IBM和Xilinx三方在SC15超算大会上举办了FPGA技术发展方向研讨会,探讨新一代计算技术和应用,同时联科发布了三款新研发的FPGA加速产品。

    言归正传,ICHEC借助这套功耗监控管理系统模型提出了HaaS(hardware as a service,硬件及服务)概念,并且可以以云系统的形式部署运行,如果对他们这套系统了解更多,可以随时联系他们: email:info@ichec.ie 。