CERN研究|可定制人工智能加速暗物质探索

将推理加速和传感器数据预处理在Xilinx FPGA中结合,提供GPU和CPU无法企及的性能

CERN 背景:欧洲核子研究中心(法语:Conseil Européenn pour la Recherche Nucléaire;英语:European Organization for Nuclear Research),通常被简称为CERN,是世界上最大型的粒子物理学实验室。这是发现“上帝粒子” 希格斯玻色子(英语:Higgs boson)的地方。它还是世界上第一个网站,第一个网络服务器,第一个浏览器的诞生地。

这个项目是来自高能物理研究人员在欧洲核子研究中心(CERN)的实验平台上的实验。

项目概况
在高能物理实验中,我们需要以极快的速度处理大量高能粒子物理数据,以找到宇宙起源的线索。实时过滤传感器数据(触发器),以识别可能包含暗物质和其他物理现象存在的证据的新粒子子结构。这些极大量的数据实时处理对我们的计算系统提出了极高的要求。

在项目中,CERN研究人员通过将AI推理和性能关键传感器的预处理在部署于大型强子对撞机(LHC)中的Xilinx Virtex Ultrascale FPGA上结合,通过自行设计的一套HLS4ML的软件工具,可定制计算极大的加速了处理能力, 并且使得神经网络推理的延时降低到100ns数量级。

项目详情
紧凑渺子线圈(CMS,Compact Muon Solenoid),是CERN的大型强子对撞器计划的两大通用型粒子探测器中的一个。由约2300位来自159个不同的研究机构的科学家,共同参与建设。探测器是一个长约21米,直径约16米的筒状的结构,重量达12500公吨(这也是其名称的由来)。CMS检测器中非常高的数据速率(150T Bytes/s)需要实时事件处理,但触发滤波器算法开发阻碍了团队取得进展的能力。 (见图1和图2)自定义事件触发器通常需要数月的开发。


项目解决方案
于是团队着手开发和测试基于Xilinx Vivado HLS的工具流程(见图3),该工具流程将缩短用于创建CMS一级触发器的机器学习算法的“物理时间”。 hls4ml工具具有许多可配置参数,使用户能够为其应用程序自定义延迟,启动间隔和资源使用权衡的空间。 由于每个应用程序都不同,hls4ml的目标是使用户能够通过自动神经网络转换和FPGA设计迭代来执行此优化。

以往物理学家必须手动创建简单的触发算法和工程师然后将程序Verilog或VHDL的FPGA中。这是一个非常耗时的过程,可能需要专家物理学家和工程师几个人月的工作。项目另一位负责人来自费米实验室的 Nhan Tran说,“我们设想将神经网络置于一级触发器中。没有人真正考虑过将那些不同类型的神经网络放在那里的可能性。一旦你将这种能力提供给社区,它就可以无处不在。我们在μ子识别,tauleptons,光子,电子 - 我们看到的所有粒子,我们可以使用这些更复杂的技术来提高性能。“

使用hls4ml提高抽象级别允许物理学家使用大数据行业标准开源框架(如Keras,TensorFlow或PyTorch)执行模型优化。 hls4ml使用这些框架的输出来生成FPGA加速固件。 Tran表示,这种自动化节省了大量时间,“电子工程师是物理学中的稀缺资源,而且价格昂贵。我们越多地使用物理学家来开发算法和电子工程师来设计系统,我们就越好。让物理学家更容易获得机器学习算法有很大帮助。这就是为什么我们开始使用HLS而不是Verilog或VHDL级别的美妙之处。现在,我们可以在一天内完成从训练到FPGA测试的整个链条。“

该团队使用层数有限的多层感知器神经网络,以满足触发器100纳秒的实时性能要求。 除AI推理外,FPGA还提供传感器通信,数据格式化和预过滤计算等传入原始传感器数据之前所需的计算,从而加速整个探测器的应用。

Tran总结了hls4ml项目的好处,“在我们的日常工作中,它确实允许我们通过触发器在整个实验的每个级别访问机器学习。在此之前,您必须考虑一个非常具体的应用程序,并且非常努力地开发VHDL或Verilog的模型和固件。现在,您可以更广泛地思考如何改进物理,无论是在一些热量计中的低级别命中聚合,还是一直到完整事件和优化特定拓扑。它允许在整个实验中更快地传播和采用机器学习。“

当被问及他是否期望他的团队采用机器学习技术可能会让更多的从业者进入高能物理领域时,Harris得出结论:“传统情况就是如此。即使希格斯发现,也有很多机器学习。人们喜欢来到这个领域,因为你可以进行最先进的机器学习并处理非常大规模的计算问题。人们对这些技术很有兴趣,人们很兴奋。“

后记
当物理学家为了训练神经网络而不知道它实际上是什么样子时,他们如何使用机器学习算法搜索暗物质?

Harris回答说:“我们假设它会是什么样子,并写下我们对暗物质所期望的所有标签的清单。”这个在高能物理学中有着丰富的历史。 Tran补充道,“我们正在训练一类非常通用的标签。 例如,暗物质本质上会在探测器中丢失能量,因为它会直接穿过它。 如果我们可以使用机器学习技术来优化性能,以了解丢失的能量,从而提高我们对暗物质的敏感度。“

HLS4ML 项目链接:https://hls-fpga-machine-learning.github.io/hls4ml/

学术报告视频:
GRCon17 - RFNoC Neural Network Library Using Vivado HLS - EJ Kreinar

文章转载自:Xilinx学术合作

推荐阅读