24.2 纳秒!Xilinx 携手 LDA Technologies 刷新电子交易世界记录

所谓创造世界记录,就是以某种方式宣告:“这是我们身为人类的最好成绩。现在让我们一起打破它。”从棒球、吉尼斯世界记录到奥运会,人类在举重、跳高、跑步项目上屡屡打破记录。而在商业领域,能够比竞争对手更快地做出响应并快速进行调整,是一件极具价值的事情。

电子交易市场与其他市场的最大不同之处在于,它能够将每一块钱的价值进行精确分配,用以提高交易速度。提高计算速度就意味着能够率先进入市场,让交易员排在订单队列的最前面。

2017年,电子交易系统衡量网络延迟或时延的方式是测量从收到交易信号到处理买/卖订单的时间,也称为“交易延时(Tick-to-trade time)”,一般大于一微秒。这些交易系统通常使用基于 ASIC 的网络接口卡 (NIC)。这些 NIC 支持交易应用旁路操作系统并采用普通市售计算机组件进行构建。

2010年代之初,Solarflare(目前隶属于赛灵思)针对一种降低网络时延的新方法申请了数项专利,而且这种新方法实现了可观的时延下降。几年前,提供基于行业标准的技术研究与测试工具的机构 Securities Technology Analysis Center (STAC®) 开发出了新的 STAC-T0™ 基准。STAC-T0 基准根据期货和证券等快速交易市场制定而成,是衡量交易平台能够以多快的速度对以太网传递的市场信号做出响应(不含交易逻辑所用时间)的绝对衡量标准。

引以为傲的新记录

近期,赛灵思携手 LDA Technologies 创下了新的 STAC-T0 基准测试记录。

2020 年 5 月 21 日,STAC 确认我们的 STAC-T0 性能创下 24.2 纳秒的世界记录。

赛灵思与 LDA 联合开发的电子交易平台从数据输入到数据输出的时延为 25 纳秒,这使得我们的超低时延 Raptor FPGA 交易前风险管理解决方案的时延达到前所未有的领先水平。

——William Dallyn,Fusion System 集团区域销售总监

Raptor 是 Fusion Systems 的产品。

在构建世界一流的交易系统时,必须从大量的计算基础出发。在本例中,我们采用了联想最新发布的 SR665 双插槽服务器以及一对 AMD® EPYC™ 7742 可扩展 (Rome) 处理器。借助 64 核心和 128 个计算线程,该服务器可以提供无与伦比的 I/O 性能,时钟频率高达 3.4GHz,非常适合交易系统。它采用基于赛灵思 Onload® 技术的网络适配器连接到交易所,并设置必要的 TCP 会话。

图:Xilinx XtremeScale X2522 以太网适配器卡

为了在执行交易时使用这款拥有绝对最低时延的平台,我们安装了 LDA Technologies面向 HFT 的 FPGA 电路板 SBM09P-3,其搭载了赛灵思 UltraScale+ VU9P-3 FPGA,并运行 LDA 的 644MHz 交易框架。该交易框架内置Lightspeed v2 TCP和 LDA 的 10G 644 MHz/16 位 MAC/PCS IP 核。该LDA 电路板专门面向交易所打造,提供了两个抖动衰减器、一个 Stratum-3 级时钟和 576MB 超高速 SRAM。虽然测试系统是专门构建的,但使用易于获取的服务器平台和组件也能轻松复制该交易系统。

图:搭载赛灵思 Virtex™ UltraScale+ VU9P-3 的 LDA Technologies SBM09P-3 电路板

所有交易系统的目标都是压缩交易时延。LDA 聚焦于在 FPGA 电路板上加装抖动衰减器,消除输入信号中的任何不必要时延。使用抖动衰减器后,电路板上运行的 FPGA 交易逻辑能够将其参考时钟锁定到交易所与信号一同传输的时钟上,从而与交易所进行同步。这种方法可以确保将宝贵的时间仅用于处理有价值的数据,而不会浪费时间在不同的时钟域之间传递数据。

因此,当我们思考在短短的 24.5 纳秒内通过系统传递有价值的数据所带来的重要意义的同时,不妨想想下面的这段话:

虽然通信速度的极限不能逾越光速,而计算速度受制于可以实现的晶体管的最小尺寸,最终有可能由时间的可分性本身决定,但交易技术仍在同步追求爱因斯坦相对论和量子现实这两个伟大发现的极致。——Peter Lankford,STAC 创始人兼总经理

我们非常欣喜地看到,随着技术不断突破芯片乃至物理学本身的极限,超低时延交易将在未来迎来迅速发展。

推荐阅读