hash算法在FPGA中的实现（二）——hash链表

judy 在周一, 06/12/2023 - 09:37 提交

在前面的文章中：hash算法在FPGA中的实现（一）——hash表的组建，记录了关于hash表的构建，这里记录另外一个话题，就是hash链表。我们知道，只要有hash的地方，就一定有冲突，关键就看如何解决冲突了。这里介绍两种常见的设计hash链表的方案。当然，解决hash冲突也不一定就要用链表的方法，还有其他方案。

hash链表说明

首先说下什么hash链表？还是借用上一篇文章中的图片来说明这个问题，如下图所示。hash链表是为了解决hash冲突而建立的一种数据结构。当某个key计算出hash值后，对应的hash桶中已经有了数据，出现了冲突，那这个时候就需要用一个链表来将具体相同hash值的key“链”起来，方便后续的查询。

图中关于hash链表的示意，只是一种简单的表示，在FPGA的实际设计中，情况往往要复杂得多。

方案1——DDR

有的时候，我们并不知道链表到底会有多长，那么自然地会想到用DDR来存放链表。如何在DDR里组织数据结构呢？一般来讲，hash链表的数据结构如下：

hash桶中除了上文所讲的数据结构外，还有一个下一链的地址addr1，它指向链表的一个节点，该链表节点的数据结构和hash桶类似，也包括key值和地址，如图中key A和addr2，对于由addr2指向的最后一链，只有key B和最后一链标记NULL。

这样的数据结构，在DDR中存放的时候，显然是不高效的。因为每处理一次hash，有多少个链表节点就要读多少次DDR。我们知道DDR的性能有2个指标，一个是Gbps，一个是Mpps。处理一次hash时读DDR的次数越多，处理的hash次数就会越少，性能就越低，所以我们优化链表的数据结构，降低对DDR的读取次数。

优化的思路和hash桶的数据结构类似，如下图所示：

在一个节点中，不再只存放一个key，上图示例是存放了5个key。实际一次DDR的读写，可能最少是128byte或者256byte，以104bit的五元组为key来计算，可以存放9个key。一次可以读取N个key，相比以前的链表方案，读DDR的次数为原来的N分之一，性能提升N倍。

将这个话题继续引申下，如果hash桶存放在DDR中，那又如何构建hash表呢？如果真的需要把hash桶存放在DDR中，hash表的构建和hash链表的构建就是完全一模一样的了。

方案二——内部RAM

如果考虑所有的冲突次数在一定范围之内，那么可以把所有的链表存放在一起，即存放在一个内部的RAM中，实现对所有hash桶的链表管理。如下图所示：

以4个hash桶为例子说明链表的管理，key1的hash值为0，落入到hash桶0，因此时hash桶中的指针指向地址0，即addr0，addr0为空，即可以写入key1在地址0中。同样key2的hash值也为0，由于addr0中已经有数据，此时addr1为空，因此将key2写入addr1中，同时把addr1写入key1中的下一链，完成链表的构建。

其他的key值大家可以自行推敲演练。采用这样的方案，所有的链表都存放在一个ram中，处理冲突的次数是有限的，相比DDR的方案，还是简单一些。

总结

关于上述2种方案，这里做一个简单的总结。

不管采用哪种方案，高效地组建表项，减少对hash表和链表的访问次数是hash处理性能的关键。

最新文章

FPGA是网络交换领域的不二选择	重温FPGA设计流程六：(纯Verilog实现数字钟)	从Xilinx Kintex-7认识FPGA
AMD 推出 Spartan UltraScale+ 系列，专为成本敏感型边缘应用打造	别乱用 FULL_CASE 和 PARALLEL_CASE	基于FPGA的RGMII接口设计（一）——GMII到GRMII的转换

每日头条