高速FPGA系统设计几条军规

作者:小卓,来源:FPGA技术联盟

如果符合一些简单的设计原则,采用最新的Xilinx7系列FPGA架构上实现无线通信。Xilinx公司已经创建了典型无线数据路径的设计范例,表明中速级(-2)器件上使用的几乎100%的 slice资源都支持500 MHz以上的时钟频率。如何真正时序高速设计,需要注意一下几点。

一、影响时钟频率的基本规则

DSP48 slice数与时钟速率成反比

一般来说DSP48 slice数与时钟速率成反比。Block RAM资源也按照阶跃函数随时钟速率降低。这在无线电信号处理设计中较常见,其中Block RAM基本上用来按照相对高的采样率存储大量函数运算的系数集合,例如,DDS(直接数字合成器)的正弦/余弦值,峰值抵消脉冲产生器中的CFR (波峰因数衰减)系数,或DPD (数字预失真)模型中的非线性函数抽样。

所以,提供时钟频率能够降低Slice和BlockRAM的资源利用,当时钟频率从368.64转换至491.52 MHz(1.33时钟比) ,按照比例LUT和FF的数据量分别减少了1.34和1.44倍。将时钟速率从245.76放大一倍至491.52 MHz,这些数据减少了1.8倍和1.7倍。这种非线性行为基本上是为执行信号处理控制逻辑,不需要按照时钟频率进行线性放大。

信号采样率也影响资源利用率

采样速率为25 Msamples/sec的滤波器带宽在250 MHz运行时与带宽在500 MHz运行时相比所需的逻辑资源略降低两倍。采样速率为500 Msamples/sec的多相实现带宽在250 MHz运行时与带宽在500 MHz时相比,所需的逻辑资源增加两倍。对逻辑资源使用的一阶估计是时钟频率增加x倍相当于逻辑利用率减少0.85至1.1倍

二、高速设计其他注意事项

流水线设计

适当的流水线程序当然是设计高速程序的关键因素,所有的高速设计都推崇流水线设计,在此不做详细描述

合理使用BlockRAM

需要构建一个以上Block RAM的存储时,可通过选择最大限度地减少数据复用和资源利用的配置优化速度。举例来说, 存储16位数据的16K存储器最好使用16K × 1位的Block RAM进行构建,而不是1K × 16位的Block RAM.

正确使用DSP Slice

DSP slice逻辑本质上可支持较高的时钟速率。逻辑电平与数据路由路径的数量限制了速度,因此在构建高速设计时应在每一个或两个LUT电平上插入一个寄存器

合理的层次结构

1. 定义合理的层次结构,按照逻辑分区将设计划分成相应的功能模块。这种层次结构提供便于在层次边界寄存输出的方法,从而限制特定模块的关键路径。这样分析和修复在单一模块中定位的时序路径就很容易。实际上,定位超高时钟速度时,应在层次结构的一些层级使用多个寄存器级,以优化时序并为后端工具留下更多设计空间。好的设计层次结构应该将相关的逻辑集成在一起,使得区域分组和逻辑压缩更为有效;

2. 建立适当的层次结构可在多个模块时获取可重复结果

3. 在模块级应用实现属性,可令代码简单并具可扩展性,该属性可传播该模块中声明的所有信号

良好的时钟管理和时钟分配方法

1. 尽可能减少独立主时钟数量

2. 将时钟元件放在设计层次结构的顶层,以便在多个模块共享时钟,这将减少所需的时钟资源,提高时序性能,并降低资源和功率利用率

3. 在不相关时钟域之间使用适当的再同步技术

4. 限制时钟“使能”的使用。实际上这条规则难以实现,原因是在多周期实现中时钟“使能”通常需要评估数据样本或操作符输出。实现有效的降低功耗技术很有效。在任何情况下,必须适当寄存时钟使能信号以删除高扇出 nets

复位策略

1. 最小化复位网络的大小

2. 避免全局复位。

3. 优选同步复位,实际上对DSP48逻辑片和Block RAM是强制的。

三、总结

高速设计时FPGA设计的未来,随着信号处理能力的增强,FPGA高速设计必不可少。如何合理优化FPGA架构设计是我们必须要考虑的问题。

文章转载自:FPGA技术联盟

推荐阅读