加速

白皮书(WP487):8 位点积加速

UltraScale和UltraScale +器件中的DSP架构通过具有可扩展性能的INT8矢量点积增强了神经网络的卷积和矩阵乘法吞吐量。 借助本白皮书中描述的方法,与传统原生DSP资源的使用相比,吞吐量可以提升1.75到2倍。

视频:打破性能障碍 ,用C代码实现硬件加速

有时候您迫切地需要您的 C 代码运行地非常快,真的非常快。但对于大多数开发团队来说,专门雇佣一个硬件专家来设计加速器是不太可行的。本视频由 EEJournal 录制,由赛灵思专家 Eric Ma为您带来如何在 C 代码中提供硬件加速能力。

本内容主要讨论 FPGA的使用以及神经网络加速的趋势。

同步内容