午后加油站

开源工具助你在FPGA上轻松实现二值化神经网络

作者:清风流云

神经网络技术起源于上世纪五、六十年代,当时叫感知机,拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果,早期感知机的推动者是Ronsenblatt。后来又发展到多层感知机,而多层感知机在摆脱早期离散传输函数的束缚,在训练算法上使用Werbos发明的反向传播BP算法,这个就是现在大家常数的神经网络NN,而目前存在的神经网络最常见的有:ANN,RNN,以及CNN。CNN是一种多层神经网络,擅长处理图像特别是大图像的相关机器学习问题,它可以通过一系列方法,成功将数据量庞大的图像识别问题不断将维,最终使其能够被训练。

GUNNESS开源工具:

惊呆! 数据中心加速神器---1680核处理器+FPGA !

作者:蒙面侠客

背景:
数据中心采用FPGA做加速器已经成为主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,Intel的Altera,Baidu公司等。数据中心具有大规模并行数据处理,高数据吞吐量,低延时,能效高等特点。但是存在两个问题,第一个是软件的问题,软件移植和保证一定加速的工作负荷;第二个是硬件的问题,配备众核处理器,25-100G的网络接口卡,一些DRAM/HBM通道,容易时序收敛等。

现介绍一种GRVI Phalanx FPGA加速器结构。其中,GRVI是一种基于FPGA的有效的RISC-V运算单元,即RISC-V RV321软处理器核;Phalanx是一种并行FPGA加速器框架,由PE集群,SRAM,加速器,DRAM,I/O控制器等组成,减少在开发和管理FPGA加速器时所需付出的消耗和努力;还需要Hoplite NoC,它是一种基于FPGA优化的定向2D环形片上网络系统,用到的技术还有局部内存共享和全局信息流通等。

作者:清风流云

Innovative Integrations公司是一家专门从事采用数据和模拟接口或FPGA处理数字信号的嵌入式电子产品开发商,此外,他们对于开发工业环境或其他恶劣环境下的数据采集应用设计十分擅长,下面就来简单了解一下他们团队近期推出的XA-RX XMC模块。

XA-RX XMC 模块:
Innovative Integrations开发的XA-RX XMC 模块是一个IMC IO模块,支持8路16位,每秒采样率达到125M的ADC转换通道,十分适合应用在测量高速刺激反应的捕捉,超声捕捉以及RADRA应用中,此外,还可以通过8路SSMC RF连接器连接到外部。 正因为如此,它具有十分灵活的触发方式,包括计数触发、软件触发以及外部触发,而参考时钟源的选择可以是外部时钟也可以是板上PLL可编程部分的时钟源。当它将两个ADI器件AD9653 ADC模块聚合在一起时,在16bit的采样模式下,其采样带宽可以达到1G每秒。同时XA-RX模块还可以将采集到的数据汇集到一个Xilinx Artix-7 A200T FPGA中,以便用户可以对数据进行本地处理,方框图如下所示:

Opal Kelly公司推出面向FPGA模块的SYZYGY规范接口

作者:stark

我们在设计和使用各种开发板卡时都会遇到各种扩展接口类型,比如迪芝伦(Digilent)公司推出的Pmod接口、工业标准的FMC(FPGA Mezzanine Card)接口连接器等,选用不同的接口连接器类型会对信号的传输性能带来直接的影响。近日Opal Kelly公司宣布推出SYZYGY开放式I/O接口标准,它是在成本和性能都介于Pmod接口连接器和FMC接口连接器之间的一种接口类型,Opal Kelly打出的宣传语也是“Goldilock(刚刚好)”。(图1:Opal Kelly公司推出的基于Xilinx Zynq SoC的SYZYGY接口扩展板卡)

SYZYGY接口规范定义了两种形式的连接器:标准SYZYGY连接器支持28个单端阻抗控制信号传输,其中16个可以用于差分对接口标准(LVDS)信号,其管脚间距为0.8mm。收发器SYZYGY连接器支持四通道千兆级(Gigabit)收发器的数据传输,同时支持18个单端信号的传输,管脚间距0.5mm,收发器SYZYGY接口面向的是JESD204B数据采集、SFP+收发器等需要高速SERDES(串并转换)操作的场景。

机器人的眼睛,需要一个Spartan-6 FPGA

作者:蒙面侠客

自动驾驶,户外机器人,机器控制等方面的发展需要能够感知物理世界的3D图形传感器,这些3D图形传感器就像是人类的眼睛。Carnegie Robotics最近在他们的GigE 3D图形传感器中使用Xilinx的Spartan-6 FPGA将从双目摄像头分别采集的视频信息处理成融合的视频信息,这将使机器人在未知区域移动的时候规划安全的路径,例如在农业生产,居家应用,火灾现场的救援,战场清扫等场景。

图.1 Carnegie Robotics 3D图形传感器

图.1 Carnegie Robotics 3D图形传感器

基于Xilinx Z-7007实现Z-turn SBC简化版——Z-turn Lite

作者:清风流云

背景:
米尔科技的Z-turn 板卡实际是一个低功耗的高性能单板计算机(SBC),基于Xilinx Zynq-7010或Zynq-7020 全可编程SoC芯片实现。而Z-turn Lite是Z-turn板卡中的一个超低功耗的简化版本,下面将简单了解一下Z-turn Lite是什么样子的。

Z-turn Lite:

作者:stark

以太网成本低、部署简单灵活,目前已经深入到我们生活的各个方面,随着带宽需求的不断增加,100GE以太网商用也加快了步伐,NIC(Network Interface Card,网卡或者网络适配器)是网络系统中必不可少基本部件之一,它的基本功能包括数据从并行到串行的转换、数据包的组装和拆分、网络存取控制、数据缓存和网络信号等,面向100GE以太网NIC板卡一般采用光纤接口。

Netcope公司推出了基于Xilinx FPGA的NIC板卡NFB-100G2Q(NFB,Netcope FPGA Board的简称),采用的是Xilinx Virtex-7 580T FPGA器件,并且在100GE以太网上组成网络通信回路进行了性能测试,采用64字节数据包,通信速率达到了148.8M packets/秒,这几乎是100GE以太网的理论最大峰值。

作者:清风流云

背景:
时间大概是去年十月份左右吧,美国Digilent公司就曾推出过一款专门面向创客与兴趣爱好者的Zynq-7020开发板——Arty Z7。据了解,Arty系列是由Xilinx与Digilent携手联合推出的专门迎合全球创客对高配置性能、高可扩展性、高性价比FPGA开发板需求的产品。Arty-Z7秉承Arty系列一贯的体积小巧、兼容Arduino、配置强劲的特点,同系列中,更早问世的另一款产品为配置Xilinx Artix-7 FPGA的A7版Arty。近日,Digilent为Arty家族增加了新的成员,一起看看新成员的feature吧。

Digilent Arty S7:

看一刻钟视频,C/C++代码运行效率就提高了?

作者:stark

我们在实现嵌入式系统功能的同时毫无疑问还需要进行系统工程的优化,尤其是代码的优化,这样才能够充分发挥嵌入式处理器的性能,让代码执行的更快。通常我们会采用三种方式:一是提升处理器的时钟速度,比如采用更高速度等级的器件,二是采用更多内核的处理来分担任务负载,三是采用更高端代码兼容性更强的处理器。这三种方式无疑会增加系统功耗和成本,另一种方式就是采用Xilinx All Programmable Zynq SoC和Zynq UltraScale+ MPSoC多核异构系列器件。

图1:Xilinx推出的Zynq UltraScale+ MPSoC多核异构器件

图1:Xilinx推出的Zynq UltraScale+ MPSoC多核异构器件

作者:清风流云

背景:
据了解,Pinnacle设计的Denali-MC IP目前已经可以在包括Xilinx的Zynq 7045 FPGA芯片在内的多款可编程芯片产品中实现,比如可以用在具有DSP和SoC+ DSP架构的产品中(包括TI和Qualcomm的相关产品)。还了解到Denali-MC monitor的ISP的核心是一个基于超级算法的内核,这个算法core不仅可以为HDR动作产品在图像补偿时提供最大可能HDR,还可以提供一个end-to-end的全相机ISP,而拥有这两个优势对于一个相机系统是十分有意义的,因为它们可以在相机试图捕捉一天中任何时间任何场景下的可用视频和最大可能识别视频点发挥重要作用。下面对Denali-MC的详细情况作一点简单说明。

Pinnacle Denali-MC:

同步内容