OCR

给AI换个“大动力小心脏”之OCR异构加速

作者: derick,腾讯架构师

OCR在通用文字识别等场景下有广泛应用,基于FPGA异构加速的OCR识别相比CPU/GPU实现具有延时小、成本低的优势。我们设计了多FPGA芯片协同的异构加速架构,能快速适配业务OCR模型变化,检测识别整体性能为GPU P4 130%,处理延时仅为P4的1/10,CPU的1/30。

1.文字识别技术- OCR

OCR技术,通俗来讲就是从图像中检测并识别字符的一种方法,在证通用文字识别、书籍电子化、自动信息采集、证照类识别等应用场景中得到了广泛应用。通用场景的OCR因此通用场景下的OCR技术一直都是人工智能领域挑战性极强的研究领域,不需要针对特殊场景进行定制,可以识别任意场景图片中的文字。

通用OCR技术包含两大关键技术:文本检测和文字识别。检测模型的作用简单来说就是确定图片中哪里有字,并把有字的区域框出来。文字识别是将文本检测box作为输入,识别出其中的字符。

作者:Steve Leibson, 赛灵思战略营销与业务规划总监

在下周的Vision Stuttgart 2014上,你会见到赛灵思Zynq SoC用于智能视觉应用的现实展示,包括模式匹配、条形码阅读和实时OCR(光学字符识别)。OCR演示基于MVTec的HALCON 机器视觉软件,视频软件运行于安富利最新推出的基于Zynq安富利智能视觉开发套件

Avnet Smart Vision Development Kit

同步内容