实验二 视觉光学字符识别(OCR)实验

生活百科1年前 (2023)发布 aixure
85 0 0

一、实验目的

1.了解机器视觉系统的组成,掌握机器视觉基本应用原理和方法;

2.结合印刷体字符识别方法,能实现身份证号码的定位、字符分割和号码中数字0-9的识别

二、实验设备

1.SCI主机 1台

2.SCI摄像机 1个

3.SCI光源控制器 1台

4.SCIVision机器视觉软件 1套

实验二 视觉光学字符识别(OCR)实验

三、实验原理

OCR技术是光学字符识别的缩写(Optical Character Recognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

OCR识别的原理是计算机对图像进行版面分析、处理和模式识别。图像版面分析是指通过对图像文字的预处理,文字图像的分割和坐标定位;文字模式识别是通过检测暗、亮的模式,放大图像确定其形状特征并进行提取和判断,最终通过图像黑白点二进制与字符编码进行匹配,根据最相近的匹配度将文字图像特征进行文字的转换。

通过扫描仪设备将纸质的期刊、学位等文献数据进行扫描,再人工通过鼠标在图像文字区域进行画框,选择特定区域进行文字识别,然后对版面字切分、归一化等。

文字识别主要使用了黑白二值法,将文字颜色取反,也就是白变成黑,黑变成白,以单字图像区域分为上下两部分,这种方式将每个字都可以划分为不同区域,将不同区域的反选区域用二进制的方式进行转换,将每个文字区域划分后生成一个二进制编码光学字符识别,我们预先对每个标准的文字进行二进制编码存放到数据库中,用OCR文字识别完的结果与标准数据库中的二进制编码进行比对,从而选择最接近的二进制编码文字,最终得到文字识别结果。

四、实验步骤

1、SCI系统图像调节

(1)双击

打开SCI软件,

(2)点击下方图像输入输出按钮,

(3)点击

,添加

算子,

(4)点击“路径”按钮,添加电脑桌面上ocr识别图片“样本图库”所在的文件夹,

实验二 视觉光学字符识别(OCR)实验

(5)点击下方图像增强按钮,

(6)添加二值化算子,设置相应的通道阀值;添加缩放算子,设置x采用值为1024,y采样值为768,

(7)点击下方图识别按钮,添加OCR算子

实验二 视觉光学字符识别(OCR)实验

(8)点击OCR算子的设置,进入OCR参数设置页面

A.识别页面

1)检测对象:选取检测对象的类型,即需要识别的对象是暗对象、亮对象或灰对象。

2)忽略靠近边缘的对象:进行OCR识别时,如果勾选,将剔除找到与ROI边缘接触的干扰对象;不勾选,则显示出来。

3)识别结果:显示OCR识别的字符信息。

4)字符个数:OCR识别的数量。

5)替代字符:识别失败的字符用‘?’代替。

B.预处理页面

1)在“二值化”菜单中,将其设定为“自动”,即对阈值进行自动设置。

2)“形态学”按默认值即可,迭代次数为 0,即不进行形态学处理。

C.分割页面

1)可对字符元素分割参数进行设置,可设置字符元素的宽度、高度与大小范围等。

2)当待识别的每个字符都用一个红色框标记时,则字符分割成功。红色框为 Blob 字符元素的部分参数结果显示。

D.训练页面

1) 字符集路径:

读取:从本地 xml 文件中读取训练字符库。

追加:从本地 xml 文件中读取字符识别库并添加到当前识别库。

保存:保存当前识别库到本地 xml 文件。

2) 字符类别:已训练的单个字符。

3) 字符样本:已训练的字符样本。

a) 重命名:对指定样本重命名。

b) 删除:删除指定样本。

4) 方式:

a) 训练所有字符:一次训练多个字符。对已分割好的多个 Blob 字符块进行一次训练。

b) 训练单个字符:一次训练一个字符。

c) 序号:待训练字符对应分割页面 Blob 块的序号。有助于选中待训练字符。

5) 训练:ROI 画好后,手动输入要训练的内容,点击训练即可完成。

备注:最下方训练按钮前方的输入框中输入待检测字符“ ”,点击“训练”按钮。识别库采用神经网络算法构建的,对输入样本进行训练,完成训练后,在字符集路径下方点击“保存”,选择保存路径和文件名。识别库经过多组样本训练后,才具有OCR识别功能。

(9)添加Overlay算子,进入Overlay参数设置页面,添加文本用于显示识别到的字符,OCR-1-DataString,

(10)点击其他工具,添加导出到CSV算子,

实验二 视觉光学字符识别(OCR)实验

(11)设置CSV算子,导出识别数据存放路径和文件名,

实验二 视觉光学字符识别(OCR)实验

(12)设置CSV算子,导出识别数据的列信息

实验二 视觉光学字符识别(OCR)实验

(13)点击运行按钮,运行程序,对“样本图库”文件夹的数字进行OCR的识别,对于识别失败的字符‘?’光学字符识别,进行手工训练,并把训练正确后的结果保存在识别库文件“*.xml”中。

五、实验报告要求

1、设计程序算子流程图,设置相应算子的参数,写出程序流程图,写入实验报告,运行和测试程序,显示OCR检测结果并(需要截图显示)。

2、利用“测试图”文件夹的图片,测试经过训练后的OCR识别功能,并记录数据。

序号

图片名*.jpg

识别到的数字

是否正确

限时特惠:本站每日持续更新海量各大内部网赚创业教程,会员可以下载全站资源点击查看详情
站长微信:

© 版权声明

相关文章

暂无评论

暂无评论...