实验二视觉光学字符识别（OCR）实验

生活百科1年前 (2023)发布 aixure

85 0 0

一、实验目的

1.了解机器视觉系统的组成，掌握机器视觉基本应用原理和方法；

2.结合印刷体字符识别方法，能实现身份证号码的定位、字符分割和号码中数字0-9的识别。

二、实验设备

1.SCI主机 1台

2.SCI摄像机 1个

3.SCI光源控制器 1台

4.SCIVision机器视觉软件 1套

三、实验原理

OCR技术是光学字符识别的缩写(Optical Character Recognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

OCR识别的原理是计算机对图像进行版面分析、处理和模式识别。图像版面分析是指通过对图像文字的预处理，文字图像的分割和坐标定位；文字模式识别是通过检测暗、亮的模式，放大图像确定其形状特征并进行提取和判断，最终通过图像黑白点二进制与字符编码进行匹配，根据最相近的匹配度将文字图像特征进行文字的转换。

通过扫描仪设备将纸质的期刊、学位等文献数据进行扫描，再人工通过鼠标在图像文字区域进行画框，选择特定区域进行文字识别，然后对版面字切分、归一化等。

文字识别主要使用了黑白二值法，将文字颜色取反，也就是白变成黑，黑变成白，以单字图像区域分为上下两部分，这种方式将每个字都可以划分为不同区域，将不同区域的反选区域用二进制的方式进行转换，将每个文字区域划分后生成一个二进制编码光学字符识别，我们预先对每个标准的文字进行二进制编码存放到数据库中，用OCR文字识别完的结果与标准数据库中的二进制编码进行比对，从而选择最接近的二进制编码文字，最终得到文字识别结果。

四、实验步骤

1、SCI系统图像调节

（1）双击

打开SCI软件，

（2）点击下方图像输入输出按钮，

（3）点击

，添加

算子，

（4）点击“路径”按钮，添加电脑桌面上ocr识别图片“样本图库”所在的文件夹，

（5）点击下方图像增强按钮，

（6）添加二值化算子，设置相应的通道阀值；添加缩放算子，设置x采用值为1024，y采样值为768，

（7）点击下方图识别按钮，添加OCR算子

（8）点击OCR算子的设置，进入OCR参数设置页面

A.识别页面

1）检测对象：选取检测对象的类型，即需要识别的对象是暗对象、亮对象或灰对象。

2）忽略靠近边缘的对象：进行OCR识别时，如果勾选，将剔除找到与ROI边缘接触的干扰对象；不勾选，则显示出来。

3）识别结果：显示OCR识别的字符信息。

4）字符个数：OCR识别的数量。

5）替代字符：识别失败的字符用‘？’代替。

B.预处理页面

1）在“二值化”菜单中，将其设定为“自动”，即对阈值进行自动设置。

2）“形态学”按默认值即可，迭代次数为 0，即不进行形态学处理。

C.分割页面

1）可对字符元素分割参数进行设置，可设置字符元素的宽度、高度与大小范围等。

2）当待识别的每个字符都用一个红色框标记时，则字符分割成功。红色框为 Blob 字符元素的部分参数结果显示。

D.训练页面

1) 字符集路径：

读取：从本地 xml 文件中读取训练字符库。

追加：从本地 xml 文件中读取字符识别库并添加到当前识别库。

保存：保存当前识别库到本地 xml 文件。

2) 字符类别：已训练的单个字符。

3) 字符样本：已训练的字符样本。

a) 重命名：对指定样本重命名。

b) 删除：删除指定样本。

4) 方式：

a) 训练所有字符：一次训练多个字符。对已分割好的多个 Blob 字符块进行一次训练。

b) 训练单个字符：一次训练一个字符。

c) 序号：待训练字符对应分割页面 Blob 块的序号。有助于选中待训练字符。

5) 训练：ROI 画好后，手动输入要训练的内容，点击训练即可完成。

备注：最下方训练按钮前方的输入框中输入待检测字符“ ”，点击“训练”按钮。识别库采用神经网络算法构建的，对输入样本进行训练，完成训练后，在字符集路径下方点击“保存”，选择保存路径和文件名。识别库经过多组样本训练后，才具有OCR识别功能。

（9）添加Overlay算子，进入Overlay参数设置页面，添加文本用于显示识别到的字符，OCR-1-DataString，

（10）点击其他工具，添加导出到CSV算子，

（11）设置CSV算子，导出识别数据存放路径和文件名，

（12）设置CSV算子，导出识别数据的列信息

（13）点击运行按钮，运行程序，对“样本图库”文件夹的数字进行OCR的识别，对于识别失败的字符‘？’光学字符识别，进行手工训练，并把训练正确后的结果保存在识别库文件“*.xml”中。

五、实验报告要求

1、设计程序算子流程图，设置相应算子的参数，写出程序流程图，写入实验报告，运行和测试程序，显示OCR检测结果并（需要截图显示）。

2、利用“测试图”文件夹的图片，测试经过训练后的OCR识别功能，并记录数据。

序号

图片名*.jpg

识别到的数字

是否正确

限时特惠：本站每日持续更新海量各大内部网赚创业教程，会员可以下载全站资源点击查看详情
站长微信：

# 生活百科 # 分割 # 图像 # 字符 # 样本 # 识别

文章版权归作者所有，未经允许请勿转载。

cmos技术-采用CCD-in-CMOS技术的多光谱延时积分图像传感器

aixure

一个数字占多少字节-一个汉字究竟占多少个字节，大部分人都错了，我错了20年

aixure

面部识别-人脸识别这么好糊弄，我的钱会不会被盗刷？

aixure

js标签选择器-使用这些 CSS 属性选择器来提高前端开发效率

aixure

光学字符识别技术报告

aixure

cmos技术-【深度解析】CCD与CMOS传感技术的原理、作用及其区别对比详解

aixure

暂无评论

暂无评论...

实验二视觉光学字符识别（OCR）实验

不用登录和实名认证的游戏-实名认证形同虚设未成年人游戏“氪金”风险谁买单

上海到昆山地铁-今天起，上海轨交11号线江苏昆山段恢复跨省运营

相关文章

暂无评论

相关文章

实验二 视觉光学字符识别（OCR）实验

不用登录和实名认证的游戏-实名认证形同虚设 未成年人游戏“氪金”风险谁买单

上海到昆山地铁-今天起，上海轨交11号线江苏昆山段恢复跨省运营

相关文章

暂无评论

相关文章

实验二视觉光学字符识别（OCR）实验

不用登录和实名认证的游戏-实名认证形同虚设未成年人游戏“氪金”风险谁买单