引用:http://www.qqread.com/app-soft/b261137107.html
版面分析阶段:扫描得到的是图像,要把图像转变为文本,需要OCR软件。现在市面的上OCR系统很多,而且有些OCR系统的智能化程度很高,连表格也都能正确识别。本文以笔者经常使用的北信OCR系统为例向大家介绍OCR使用的技巧。
在识别前,首先要对扫描得到的图像进行校正,这是进行下一步工作的基础,所以在扫描时,应尽力使原稿摆正,若得到的图像还有点倾斜,就要进行倾斜校正。一般的OCR系统都有自动校正的功能,如果没有,那就只能手动校正了。
现在的OCR系统,它还不能自动识别扫描得到的图像中的文字、表格、图形等元素,这就要求我们分别对不同的元素进行画框,定义其属性,以便OCR系统能够正确识别。在这里要注意,对于大小不同的文字,特别是横竖排版的文字,最好分别定义在不同的框中。对于图像中的污点,可以使用清除、橡皮擦等命令或工具消除。另外,画框时这要注意画框的次序,以避免识别后的文字“前言不搭后语”。
更多内容请看常用软件加密宝典、杀毒软件专栏、软件插件专题,或进入讨论组讨论。
OCR(Optical Character Recognition)是通过扫描仪,利用OCR软件,将点阵图形的的字符转变成文本的技术。很多人在使用这项技术的时候,因为方法不当,致使识别后的文本误码率很高。下面,我就将本人在使用当中总结的经验推荐给大家,希望能给你的工作带来方便。
版面分析阶段:扫描得到的是图像,要把图像转变为文本,需要OCR软件。现在市面的上OCR系统很多,而且有些OCR系统的智能化程度很高,连表格也都能正确识别。本文以笔者经常使用的北信OCR系统为例向大家介绍OCR使用的技巧。
在识别前,首先要对扫描得到的图像进行校正,这是进行下一步工作的基础,所以在扫描时,应尽力使原稿摆正,若得到的图像还有点倾斜,就要进行倾斜校正。一般的OCR系统都有自动校正的功能,如果没有,那就只能手动校正了。
现在的OCR系统,它还不能自动识别扫描得到的图像中的文字、表格、图形等元素,这就要求我们分别对不同的元素进行画框,定义其属性,以便OCR系统能够正确识别。在这里要注意,对于大小不同的文字,特别是横竖排版的文字,最好分别定义在不同的框中。对于图像中的污点,可以使用清除、橡皮擦等命令或工具消除。另外,画框时这要注意画框的次序,以避免识别后的文字“前言不搭后语”。
相关图文阅读
频道图文推荐
健 康 咨 询
时 尚 咨 询



