频道直达 - 专题 - 新闻 - 技巧 - 组网 - 开发 - 安全 - web编程 - 图像 - 操作系统 - 数据库 - 教育 - 旅游 - 健康 - 时尚 - 驱动 - 软件 - 游戏 - 多媒体 - ERP - 讨论组

OCR软件使用宝典

来源:天极网软件频道 作者:杨兴平 出处:巧巧读书 2005-12-05 进入讨论组
下一页 1 2 
引用:http://www.qqread.com/app-soft/b261137107.html  

  OCR(Optical Character Recognition)是通过扫描仪,利用OCR软件,将点阵图形的的字符转变成文本的技术。很多人在使用这项技术的时候,因为方法不当,致使识别后的文本误码率很高。下面,我就将本人在使用当中总结的经验推荐给大家,希望能给你的工作带来方便。

  扫描阶段:识别率的高与低,很大程度取决于该阶段,其中原稿的质量起着决定性的作用。对于报纸等非常低劣的原稿,我们可通过扫描界面减小或增大亮度参数的方法提高识别率,如果还未达到要求,还可增大扫描时的分辩率。分辩率的提高会增大图像的大小,所以就会延长扫描时的时间。不过,对于太小的字体,或不太清楚的文字,适当增大分辩率,可提高识别率。对于杂志、书本等字迹清晰,对比强烈,质量比较好的原稿,可以把亮度设为0,分辩率设为300,在此基础上,根据预扫得到的图像,本着字体笔划即不能互相粘连漆黑一片,又不能断笔画少点的原则进行调整。

  版面分析阶段:扫描得到的是图像,要把图像转变为文本,需要OCR软件。现在市面的上OCR系统很多,而且有些OCR系统的智能化程度很高,连表格也都能正确识别。本文以笔者经常使用的北信OCR系统为例向大家介绍OCR使用的技巧。

  在识别前,首先要对扫描得到的图像进行校正,这是进行下一步工作的基础,所以在扫描时,应尽力使原稿摆正,若得到的图像还有点倾斜,就要进行倾斜校正。一般的OCR系统都有自动校正的功能,如果没有,那就只能手动校正了。

  现在的OCR系统,它还不能自动识别扫描得到的图像中的文字、表格、图形等元素,这就要求我们分别对不同的元素进行画框,定义其属性,以便OCR系统能够正确识别。在这里要注意,对于大小不同的文字,特别是横竖排版的文字,最好分别定义在不同的框中。对于图像中的污点,可以使用清除、橡皮擦等命令或工具消除。另外,画框时这要注意画框的次序,以避免识别后的文字“前言不搭后语”。 更多文章 更多内容请看常用软件加密宝典杀毒软件专栏软件插件专题,或进入讨论组讨论。
下一页 1 2 
收藏此文】【 】【打印】【关闭
相关图文阅读
频道图文推荐
健 康 咨 询
时 尚 咨 询
巧巧读书宗旨
相关专题
讨论组问题推荐
站内各频道最新更新文档
站内最新制作专题
热门关键字导读
Photoshop教 程照片处理 照片制作 PS快捷键 抠图
计 算 机 故 障XP系统修复
艺 术 与 设 计设计 流媒体 设计欣赏 边框
计 算 机 安 全ARP
站内频道文章精选
巧巧电脑频道编辑信箱  告诉我们您想看的专题或文章