文字识别扫描 尚书OCR使用经验谈_第1页
文字识别扫描 尚书OCR使用经验谈_第2页
文字识别扫描 尚书OCR使用经验谈_第3页
文字识别扫描 尚书OCR使用经验谈_第4页
文字识别扫描 尚书OCR使用经验谈_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文字识别扫描 尚书OCR使用经验谈一、扫描操作及注意点 1.扫描仪联机 在确定扫描仪能够在被“SCANNER TEST”找到的条件下(见图一),运行尚书OCR。然后点击“扫描”按扭(见图二)。过一会,扫描仪的控制窗口就会出现,并保证在“黑白两值”“300DPI”的条件下,进行图像预览(见图三)。2.放大预览及调节图像的清晰度 为了达到最佳的识别效果,对输入稿件在扫描时的要求是清晰。为此,我们可以通过“.放大预览”对文稿中的几个文字进行取样扫描(见图四),从而对图像的亮度进行更为细致的调节。调节的工具是扫描仪工具内的“阀值”。下面的例子,是不同的阀值下的扫描结果(见图五)。调节到适当的阀值后,您

2、就可以选择“扫描”按扭了。扫描的结果会传递到尚书OCR内,并且扫描仪控制窗口会自动消失。二、辨识前所需要注意的事项 下面就是在尚书OCR内的操作了。1注意文字的倾斜校正。由于OCR的辨识原理是采用字模的方式进行的,所以一定要注意稿件是否水平。其工具可以采用图像倾斜校正按扭来解决(见图六)。2对稿件进行识别的预先处理。原因是由于原稿的情况是差异万千,所以需要用户在识别前,做一些预先的处理。去除杂点和图像。如文稿中含有图像,OCR是不能识别的,如果有图像存在,会影响OCR的文字切分。可考虑使用“图像的块擦拭”工具将文档中的图像去除,同时将一些杂点,尽量的去除。 针对文档中出现分栏的情况,建议您要手

3、动设定辨识范围,而不要采用“自动切分”。因为这样才能保证辨识结果的连贯性。(见图七)3采用适当的辨识方式 注意您的稿件是横排还是竖排,可选择编排格式按扭,以保持对应。 目前的尚书OCR提供了简体、繁体、英文的识别方式,其选择是在窗口上的下拉菜单,而非按扭菜单。按扭中的简体、繁体、ENGLISH是尚书OCR的在不同的操作系统上获得正确显示的显示模式,请千万不要搞混乱。(见图八)确认以上的步骤后,您此时就可按下“识别”按扭,识别完毕后,系统进入“文稿校对界面”。 三、文稿校对 一般,OCR对不能完全确定的文字,会显示出兰色,请用户确认。但请注意,在没有提示出错的地方,也会有可能出错。所以请用户在校对时,可以通读一遍,来提高文字校对的效果。 1您可以在此界面内,通过操作系统提供的文字输入方法,添加您所需要的文字。(见图九)2OCR提供选择使用外部编辑器的功能,您可以选择WOR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论