衣原体感染前列腺炎:如何使用扫描仪进行文字识别

来源:百度文库 编辑:九乡新闻网 时间:2024/04/29 21:19:54

如何使用扫描仪进行文字识别

注明:本文仅以HP Scanjet3670 为例进行讲解,其他扫描仪使用方式也类似。

文章概要:

  一、扫描前的设置

  二、扫描中的过程

  三、扫描后的注意事项和扫描技巧

正文:

  本文通过:扫描前的设置;扫描中的过程;扫描后的注意事项和扫描技巧;三部分说明如何使用Scanjet3670进行文字识别(ocr)
一、扫描前的设置

  安装好扫描仪的驱动后,扫描软件也就安装完毕了,在桌面上会有扫描软件的快捷方式“HP Director”(从开始菜单的程序中也可以找到"HP照片及图像控制器"),双击后,会看到扫描软件的主界面,如下图:

  图 1:

  扫描前,请先对“扫描文档”进行设置,以便得到您想要的效果(软件会自动记录您此次的设置)。双击上图中的“设置”,在弹出来的菜单里面点击“扫描文档设置”,可以看到下图:

  图 2:

  在上图中可以看到三个选项,分别是“扫描设置”、“可编辑文本设置”和“首选项”,

  扫描设置(如图2):

  这里可以设置扫描结果的格式。

  注意 : 如果要进行文字识别,那么一定要选择"可编辑文本"或者"带有图形的可编辑文本"。这两者的区别是:"可编辑文本"适合不含图像的纯文字,如果原文件是图文混排的或者有表格,那么要选择"带有图形的可编辑文本"。 可编辑文本设置(如下图):

  图 3:

  在这里我们可以选择要识别的原稿文字语言(OCR语言),由于识别语言只能选择一种,所以原文件最好是单一文字(如果是中英文混派,可以选择简体中文,或者分成两段扫描)。此处还可以设置,是否在扫描结果中保持页面格式。

  首选项:

  此处可以设置是否进行自动剪裁(一般可以不选此项)。

二、扫描中的过程

  进行完这些设置之后,放好原稿(方向和正反可以参看玻璃板右上的图示),我们可以点击下图中的"扫描文档",开始进行扫描了。

  图 4:

  软件运行后会弹出一个窗口(如下图),让您选择扫描的文档类型,以及要将结果发送到什么程序里面(比如word)或者保存为一个文件(可以另存为pdf文件)。

  图 5:

选择好之后点"扫描",首先会扫出一个如下图的预览图片(在主界面的设置里面,可以选择是否出现扫描预览)。

  图 6:

  我们可以用鼠标圈住要识别的部分,建议把走周围的白边圈在外面这样可以提高识别率,然后选"接受"。之后软件会提示"是否将另一页扫描到当前的文档中?如下图:(注意,只有在上面的“扫描可编辑文本”中选择了“是”,才会有此对话框)

  图 7:

  如果有多页文档需要识别然后合成一个文件,就请将第二页文件放到玻璃板上,然后点击"是"。这样我们可以把很多页原稿识别后形成一个文件。识别完最后一张后点击"否",完成扫描。经过页面处理之后,word会自动打开,里面是识别好的内容。如下图:

  图 8:
如果原文件是表格,也可按照上面的方法去操作,同样可以识别. 如果您希望在Microsoft Excel软件中编辑表格,可以先扫描到word里面,然后在word里面打开扫描好的表格,全选,拷贝,再打开Excel软件,粘贴。效果如下图:此时您可以在Excel中编辑表格了。

  图 9:

三、扫描后的注意事项和扫描技巧

  1、如果为了进行修改,选择了“扫描可编辑文本”,那么扫描结果肯定不能做到100%的正确,可能需要您校对。所以如果您不需要进行修改,可以在此选项中选否,则扫描结果是肯定和原稿一样。

  2、 原稿尽量使用打印的文件(纸张不要太薄,导致透设过多,反射光线不足)。

  3、 原稿字体最好是标准字体(手写体可能无法识别),最好在4号字左右。

  4、 在预览图片上圈选保存范围的时候,尽量只圈住字体大小相同 的部分,有助于提高识别率。

  5、 扫描表格圈选保存范围的时候,只圈住表格边框及里面的部分,不要圈表格之外的文字。(同时结构复杂的表格即每行的格数不等。此扫描软件将几乎不能识别)

  [免责声明:本站刊登此文章只为传播更多信息,作者文责自负,本文不代表本站赞同其观点或立场。]