赞美老師的古诗:扫描下来的 PDF 文件如何做文字修改(OCR)?
来源:百度文库 编辑:九乡新闻网 时间:2024/04/19 10:58:17
» 惠普网上贴心服务
自助服务
» 售后支持电话 » 维修中心查询 » 维修服务政策 » 保修信息查询 » 和工程师网上聊天 » 邮件解答售后问题
了解更多
» 市场活动和促销 » 如何购买
我们非常需要您的意见
这篇文章
» 完全解答了我的问题 完全解答了我的问题
这篇文章对您有帮助吗?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
» 不能解答问题 不能解答问题
我们如何来改进这篇文章?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
» 看不明白 看不明白
您在查询什么信息?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
文章详细内容
简介PDF 是 Adobe 便携式文档格式(Portable Document Format)的简称,PDF 以“文本+图像”的格式,保留了原文件的细节信息如:字体格式,版式和图片色彩等,且质量清晰、容量较小、可以多页合成一个文件,所以非常适宜网上传输,公司内部共享。
由于 PDF 格式是 Adobe 公司开发的,所以经常用 Acrobat Reader 或 Acrobat 软件打开,但无论是 Reader 还是 Acrobat,都无法修改 PDF 文件里面的内容。Acrobat 仅比 Reader 多了调用扫描仪、添加一些元素等功能而已。
本文主要介绍如何通过第三方软件将 PDF 格式进行转换以使得内容可以随意修改的方法。
方法介绍我们主要通过“Microsoft Office Document Imaging”这个 Office 的组件进行格式转换和文字识别。这个组件集成在微软的 Office XP 及以上版本下,并且为默认安装组件,若您的电脑中没有它,建议放入微软的 Office 光盘安装。如何判断自己的电脑已经安装上了这个组件呢?就是看控制面板里的打印机文件夹下是否有了一个名为“Microsoft Office Document Imaging”的打印机图标。
此组件最后会将 PDF 格式转换成 Word 格式,即可在 Word 中编辑修改了。转换识别后原稿还需要重新排版和校对。
操作步骤 确保电脑上已经正确安装了如下软件:Acrobat 或 Acrobat Reader、Office XP 或 Office 2003(带有 Microsoft Office Document Imaging 组件)。
用 Acrobat 或 Acrobat Reader 软件将已有的或扫描进来的 PDF 文件打开,然后点击“文件”菜单下的“打印”,打印机名称选择“Microsoft Office Document Image Writer” 。如图 1 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机所示。此打印机将输出一个后缀名为MDI的虚拟打印文件。
图 1: 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机
点击“确定”按钮按钮后将输出一个 MDI 文件且自动打开了 Microsoft Office Document Imaging 组件界面。如果没有自动打开,可以依次点击电脑左下角“开始”→“程序”→“Microsoft Office”→“Microsoft Office 工具”,打开此组件。
在“Microsoft Office Document Imaging”窗口中依次点击“工具”→“将文本发送到 Word ”菜单,出现如图 2 将原稿发送到 Word 所示界面:
图 2: 将原稿发送到 Word
注 : 勾选上“在输出时保持图片版式不变”,这样可以最大程度保留原稿格式。
点击“确定”按钮后会有 OCR 的提示,如图 3 OCR 提示所示:
注 : 如果安装完整的 Office 软件,Microsoft Office Document Imaging 及 OCR 组件可能会没有安装,当您按照本文介绍的方法使用时,Office 软件会提示您安装该组件。请根据提示放入 Office 光盘,安装程序会自动根据提示安装该组件。
图 3: OCR 提示
点击“确定”按钮后开始 OCR 过程,如图 4 OCR 识别所示:
图 4: OCR 识别
识别完成后会自动打开 Word,您的原稿就会在 Word 中并且可以自由编辑了。
自助服务
» 售后支持电话 » 维修中心查询 » 维修服务政策 » 保修信息查询 » 和工程师网上聊天 » 邮件解答售后问题
了解更多
» 市场活动和促销 » 如何购买
我们非常需要您的意见
这篇文章
» 完全解答了我的问题 完全解答了我的问题
这篇文章对您有帮助吗?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
» 不能解答问题 不能解答问题
我们如何来改进这篇文章?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
» 看不明白 看不明白
您在查询什么信息?
尽管不会收到个人的回复,但我们非常重视您的留言。惠普会继续努力,在网上为客户提供更有用的信息。
感谢您花宝贵的时间提供这些信息。 这有助于我们以后为客户提供更好的网站体验。
文章详细内容
简介PDF 是 Adobe 便携式文档格式(Portable Document Format)的简称,PDF 以“文本+图像”的格式,保留了原文件的细节信息如:字体格式,版式和图片色彩等,且质量清晰、容量较小、可以多页合成一个文件,所以非常适宜网上传输,公司内部共享。
由于 PDF 格式是 Adobe 公司开发的,所以经常用 Acrobat Reader 或 Acrobat 软件打开,但无论是 Reader 还是 Acrobat,都无法修改 PDF 文件里面的内容。Acrobat 仅比 Reader 多了调用扫描仪、添加一些元素等功能而已。
本文主要介绍如何通过第三方软件将 PDF 格式进行转换以使得内容可以随意修改的方法。
方法介绍我们主要通过“Microsoft Office Document Imaging”这个 Office 的组件进行格式转换和文字识别。这个组件集成在微软的 Office XP 及以上版本下,并且为默认安装组件,若您的电脑中没有它,建议放入微软的 Office 光盘安装。如何判断自己的电脑已经安装上了这个组件呢?就是看控制面板里的打印机文件夹下是否有了一个名为“Microsoft Office Document Imaging”的打印机图标。
此组件最后会将 PDF 格式转换成 Word 格式,即可在 Word 中编辑修改了。转换识别后原稿还需要重新排版和校对。
操作步骤 确保电脑上已经正确安装了如下软件:Acrobat 或 Acrobat Reader、Office XP 或 Office 2003(带有 Microsoft Office Document Imaging 组件)。
用 Acrobat 或 Acrobat Reader 软件将已有的或扫描进来的 PDF 文件打开,然后点击“文件”菜单下的“打印”,打印机名称选择“Microsoft Office Document Image Writer” 。如图 1 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机所示。此打印机将输出一个后缀名为MDI的虚拟打印文件。
图 1: 在 Acrobat 中选择“Microsoft Office Document Image Writer”虚拟文件打印机
点击“确定”按钮按钮后将输出一个 MDI 文件且自动打开了 Microsoft Office Document Imaging 组件界面。如果没有自动打开,可以依次点击电脑左下角“开始”→“程序”→“Microsoft Office”→“Microsoft Office 工具”,打开此组件。
在“Microsoft Office Document Imaging”窗口中依次点击“工具”→“将文本发送到 Word ”菜单,出现如图 2 将原稿发送到 Word 所示界面:
图 2: 将原稿发送到 Word
注 : 勾选上“在输出时保持图片版式不变”,这样可以最大程度保留原稿格式。
点击“确定”按钮后会有 OCR 的提示,如图 3 OCR 提示所示:
注 : 如果安装完整的 Office 软件,Microsoft Office Document Imaging 及 OCR 组件可能会没有安装,当您按照本文介绍的方法使用时,Office 软件会提示您安装该组件。请根据提示放入 Office 光盘,安装程序会自动根据提示安装该组件。
图 3: OCR 提示
点击“确定”按钮后开始 OCR 过程,如图 4 OCR 识别所示:
图 4: OCR 识别
识别完成后会自动打开 Word,您的原稿就会在 Word 中并且可以自由编辑了。
扫描下来的 PDF 文件如何做文字修改(OCR)?
扫描下来的 PDF 文件如何做文字修改(OCR)? - 惠普网上贴心服务 (中国 - 简体...
扫描下来的 PDF 文件如何做文字修改( Acrobat )
PDF文件的OCR识别方法
图片型PDF文件的OCR识别方法
怎样把扫描的JPG格式的图片或者文件转换为PDF格式
用OCR软件进行扫描识别文本的小技巧
怎么才能把PDF中的扫描成的书中的文字转化成WORD格式?
【怎么才能把PDF中的扫描成的书中的文字转化成WORD格式】
如何修改图片上的文字
pdf格局的文件如何委婉换败Word白档
各种格式文件ocr成word文件的方法
如何复制PDF文件中的图片? 帮助
推荐pdf文件在线阅读的几个网站(Samurajdata 、PDF Escape)--Redondo日记本
推荐pdf文件在线阅读的几个网站(Samurajdata 、PDF Escape)--Re...
《好玩的数学》(全十册)pdf 扫描 | 资料 → 图书杂志 | VeryCD → 下载
如何将PDF文件转换为TXT文件
如何将PDF文件转换为TXT文件
如何将PDF文件转换为TXT文件
如何将word、excel文件转换为PDF文件
域名解析文件hosts文件是什么?如何修改hosts文件?
PDF文件的制作工具--Easy PDF使用1
如何将PDF文件转换为TXT文件(转载)很不错的资料哟! 资源 资源 鹧鸪啼处
如何将PDF文件转换为TXT文件(转载)很不错的资料哟! 资源 资源 鹧鸪啼处