邹市明大满贯:怎样把PDF转换成WORD终极方法

来源:百度文库 编辑:九乡新闻网 时间:2024/04/27 22:44:21

怎样把PDF转换成WORD的终极方法      

    杉杉竹曾经花了很多的时间去把PDF转换成word/txt,有时候也要把扫描的和图片上的文字转换成文本可以编辑的格式,有时候还遇到pdf转换后出现乱码,在网上也找了很多的方法,才有本册子。本册子的软件是本人转换了上千个PDF文件,在无数个转换软件中挑选出来的比较好的软件,特地总结出来和大家共勉,免得大家走太多弯路,希望可以大大的节省你的时间,真正的提高你的工作效率,不再为PDF转换成word/txt的问题烦恼,有用请收藏好,与朋友分享。

1 什么是PDF?

2 用office软件组件怎么把PDF转换成word/txt?(不推荐)

3 最原始的转换方法:foxit reader-直接复制粘贴

4 在线如何把PDF转换成word/txt?( 最简易 )

5 好用的PDF转换成word/txt的转换软件推荐

6 转换PDF 成word/txt出现乱码怎么办?

7 PDF是扫描或者是图片格式的怎么把PDF转换成word/txt ?

8 PDF无法转换和无法打印怎么办

9 附:word 如何转换成PDF的最简单的方法

 

 

 

1 什么是PDF?

什么是PDF?
    PDF是出版和图形领域的软件厂商Adobe制定的电子文档格式标准。Adobe为之提供了免费的文档浏览器--Adobe Acrobat Reader以及相应的编辑软件--Adobe Acrobat,后者可以对PDF文档中页面的组织、链接进行编辑,对文档进行批注等等。而Adobe的另外一款软件--Illustrator则可以从各个细致入微处修整PDF文件。与普通格式的电子文档(如纯文本、超文本、RTF格式以及Word文档等)相比,PDF文档具有能够完善保持版面样式、跨平台等优越性,所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用PDF格式。在我国,许多电子书籍也开始采用PDF格式。
    创建PDF文件的典型方法并不是使用Illustrator等软件来编辑,而是先用普通的文字处理和桌面排版软件如Word、WordPerfect和PageMaker等编排好文档,然后通过Adobe的PDF Distiller或者PDF Writer等仿打印机引擎制作PDF文件。另外也有一些PDF文档是直接使用Adobe Acrobat配合扫描仪将原书稿扫描制作完成的,虽然该软件配有支持对多种西方文字进行光学字符识别(OCR)的插件,但是为了保证文字的可靠性,多数情况下采用这种方法制作的PDF文件没有进行字符识别。

2 用office软件组件怎么把PDF转换成word/txt?(不推荐)

   使用情景:目前国外很多软件的支持信息都运用 PDF形式执行 揭晓,如果没有Adobe Reader,不能查看其内容,如果没有有关的编辑软件又不能编辑PDF文件。转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为DOC的工作,但很多都不支持中文,我们运用 Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。 
    不过在此之前,你还得装一下WORD自带的组件,03和07的都行。点开始-程序-控制面板-添加/删除程序,找到Office-修改 找到Microsoft Office Document Imaging 这个组件,Microsoft Office Document Imaging Writer 点在本机上运行,安装就可以了。  

第一步:首先运用 Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”配置窗口中将“打印机”栏中的“名称”配置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 
第二步:运行Microsoft Office Document Imaging,并运用 它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能须要一些时间”,不管它,确认即可。 

杉杉竹提醒:目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还须要手工对其执行 后期排版和校对工作。

3 最原始的转换方法:foxit reader-直接复制粘贴

   无论你是什么样的PDF,如果想要转换成WORD,你首先应该要用的软件就是foxit reader,这个软件比较小,一般我们也用它来阅读,是使用人数最多的一个PDF阅读器,如果PDF可以在这个阅读器中复制的话,一切都好说,只要直接复制就可以了,复制选中的内容。切换到Word,粘贴内容。

当然你也可以用Adobe Acrobat Reader,这个软件是目前浏览、查看、打印PDF文件官方工具,虽然是比较好用的,不过软件的体积有点大,所以不推荐。

4 在线如何把PDF转换成word/txt?(最简易 )

在线转换PDF成word也有几种方法

第一种方法:使用Gmail信箱

   把pdf发到Gmail信箱,在附件一侧,就有“以HTML格式查看”链接。如果你一定需要doc格式,复制html的内容吧。
优点:速度快、可信、很多人已经有Gmail信箱(如果没有,那就注册一个吧);各种语言编码的文字都应该可以转换。
缺点:pdf中的图片转换不了哦。

第二种方法:使用QQ邮箱

把pdf发到QQ邮箱,而在QQ邮箱中,PDF附件旁边也有类似的“纯文本方式查看”链接,只是相比Gmail,缺少文字格式。另外,这种转换还能破解PDF防止复制内容的限制。图片的也不好转换。

第三种方法:使用在线网站转换-要准备邮箱哦

上www.PDFtoWord.com网站转换

PDFtoWord.com 号称是目前最为精准的pdf to word文件转换器,出自著名的PDF解决方案供应商NitroPDF。

PDFtoWord.com是在线应用,完全免费,使用方便:

- 访问pdftoword.com:①上传pdf→②选定格式(doc/rtf)→③输入接收邮箱;

- 进入邮箱:查收转换后的word文档。

Web 2.0 Share的评价:“……Pdftoword 无愧于精准之王,对中文同样转换很好,文字方面不多说了,大家可以自己测试。Pdftoword 在排版方面确实有独到之处,特别介绍一个细节,Pdftoword 转换后的文档仍以段落为单位,没有很多的换行符,而以前大多转换器都是以行为单位,以致末尾有很多的换行符,你复制粘贴时会有许多麻烦……”,如果对这个问题不太了解的请与本人杉杉竹联系哦。

5 好用的PDF转换成word/txt的转换软件推荐

利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档还有在线转换在一定程度上的确可以实现PDF文档到Word文档的转换,但是对于很多“不规则”的PDF文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。为了恢复PDF的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。

软件推荐:Solid Converter PDF和AnyBizSoft PDFConverter

 

 

 

(1)AnyBizSoft PDFConverterV2.5  

     AnyBizSoft PDF Converter 是一款PDF 转多种格式的软件,select部分是你要转换输出的格式,你要什么格式就选择什么格式,前提是你一定要安装微软的OFFICE办公软件。

add files按键就是添加你要转换的文件用的,可以批量的。
output setting部分就是输出设置部分,是设置文件输出保存位置的,可以是源pdf文件位置或你也可以自定义。最后那个大大的convert按键就是转换开始键了。这个软件对于中文字体的支持还是不错的,就是有时候版面会有点错乱。不过胜在支持多格式转换。而且转换速度比较快。

(2)Solid Converter PDF V6 / V7                                     

     solid converter PDF v6是一个PDF转word的神器,支持PDF转换成word、excel、图片、html等等,当然这个软件还带有PDF的加水印、修改等功能。

转换速度虽然比较慢,但是转换出来的效果是非常好的,版面维持的几乎不变,还有一项最好的功能就是能够转换部分直接复制是乱码的PDF。

6 转换PDF 成word/txt出现乱码怎么办?

转换PDF 成word/txt出现乱码怎么办?

出面乱码原因:(1)PDF文件被加密了(2)字体内码问题,就是你的电脑中缺少文件中所使用的字体格式(3)文件是图片的格式或者是文件是扫描的文件。

解决办法:(1)PDF文件被加密了,就用软件咯解密咯。

比较好的软件就有

 

这两个软件都可以用的,解密之后一般就可以转换了。

对于(2)(3)中的问题,解决办法就只能用OCR软件进行文字识别转换比较好,具体方法请往下看。

7 PDF是扫描或者是图片格式的怎么把PDF转换成word/txt ?

最好用的OCR文字识别软件推荐:

(1)杉杉竹软件  

杉杉竹软件是一个ocr图文识别软件,可以像QQ截图一样方便地把图片上的文字识别出来,并转换成文字,过程只有几秒钟,识别率高达98%,是目前识别率最高的一款软件,还能支持中(简、繁)、英等多种字体,同时它也是我个人使用过的文字识别软件中最好用的了,软件也不大。

解压软件,找到 Start.exe,然后打开,就可以看到工具条界面:

识别图像有两种方法:点这个地方,然后选中文字



批量识别“屏幕”和图片:单击该按钮,启动屏幕识别程序。可以实现对屏幕内容进行选择并识别的功能。
核心功能:直接截取图像,把图像里的文字转换成文本文字(txt、doc等文本格式)。

强调1:“直接截取图像”的意思是,像QQ截图一样,直接截取当前屏幕的图像,极其方便!

强调2:这是杉杉竹软件优于市面上所有图像文字转换文本文字软件的最大特征。

 

   具体可以看下面的实例:

就用软件截取一部分看看效果

 

 

 

 

 

 

 

 

 

 

 

这是软件识别后的效果:

 

 

 

 

 

 

 

杉杉竹软件的唯一地址是:http://.shanshanpig.com ,使用之后可以极大的提高工作效率和节省工作时间,现在很多站长甚至把它当成伪原创工具使用,如果你想要也可以直接点击这里。

(2)CAJviewer 7.0  
    CAJviewer 7是中国知网的专用浏览器,也支持PDF格式的阅读,完整版本是带有OCR组件的(约37M左右)。打开PDF文件以后在工具栏上有一个放大镜下面打一个勾的上面还有一个字和A的那个图标工具就是OCR工具。选择这个工具 然后拉框选择识别区域,稍等一会儿就会有文字识别结果对话框出来,那里面的文字就是识别提取出来的人,如果你要整个PDF转换,你可以在菜单栏 文件---另存为文本就可以了。

(3)ABBYY finereader v9                                        

   ABBYY finereader v9也是我见过的十分强大的PDF(图片格式或者是扫描件)转word的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好,就是软件有点大。

    而且,这款软件只要你设置好识别文件所用的语言然后打开PDF文件(支持直接打开的)然后其他的工作就交给软件了,识别完后 文件------另存为word格式就可以了。而且版面的保持能力是我见过的OCR软件里面比较好的一个,识别率也是蛮高的,就是转换识别的速度比较慢。只要PDF文件比较清晰,准确率基本也可以达到90%以上(除了数学公式、计算式、化学式、分子式、三角函数等专业的内容之外),强力推荐大家使用。如果你要识别韩语PDF文件的话请使用10.0版本,9.0不支持韩语的识别的。

(4)Readiris Corporate 12   

    Readiris Corporate 12也是一款OCR软件,同样支持100多种语言的识别,但是要识别亚洲语言还要额外安装亚洲语言词典才行。识别能力也是非常高的,就是版面的保持能力比ABBYY 的略差一筹,而且转换速度比较慢,对PDF文件的兼容性略差一点。识别等等都要比一般的OCR软件高出不少,也是一款不可多得的软件。

总结:当然PDF转word的软件还有很多种,上面介绍的几个软件只是本人转换了上千个PDF文件在无数个转换软件中挑选出来的比较好的软件,特地总结一些经验大家共勉,免得大家走太多弯路,有什么问题可以与本人杉杉竹联系。

8 PDF无法转换和无法打印怎么办

 请看第6条,因为PDF是可以加密加权限的,所以如果遇到已加密的PDF文件要先解密以后才可以转换的。 对于可以打开阅读,但是限制了复制打印等功能的PDF文件,一般可以用PDF password remover 3或者PDF unlocker 去掉加密权限,然后再转换。(如果PDF password remover 3没有注册 只支持解密3页内容)。总之最好先用解密软件解密。

9 附:word 如何转换成PDF的最简单的方法

(1)用软件DOPDF.exe转换(2)用金山的office软件wps,编辑好后,直接发送成PDF就可以,非常方便。

后记:这是本人花时间整理出来的,希望对你有用,如果觉得有用请收藏好,也记得与朋友分享哦,但要注意留下本站地址:杉杉竹http://shanshanpig.com 。