酱板鸭的做法:如何将PDF文件转换成文本文件

来源:百度文库 编辑:九乡新闻网 时间:2024/05/17 06:55:31
 如何将PDF文件转换成文本文件  PDF是电子图书常用的文件格式,但是由于PDF文件不便阅读(需要安装Acrobat才能看),而且少则几百K,多则十来兆,不便网上传输,我们常常希望能把它转化成文本文件格式,却又往往无从下手。其实,这并不是一件难事。
  首先,我要向大家介绍一个能将PDF文件转成TXT文件的软件——Aerial2.0。
  我们知道,阅读PDF文件的工具,当属Adobe的Acrobat reader软件了,而Aerial则是Acrobat的一个插件。在安装了Aerial之后,Acrobat reader的菜单中的"plug-ins"就会多出一项"Aerial"。
Aerial 2.0为我们浏览PDF文件提供了强大的功能:
  1.index manager:用于查找和管理文章的索引(必须要有Acrobat Exchange);
2.navigator: 为PDF文件建立树结构,方便我们浏览;
  3.paper clip page:剪贴页管理(必须要有Acrobat Exchange);
  4.copy table to clipboard:将表格复制到剪贴板;
  5.save as RTF :这才是我们最需要的功能,转化之后不仅保留了文字,连字体和颜色图案都能保留下来!
  但是,Aerial并不是万能的,它对中文支持不太好,排版有时会比较混乱,而且遇上扫描的纯图形的PDF文件时就无能为力了。要想把此类PDF文件转化成文本文件,就相对麻烦一些了,具体步骤如下:
1.先用Acrobat打开PDF文件,选定区域,放大到300%��500%(视具体情况而定),复制到剪贴板。
  2.用Photoshop或Photoimpact等图形软件调出剪贴板的图形,存成单色的(注意:一定要单色)TIF、PCX或BMP文件,图形文件格式视你所用的OCR软件而定。笔者推荐使用BMP文件存盘。
  3.用OCR软件识别图形文件(笔者用的是Wtocr7.0),经过简单的排版校正后,一般能有95%以上的识别率。再经过你的手工修改后,就可以了。
  以上是笔者在实际过程中的一些经验,希望能对朋友们有所启发。Aerial 可以到http://www.ambia.com下载。

参考文献:http://www.gll-gx.org.cn/xxzz/ 回答:2006-04-19 17:17提问者对答案的评价:谢谢指教 共0条评论...#zhitouads1{border:1px solid #CBE8AE; margin-top:10px; padding:10px 0px; width:688px;display:none;}#zhitouads1 .advitem{margin:0px; padding:0px; width:210px; height:40px;border-right:1px dashed #ccc; padding-left:11px; font-size:12px; display:block; float:left; padding-right:7px;}#zhitouads1 .advitem .advline{line-height:20px; height:20px;overflow:hidden;margin:0px; padding:0px; display:block; width:210px;}#zhitouads1 .union_ad{border:0px;}#zhitouads1 .union_ad1{color:#333;text-decoration:none;}2+4快速记忆揭秘课程自学2小时DVD课程+4小时特训,拥有超级记忆!新浪爱问知识人基于千万级数据开发的问答互助平台新浪智投微博智投的微博敬请关注。
其它回答 共4条回答评论 ┆ 举报
一般人我不告诉他
[新手] 没办法直接转换。
只能先打印出来,再用文字识别软件扫描。 回答:2006-04-19 15:42 共0条评论...评论 ┆ 举报
humihong2
[智者] 超强PDF转换WORD工具 绿色中文特别版(完美无损转换,100%支持中文)
http://www.51ct.cn/downinfo/601.html

SolidConverterPDF PRO(超酷PDF转换WORD工具) v3.0 绿色特别版
http://www.51ct.cn/downinfo/187.html

你可以先用以上任何一款软件将PDF文件转换为WORD文档,再如下操作:
文件->另存为->“保存类型”选择“纯文本”->保存->这样就OK了。