酯的水解机理:PDF文档转换成Word文档及其它(Acrobat)

来源:百度文库 编辑:九乡新闻网 时间:2024/03/28 23:09:16
PDF文档转换成Word文档及其它 

作者:朱铮南  (发表在《软件报》2009年33期)

一、怎样从多页的PDF文档里抽取若干页成为JPG格式图片
    最方便的要数使用Adobe Acrobat,点击Adobe Acrobat里的“导出”工具按钮,并选择“JPG”,PDF文档的所有页面就自动转换成一个个JPG格式文件。
    如果你有Photoshop软件,可以这样操作,在Photoshop里打开PDF文档,Photoshop会让你选择打开那个页面,选定页面后打开,再另存为JPG格式图片文件。这个方法的缺点是一次只能抽取一页,需要重复操作,效率比较低。

二、怎样将PDF文档转换成Word文档
    在adobe acrobat里将要转换的PDF文档打开,操作菜单“文件”→“另存为”,将保存类型选为“Microsoft word”就能转换成Word文档。或者点击Adobe Acrobat里的“导出”工具按钮,导出文件类型选择“Word”,结果是一样的。
    一款名字为e-PDF To Word Converter的软件专门用来将PDF文档转换成Word文档,网上有汉化特别版可供下载。
    http://www.pdftoword.com/网站提供在线转换服务,只需要将待转换的PDF文档上传到这个网站,网站就会将载转换成的Word文档发到你的电子信箱里。
    特别要说明的是,如果是通过扫描纸质文件生成的PDF文档,转换成Word文档以后得到的每一页都是插在Word文档里的图片,无法进行编辑。即便是由Word等其它可以编辑的电子文档生成的PDF文档,转换成Word文档以后,文字也是分布在一个个图文框里,如果版面稍复杂一些,文字还有可能重叠在一起,重新编辑的工作量还很大。

三、怎样从PDF文档里导出文字
    假如PDF文档是由Word等其它可以编辑的电子文档生成的,用adobe reader或adobe acrobat的“选择工具”选中文字后按“Ctrl”+“C”键,就可以将文字复制到剪贴板里,随便你粘贴到那里。adobe reader在安装后的默认状态下,“选择工具”是看不见的,需要操作菜单“工具”→“自定义工具栏”,在“选择工具”前打上钩,将它显现出来。
    若要将整篇PDF文档的文字都导出来,在adobe reader里只要操作菜单“文件”→“另存为文本”,导出的文字就存到了一个文本文件里了。在adobe acrobat里则是操作菜单“文件”→“另存为”,保存类型选择“纯文本”,或者点击“导出”工具按钮,导出文件类型选择“更多格式”→“纯文本”。

四、使用OCR文本识别技术导出文字
    如果PDF文档是通过扫描纸质文件生成的,就不能够用上述简单的方法导出文字了,但也可以借助OCR文本识别技术来导出文字。
    在adobe acrobat里可以操作菜单“文档”→“OCR文本识别”→“使用OCR识别文本”,经过识别以后,就可以用“选择工具”选中文字进行复制了。
    adobe reader没有自带OCR文本识别功能,但可以这样操作,操作菜单“文件”→“打印”,打印机名称选择“Microsoft Office Document Image Writer”,这是一个随Microsoft Office 2003一起安装到计算机里的虚拟打印机,它将PDF文档打印到后缀为“mdi”的文件里,并自动打开,在打开的“mdi”文件里依次操作菜单“工具”→“使用OCR识别文本”和“工具”→“将文本发送到word”就可以将文字导出到一个Word文档里。
    OCR文本识别技术的识别率取决于创建PDF文档时的扫描精度,那些字迹模糊不清的文档,能够正确识别出的文字也不会太多。

五、怎样复制出PDF文档里的插图
    用adobe reader或adobe acrobat打开PDF以后用“选择工具”选中插图后按“Ctrl”+“C”键,就可以将插图复制到剪贴板里。在adobe acrobat里操作菜单“高级”→“文档处理”→“导出所有图像”,就能够一次将文档里的所有图片全部导出成一个个图像文件。

六、怎样复制PDF文挡里的表格
    用adobe acrobat打开PDF以后用“选择工具”选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“复制为表”,在Excel里操作菜单“选择性粘贴”,在对话框里选择“csv”后点击“确定”,PDF文挡里的表格就复制到Excel里了。也可以选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“在Excel里打开”,表格就自动变成了Excel表。
    如果需要将表格粘贴到Word文挡,应当采用“选择性粘贴”以“无格式文本”进行粘贴,粘贴之后选中这些数据,再操作菜单“表格”→“转换”→“文本转换表格”。
    如果PDF文档是通过扫描纸质文件生成的,就不能复制成表格,只可以将表格复制成图片。

    以上将PDF文档转换成Word文档以及从PDF文档里导出文字或图像的方法,取决于该文档没有加密对文档进行限制,如果文档已经加密进行了限制,只有在解密了以后才有可能进行

七、怎样去除word等软件里的Adobe Acrobat菜单栏
    安装了Adobe Acrobat以后,在Word、Excel、AutoCAD软件的菜单里会多出几个Adobe Acrobat的菜单栏,其实这是Adobe Acrobat和这些应用软件的无缝结合,利用这些菜单可以方便地将这些应用软件创建的文档转换成PDF格式的文档,并能对转换的有关参数进行控制和调整。但是由于这些菜单占据了位置,不少使用者希望将它们去除。
    去除的方法很简单,在“控制面板”里进入“添加和删除程序”,找到 Adobe Acrobat后点击“更改”,在“程序维护”对话框里选“修改”,到下一步的“自定义安装”里将Office、AutoCAD去掉即可。
    安装Adobe Acrobat的时候如果选择“自定义安装”,就可以在安装过程里提前将Office、AutoCAD等剔除,就不会在Word、Excel、AutoCAD等软件里添加Adobe Acrobat菜单栏了。