当你手头上有一些PDF文档需要提取里面的文本内容,但机器里并没有安装Adobe Acrobat、Adobe Reader等阅读软件,第三方转换工具转换效果又不是很理想。如果你用过百度硬盘搜索,那么就可以通过它的快照功能快速提取PDF文档的所有文本内容。
百度硬盘搜索可以到下载安装,运行后双击托盘图标打开硬盘搜索,索引完成后进入硬盘搜索首页。这时,查看页面下方的“文档”类别,点击“PDF”文件类型,查看硬盘里所有的PDF文档。找到待处理的PDF文件,点击末尾的“快照”链接,就会显示PDF里的文本内容(如图)。最后,将内容保存为文本文件,还是复制出来保存为DOC文件,就看大家各自的需要了。
此方法同样适用于Word(DOC)、 幻灯片(PPT)等文档的文本提取。
如果“文档”类别没有“PDF”类型,可以直接在关键字文本框里输入PDF文件的文件名或存储的路径,按下回车键开始搜索文件。要注意的是,如果只是纯粹由图片创建的文档,那么这一招就不起作用了。 |