分享PDF格式转txt文本一点经验
之前想找一本自己想看的小说,无奈网上只能找到PDF资源。有时候PDF文字看起来并不是那么清晰而自己又不需要关注其中图片的时候,可以将其转换成自己想要的txt文本格式。可以参考以下操作:
使用在线网站进行格式转换:
试了蛮多的网站,有的或收费有的或因为图片或编码问题转换后乱码,给一个效果还可以的网站
Free AI PDF to TXT Converter- Convert PDF to Text Online for Free - LightPDF,当然该网站还有很多其他的功能请自行尝试
优点:免费使用,支持OCR(可识别图片中的文字并提取转换成文本,我猜测有些工具转换后乱码可能是由于pdf中有图片而该工具又不支持OCR)
缺点:支持10M以下文件
如果你的pdf文件较大的话,可以先将其拆分一下在线拆分PDF文件。免费拆分PDF文件 (ilovepdf.com)再进行转换。
最后一步就比较简单了,如果拆分了文件,将转换后的txt合并一下即可,全选复制粘贴经典操作。
该方法针对中短篇幅(几百页)的PDF文件操作起来效果较好,篇幅太长拆分的文件太多就不太合适了。