求教关于pdf文件的转化
小弟最近由于工作的需要,要将pdf文件转化为txt文件(doc文件)但是在文件另存后有些pdf中的数字英文一旦到了txt中就会变成乱码
请问这是怎么回事?有什么办法解决吗?
回复:
试试用Adobe Acrobat全选所有文字再Copy & Paste。或者下一个什么能将PDF转成RTF的软件,不过效果是不大好的。
回复:
用Adobe Acrobat (Reader)的选择工具全选在复制粘贴。回复:
Adobe Acrobat (Reader)里有个专门把文档转成文本的按钮,好象是个很大的“T”字不过有些PDF文件由于版权问题是不可能转成TXT的,就算是你选择文字,你会发现根本不可能复制!这个时候你就只能老老实实自己打字了。。。。。。
回复:
可以有软件去掉保护。大概叫什么Advanced PDF什么的。google搜一下看。
回复:
的确,从PDF文档里复制出来的字符有时候会不太合人意,直接粘贴进word再编辑。回复:
复制我都能复制,但我碰到的是乱码问题比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?
回复:
你找找有没有PDF转TXT或DOC的软件吧,我前一阵就出现过这个问题,但是是繁体字,不是乱码,所以还能忍受。看来你这个问题比较严重。回复:
Advanced PDF Password Recovery V1.48下载地址:http://soft.winzheng.com/SoftView/SoftView_8742.htm
回复:
最初由 never 发布复制我都能复制,但我碰到的是乱码问题
比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?
Mission Impossible.
PDF是PostScript的一种,有些字可能是合出来的(字库里已有的字,通过调整位置及大小,合成出来的),而不是字库里的字(如果你用过LaTeX,LaTeX的标记就是合出来的)。这样,要100%转成正确的txt是不可能的。
就算是你看上去很正常的(比如你说的e-Education之类),也有可能是合出来的字,不是正常的字。
回复:
http://www.hanzify.org/index.php?Go=Show::List&ID=5826PDF2TXT,试试看。
回复:
http://www.hanzify.org/?Go=Show::List&ID=2629还有PDF2Text,Adobe Acrobat 的插件,支持 Acrobat 4 和 5 ,用于从 PDF 文件中抽取出文本。
页:
[1]