never 发表于 2004-7-21 12:54:35

求教关于pdf文件的转化

小弟最近由于工作的需要,要将pdf文件转化为txt文件(doc文件)
但是在文件另存后有些pdf中的数字英文一旦到了txt中就会变成乱码
请问这是怎么回事?有什么办法解决吗?

allstar 发表于 2004-7-21 13:10:36

回复:

试试用Adobe Acrobat全选所有文字再Copy & Paste。
或者下一个什么能将PDF转成RTF的软件,不过效果是不大好的。

JayZ 发表于 2004-7-21 15:21:33

回复:

用Adobe Acrobat (Reader)的选择工具全选在复制粘贴。

sammyweed 发表于 2004-7-21 15:35:05

回复:

Adobe Acrobat (Reader)里有个专门把文档转成文本的按钮,好象是个很大的“T”字

不过有些PDF文件由于版权问题是不可能转成TXT的,就算是你选择文字,你会发现根本不可能复制!这个时候你就只能老老实实自己打字了。。。。。。

allstar 发表于 2004-7-21 17:28:32

回复:

可以有软件去掉保护。
大概叫什么Advanced PDF什么的。google搜一下看。

上杉和也 发表于 2004-7-22 06:45:33

回复:

的确,从PDF文档里复制出来的字符有时候会不太合人意,直接粘贴进word再编辑。

never 发表于 2004-7-22 12:52:52

回复:

复制我都能复制,但我碰到的是乱码问题
比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?

上杉和也 发表于 2004-7-23 20:26:57

回复:

你找找有没有PDF转TXT或DOC的软件吧,我前一阵就出现过这个问题,但是是繁体字,不是乱码,所以还能忍受。看来你这个问题比较严重。

2004yusb 发表于 2004-7-23 23:28:27

回复:

Advanced PDF Password Recovery V1.48下载地址:
http://soft.winzheng.com/SoftView/SoftView_8742.htm

allstar 发表于 2004-7-24 01:33:22

回复:

最初由 never 发布
复制我都能复制,但我碰到的是乱码问题
比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?

Mission Impossible.
PDF是PostScript的一种,有些字可能是合出来的(字库里已有的字,通过调整位置及大小,合成出来的),而不是字库里的字(如果你用过LaTeX,LaTeX的标记就是合出来的)。这样,要100%转成正确的txt是不可能的。
就算是你看上去很正常的(比如你说的e-Education之类),也有可能是合出来的字,不是正常的字。

水星思路 发表于 2004-7-24 09:33:17

回复:

http://www.hanzify.org/index.php?Go=Show::List&ID=5826
PDF2TXT,试试看。

水星思路 发表于 2004-7-24 09:35:27

回复:

http://www.hanzify.org/?Go=Show::List&ID=2629
还有PDF2Text,Adobe Acrobat 的插件,支持 Acrobat 4 和 5 ,用于从 PDF 文件中抽取出文本。
页: [1]
查看完整版本: 求教关于pdf文件的转化