名侦探柯南事务所

标题: 求教关于pdf文件的转化 [打印本页]

作者: never    时间: 2004-7-21 12:54
标题: 求教关于pdf文件的转化
小弟最近由于工作的需要,要将pdf文件转化为txt文件(doc文件)
但是在文件另存后有些pdf中的数字英文一旦到了txt中就会变成乱码
请问这是怎么回事?有什么办法解决吗?
作者: allstar    时间: 2004-7-21 13:10
标题: 回复:
试试用Adobe Acrobat全选所有文字再Copy & Paste。
或者下一个什么能将PDF转成RTF的软件,不过效果是不大好的。
作者: JayZ    时间: 2004-7-21 15:21
标题: 回复:
用Adobe Acrobat (Reader)的选择工具全选在复制粘贴。
作者: sammyweed    时间: 2004-7-21 15:35
标题: 回复:
Adobe Acrobat (Reader)  里有个专门把文档转成文本的按钮,好象是个很大的“T”字

不过有些PDF文件由于版权问题是不可能转成TXT的,就算是你选择文字,你会发现根本不可能复制!这个时候你就只能老老实实自己打字了。。。。。。
作者: allstar    时间: 2004-7-21 17:28
标题: 回复:
可以有软件去掉保护。
大概叫什么Advanced PDF什么的。google搜一下看。
作者: 上杉和也    时间: 2004-7-22 06:45
标题: 回复:
的确,从PDF文档里复制出来的字符有时候会不太合人意,直接粘贴进word再编辑。
作者: never    时间: 2004-7-22 12:52
标题: 回复:
复制我都能复制,但我碰到的是乱码问题
比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?
作者: 上杉和也    时间: 2004-7-23 20:26
标题: 回复:
你找找有没有PDF转TXT或DOC的软件吧,我前一阵就出现过这个问题,但是是繁体字,不是乱码,所以还能忍受。看来你这个问题比较严重。
作者: 2004yusb    时间: 2004-7-23 23:28
标题: 回复:
Advanced PDF Password Recovery V1.48下载地址:
http://soft.winzheng.com/SoftView/SoftView_8742.htm
作者: allstar    时间: 2004-7-24 01:33
标题: 回复:
最初由 never 发布
复制我都能复制,但我碰到的是乱码问题
比如说pdf里的e-Education到了txt里面会变成:,./():之类的乱码
很头疼的。。。而有些pdf则不会有乱码,所以我想问下,有什么办法能改掉这些乱码玛?


Mission Impossible.
PDF是PostScript的一种,有些字可能是合出来的(字库里已有的字,通过调整位置及大小,合成出来的),而不是字库里的字(如果你用过LaTeX,LaTeX的标记就是合出来的)。这样,要100%转成正确的txt是不可能的。
就算是你看上去很正常的(比如你说的e-Education之类),也有可能是合出来的字,不是正常的字。
作者: 水星思路    时间: 2004-7-24 09:33
标题: 回复:
http://www.hanzify.org/index.php?Go=Show::List&ID=5826
PDF2TXT,试试看。
作者: 水星思路    时间: 2004-7-24 09:35
标题: 回复:
http://www.hanzify.org/?Go=Show::List&ID=2629
还有PDF2Text,Adobe Acrobat 的插件,支持 Acrobat 4 和 5 ,用于从 PDF 文件中抽取出文本。




欢迎光临 名侦探柯南事务所 (https://bbs.aptx.cn/) Powered by Discuz! X2.5