import java.io.IOException;
public class PdfReader {
public static final String FILEPATH = "d:\\xpdf\\pdftotext.exe";
public static void convertToTxt(String filePath , String txtFile) {
//保留文件原始布局
String layout = "-layout";
// 设置编码方式
String encoding = "-enc";
String character = "GBK";
// 设置不打印任何消息和错误
String mistake = "-q";
// 页面之间不加入分页
String nopagebrk = "-nopgbrk";
String[] cmd = new String[]{FILEPATH , layout , encoding , character , mistake , nopagebrk , filePath , txtFile};
try {
Runtime.getRuntime().exec(cmd);
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
convertToTxt("c:\\1.pdf" , "c:\\a.txt");
}
}
还有一个pdftohtml.exe 在附件中 , 放在xpdf文件夹下面 。 可以使用pdftohtml.exe -enc GBK #FROM# #TO#的形式解决 , 可以把pdf转换成pdf文档。
分享到:
相关推荐
xpdf使用C++编写,主要操作pdf文件,压缩包不包括例子,编译使用cmake构建后使用VS进行编译,很简单易操作的库,有代码就可以看得懂
vs2013编译的xpdf3.04,包括xpdf3.04源码、freetype-2.5.3(源码及vs2013编译工程)、简体中文字库、编译后的lib、exe、配置文件。编译方法和使用可以参见文章:...
xpdf为C++实现pdf转png,开源免费,完美实现pdf转png,无中文乱码问题,内嵌自定义字体的pdf(复制文本出来变乱码)也能正常转换; 一键安装sh,解决 执行命令pdftopng报字体找不到问题;编译xpdf源码生成pdftopng可...
xpdf,跨平台的pdf解析器,可用于读取,显示,转换pdf文件 版本3.02.14
Xpdf 是用来处理和转换 PDF 的利器。项目中需要将 PDF 转换为图片,但是发现有的 PDF 文档转换缺失字体,而且下载 ttf 格式的字体也不起作用,于是到官方文档才发现还需要配置字库,而且官方给出的是 pfb 格式的字库...
读取pdf里边的内容,原先一直用的pdfbox但是文件过大的时候性能会有问题。所以改变了思路,直接在java里边调用命令行执行转换,把pdf转换成txt内容,可以直接输出..
含win与linux版本,均配置完成,包含word绝大部分字体,满足绝大部分转换字体缺失问题,由于新增大部分字体,需将配置文件xpdfrc里的字体地址修改为绝对地址,如有疑问,请及时留言。(java调用工具类,...
XPDF中用于转换带有Adobe-GB1字符集的pdf文件的字符集映射文件。使用方法,将该文件和CMap等文件(划重点,光这一个文件不够)拷贝到/usr/local/share/pdf/chinese-simplified下,按xpdf语法编写配置文件(语法为...
在原来的转换命令上增加配置【-s languagedir=D:\\xpdf】; 这个目录指向资源所在的文件夹,文件夹里面 【add-to-xpdfrc】填写相关文件的路径;这里面已经包含中文简体(xpdf-chinese-simplified)跟繁体(xpdf-...
专业的pdf,word转换器,里面已经放了注册器了,可以pdf转word,转execl,转html,txt,等,还有其他的文件转PDF,PDF合并,解密,分割,压缩等功能,或者电子书转PDF等
打开任何版本的pdf文件 并且对pdf文件编辑 插图 修改 非常实用 适合对PDF文档的管理转换、打印处理等
pdfalto:PDF到XML ALTO文件转换器
pdf格式转换成word格式文件,方便快捷,实用。不占空间。
很方便的一款pdf格式转化工具,支持pdf转word,word转pdf等各种文件格式,界面比较简单,而且免费。
CAD是我们平时设计中常用的软件,特别是建筑行业和机械行业使用最为广泛。有时为了工作需要常常要将cad转成pdf格式的文件便于用户查阅,而pdf文件想要恢复成cad格式进行修改,也是必不可少的。
XPDF是一个免费开源的软件,用于显示PDF文件,并可将pdf转换成文字图片等,同样支持Windows版。在Debian Linux上安装非常简单: apt-get install xpdf 我们这里只使用pdftotext这个功能,直接输入可查看帮助: root...
PDF和WORD互相转换,预览文件。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
该模块是pdftk 、 xpdf和其他工具之上的包装器,用于将原始 PDF 转换为可以被机器解析的格式。 :warning: 这个包是出于在项目之间共享这些方法的个人需要而创建的。 某些方法的默认(或有时是硬编码)值对我来说很...