`
shuaigg.babysky
  • 浏览: 553398 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

xpdf转换文件

阅读更多

import java.io.IOException;

public class PdfReader {
 
 public static final String FILEPATH = "d:\\xpdf\\pdftotext.exe";
 
 public static void convertToTxt(String filePath , String txtFile) {
    //保留文件原始布局
    String layout = "-layout";
    // 设置编码方式
    String encoding = "-enc";
   
    String character = "GBK";
    // 设置不打印任何消息和错误
    String mistake = "-q";
    // 页面之间不加入分页
    String nopagebrk = "-nopgbrk";
  
    String[] cmd = new String[]{FILEPATH , layout , encoding , character , mistake , nopagebrk , filePath , txtFile};
      try {
     Runtime.getRuntime().exec(cmd);
   } catch (IOException e) {
    e.printStackTrace();
   }
 }
 
 public static void main(String[] args) {
  convertToTxt("c:\\1.pdf" , "c:\\a.txt");
 }
}

 

还有一个pdftohtml.exe 在附件中 , 放在xpdf文件夹下面 。 可以使用pdftohtml.exe -enc GBK #FROM# #TO#的形式解决 , 可以把pdf转换成pdf文档。

分享到:
评论

相关推荐

    xpdf4.0库,使用C/C++操作PDF文件的库

    xpdf使用C++编写,主要操作pdf文件,压缩包不包括例子,编译使用cmake构建后使用VS进行编译,很简单易操作的库,有代码就可以看得懂

    vs2013编译xpdf3.04 中文pdf文件vc操作

    vs2013编译的xpdf3.04,包括xpdf3.04源码、freetype-2.5.3(源码及vs2013编译工程)、简体中文字库、编译后的lib、exe、配置文件。编译方法和使用可以参见文章:...

    centos7-mini下一键安装xpdf脚本,解决中文字体报错等

    xpdf为C++实现pdf转png,开源免费,完美实现pdf转png,无中文乱码问题,内嵌自定义字体的pdf(复制文本出来变乱码)也能正常转换; 一键安装sh,解决 执行命令pdftopng报字体找不到问题;编译xpdf源码生成pdftopng可...

    xpdf source code

    xpdf,跨平台的pdf解析器,可用于读取,显示,转换pdf文件 版本3.02.14

    xpdf-font-example.zip

    Xpdf 是用来处理和转换 PDF 的利器。项目中需要将 PDF 转换为图片,但是发现有的 PDF 文档转换缺失字体,而且下载 ttf 格式的字体也不起作用,于是到官方文档才发现还需要配置字库,而且官方给出的是 pfb 格式的字库...

    xpdf-tools-kms.zip

    读取pdf里边的内容,原先一直用的pdfbox但是文件过大的时候性能会有问题。所以改变了思路,直接在java里边调用命令行执行转换,把pdf转换成txt内容,可以直接输出..

    包含绝大部分字体且以配置完成的xpdf.rar

    含win与linux版本,均配置完成,包含word绝大部分字体,满足绝大部分转换字体缺失问题,由于新增大部分字体,需将配置文件xpdfrc里的字体地址修改为绝对地址,如有疑问,请及时留言。(java调用工具类,...

    Adobe-GB1.cidToUnicode

    XPDF中用于转换带有Adobe-GB1字符集的pdf文件的字符集映射文件。使用方法,将该文件和CMap等文件(划重点,光这一个文件不够)拷贝到/usr/local/share/pdf/chinese-simplified下,按xpdf语法编写配置文件(语法为...

    jodconverter做Office文档预览时,中文字符集以及字体的资源文件

    在原来的转换命令上增加配置【-s languagedir=D:\\xpdf】; 这个目录指向资源所在的文件夹,文件夹里面 【add-to-xpdfrc】填写相关文件的路径;这里面已经包含中文简体(xpdf-chinese-simplified)跟繁体(xpdf-...

    专业PDF转换器.rar

    专业的pdf,word转换器,里面已经放了注册器了,可以pdf转word,转execl,转html,txt,等,还有其他的文件转PDF,PDF合并,解密,分割,压缩等功能,或者电子书转PDF等

    pdf编辑软件 可以编辑pdf文件

    打开任何版本的pdf文件 并且对pdf文件编辑 插图 修改 非常实用 适合对PDF文档的管理转换、打印处理等

    pdfalto:PDF到XML ALTO文件转换器

    pdfalto:PDF到XML ALTO文件转换器

    PDF-TO-WORD

    pdf格式转换成word格式文件,方便快捷,实用。不占空间。

    pdf格式转化.zip

    很方便的一款pdf格式转化工具,支持pdf转word,word转pdf等各种文件格式,界面比较简单,而且免费。

    在CAD里将pdf转成可以直接编辑的CAD图纸,发现CAD的一个新功能

    CAD是我们平时设计中常用的软件,特别是建筑行业和机械行业使用最为广泛。有时为了工作需要常常要将cad转成pdf格式的文件便于用户查阅,而pdf文件想要恢复成cad格式进行修改,也是必不可少的。

    Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容

    XPDF是一个免费开源的软件,用于显示PDF文件,并可将pdf转换成文字图片等,同样支持Windows版。在Debian Linux上安装非常简单: apt-get install xpdf 我们这里只使用pdftotext这个功能,直接输入可查看帮助: root...

    PDFTool.rar

    PDF和WORD互相转换,预览文件。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

    pietro:π 将 PDF 文件拆分为更小的文件、生成缩略图和提取文本内容的实用程序

    该模块是pdftk 、 xpdf和其他工具之上的包装器,用于将原始 PDF 转换为可以被机器解析的格式。 :warning: 这个包是出于在项目之间共享这些方法的个人需要而创建的。 某些方法的默认(或有时是硬编码)值对我来说很...

Global site tag (gtag.js) - Google Analytics