zoukankan      html  css  js  c++  java
  • 通过XPDF抽取PDF中的中文文本

     通过XPDF抽取PDF中的中文文本

    1、下载XPDF,下载地址: ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02pl4-win32.zip

    2、下载字体Gbsn00lp.ttf和gkai00mp.ttf,下载地址:ftp://ftp.foolabs.com/pub/xpdf/xpdf-chinese-simplified.tar.gz

    3、解压XPDF和字体,将字体放到xpdf\chinese-simplified\CMap目录下

    4、修改add-to-xpdfrc文件中的地址 ,将路径该为本机安装路径

    5、修改xpdfrc文件 ,把地址修改为本机地址

    6、编写简单的程序

  • 相关阅读:
    Sublime Text 3 绝对神器
    spring 笔记3: Spring 多环境配置文件切换
    elk-logstash: window下指定jdk目录
    通过slf4j/log4j的MDC/NDC 实现日志追踪
    spring 笔记2:Spring MVC : Did not find handler method for 问题的解决
    mysql一机多实例安装记录
    Java:通过反射复制父类字段到子类。
    mybatis研究:select性能对比
    spring " expected single matching bean but found 2" 问题一例。
    数组去重复
  • 原文地址:https://www.cnblogs.com/jiang1984j/p/1986758.html
Copyright © 2011-2022 走看看