zoukankan      html  css  js  c++  java
  • JAVA中 PDF文件转成TIFF文件的2种方式

    由于在工作中使用到了PDF->TIFF的技术,所以稍微研究了一下实现方式,通过资料查阅,暂时发现了2种方式,2种方式有所区别:第一种方式转化后的tiff文件是黑白的,第二种方式转化后的tiff文件是有色彩的(跟PDF文件相同),如果不对色彩要求严格的话,建议使用第一种方式,因为转化的文件较小。

    第一种PDF转化TIFF的方式(黑白):

    注意主要依赖pdfbox的版本是1.8.9,而新版本的依赖不适用,例如2.0.0-RC2。

    <dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>1.8.9</version>
    <scope>compile</scope>
    </dependency>
        /**
         * 把PDF读入输入流,转化每一页为TIF
         * @param inputStream PDF输入流
         * @param dir         存放的路径
         * @param dpi         dpi    
         * @return 转化后的tif文件列表
         */
    public List<File> pdf2tif(InputStream inputStream, File dir, int dpi) {
    try (PDDocument pdf = PDDocument.load(inputStream)) {
    BufferedImage[] images = new BufferedImage[pdf.getNumberOfPages()];
    List<File> files = new ArrayList<>();
    long suffix = System.currentTimeMillis();
    for (int i = 0; i < images.length; i++) {
    PDPage page = (PDPage) pdf.getDocumentCatalog().getAllPages().get(i);
    BufferedImage image;
    image = page.convertToImage(BufferedImage.TYPE_BYTE_BINARY, dpi);
    images[i] = image;
    File file = new File(dir.getAbsolutePath() + File.separator + suffix + "-" + (i + 1) + ".tiff");
    try (FileOutputStream out = new FileOutputStream(file);ImageOutputStream ios = ImageIO.createImageOutputStream(out)) {
    TIFFImageWriterSpi tiffWriter = new TIFFImageWriterSpi();
    ImageWriter writer = tiffWriter.createWriterInstance();
    ImageWriteParam param = writer.getDefaultWriteParam();
    ImageTypeSpecifier typeSpecifier = ImageTypeSpecifier.createFromBufferedImageType(BufferedImage.TYPE_INT_ARGB);
    param.setCompressionMode(ImageWriteParam.MODE_EXPLICIT);
    param.setCompressionType("CCITT T.6");
    param.setCompressionQuality(1);
    IIOMetadata metadata = writer.getDefaultImageMetadata(typeSpecifier, param);
    IIOMetadataNode hps = new IIOMetadataNode("HorizontalPixelSize");
    hps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
    IIOMetadataNode vps = new IIOMetadataNode("VerticalPixelSize");
    vps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
    IIOMetadataNode dim = new IIOMetadataNode("Dimension");
    dim.appendChild(hps);
    dim.appendChild(vps);
    IIOMetadataNode root = new IIOMetadataNode("javax_imageio_1.0");
    root.appendChild(dim);
    metadata.mergeTree("javax_imageio_1.0", root);
    writer.setOutput(ios);
    writer.write(metadata, new IIOImage(image, null, metadata), param);
    } catch (IOException e) {
    e.printStackTrace();
    }
    files.add(file);
    System.out.println(file.getAbsolutePath());
    }
    return files;
    } catch (IOException e) {
    e.printStackTrace();
    return null;
    }
    }

    第二种PDF转化TIFF文件的方式(有色彩):

    注意主要的依赖:(maven可能拉不下来,建议去网上下载)

    <dependency>
    <groupId>com.sun.media</groupId>
    <artifactId>jai_codec</artifactId>
    <version>1.1-mr</version>
    </dependency>
    <dependency>
    <groupId>javax.media</groupId>
    <artifactId>jai_core</artifactId>
    <version>1.1-mr</version>
    </dependency>
    <dependency>
    <groupId>com.sun.medialib</groupId>
    <artifactId>mlibwrapper_jar</artifactId>
    <version>1.1</version>
    </dependency>
    <dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.0-RC2</version>
    </dependency>
    /**
         * 从输入流读取pdf,转化为tiff后写入输出流.<br/>
         * @param is  输入流,提供pfg内容.
         * @param outPath  输出目录.
         */
        public static List<File> pdf2Tiff(InputStream is, String  outPath) {
            PDDocument doc = null;
            FileOutputStream fos = null;
            List<File> files = new ArrayList<>();
            try {
                doc = PDDocument.load(is);
                int pageCount = doc.getNumberOfPages();
                PDFRenderer renderer = new PDFRenderer(doc); // 根据PDDocument对象创建pdf渲染器
                List<PlanarImage> piList = new ArrayList<PlanarImage>(pageCount - 1);
                TIFFEncodeParam param = new TIFFEncodeParam();// 创建tiff编码参数类
                param.setCompression(TIFFEncodeParam.COMPRESSION_DEFLATE);// 压缩参数
                param.setExtraImages(piList.iterator());// 设置图片的迭代器
                for (int i = 0; i < pageCount; i++) {
                    BufferedImage fimg = renderer.renderImageWithDPI(i, DPI, ImageType.RGB);
                    PlanarImage fpi = JAI.create("mosaic", fimg); // 通过JAI的create()方法实例化jai的图片对象
                    File file = new File(outPath + (i + 1) + ".tiff");
                    fos = new FileOutputStream(file);
                    ImageEncoder enc = ImageCodec.createImageEncoder("tiff", fos, param);
                    enc.encode(fpi);// 指定第一个进行编码的jai图片对象,并将输出写入到与此
                    files.add(file);
                    if (fos !=null) {
                        fos.close();
                    }
                }
            } catch (IOException e) {
                e.printStackTrace();
            } finally {
                try {
                    if (doc != null)
                        doc.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            return files;
        }

     注意:第二种方式可能会报错(有关JAI的错误),但是不影响程序正常运行,也不影响结果。可通过配置VM options参数来解决:-Dcom.sun.media.jai.disableMediaLib=true。

    如果开发工具是IDEA可在Configuration中的VM options栏添加:-Dcom.sun.media.jai.disableMediaLib=true。如图:

  • 相关阅读:
    为开源项目 go-gin-api 增加后台任务模块
    将多行数据以',' 进行分隔
    syslog中的“(CRON)信息(未安装MTA,丢弃输出)”错误,crontab定时任务失效
    为什么我不推荐大家去外包公司?
    Linux永久修改系统时间
    云数据库 Redis 暂时不支持外网访问
    Nginx中worker connections问题的解决方法 大量用户502
    入手
    nginx 之$proxy_host|$host|$http_host区别
    grpc-golang入门
  • 原文地址:https://www.cnblogs.com/JohnsonLiu/p/11759267.html
Copyright © 2011-2022 走看看