zoukankan      html  css  js  c++  java
  • JAVA基于PDF box将PDF转为图片

    在一项目中用到,本身我是。NET的,团队中有用到JAVA,故此我处理这个功能,记录以下备用。

    1.引用:fontbox-2.0.16.jar、pdfbox-app-2.0.16.jar 版本一定要正确,否则代码会有问题。

    main函数:

    package kevin.cn;
    import java.awt.image.BufferedImage;
    import java.io.ByteArrayOutputStream;
    import java.io.File;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.util.ArrayList;
    import java.util.List;
    import javax.imageio.ImageIO;
    import org.apache.pdfbox.pdmodel.PDDocument;
    import org.apache.pdfbox.pdmodel.PDPage;
    import org.apache.pdfbox.pdmodel.encryption.InvalidPasswordException;
    import org.apache.pdfbox.rendering.ImageType;
    import org.apache.pdfbox.rendering.PDFRenderer;
    import org.apache.pdfbox.tools.PDFBox;
    
    import kevin.cn.PdfUtil;
    @SuppressWarnings("unused")
    public class Test {
    	//经过测试,dpi为96,100,105,120,150,200中,105显示效果较为清晰,体积稳定,dpi越高图片体积越大,一般电脑显示分辨率为96
        public static final float DEFAULT_DPI = 105;
        //默认转换的图片格式为jpg
        public static final String DEFAULT_FORMAT = "jpg";
    	public static void main(String[] args) throws Exception {
    		pdfToImage("/media/kevin/FileData/JavaCode/pdfboxTest/企业信息化建设论文.pdf","/media/kevin/FileData/JavaCode/pdfboxTest/img/7.jpg",5);
    	}
    

      实现函数:

    /**
         * pdf转图片
         *
         * @param pdfPath PDF路径 
         * @imgPath img路径
         * @page_end 要转换的页码,也可以定义开始页码和结束页码,我这里只需要一页,根据需求自行添加
         */
        public static void pdfToImage(String pdfPath, String imgPath,int page_end) {
            try {
                //图像合并使用参数
                // 总宽度
                int width = 0;
                // 保存一张图片中的RGB数据
                int[] singleImgRGB;
                int shiftHeight = 0;
                //保存每张图片的像素值
                BufferedImage imageResult = null;
                //利用PdfBox生成图像
                PDDocument pdDocument = PDDocument.load(new File(pdfPath));
                PDFRenderer renderer = new PDFRenderer(pdDocument);
                //循环每个页码
                for (int i = 0, len = pdDocument.getNumberOfPages(); i < len; i++) {
                    if (i==page_end) {
                    	BufferedImage image = renderer.renderImageWithDPI(i, DEFAULT_DPI, ImageType.RGB);
                        int imageHeight = image.getHeight();
                        int imageWidth = image.getWidth();
                       //计算高度和偏移量
                    	//使用第一张图片宽度;
                        width = imageWidth;
                        //保存每页图片的像素值
                        imageResult = new BufferedImage(width, imageHeight, BufferedImage.TYPE_INT_RGB);
                        //这里有高度,可以将imageHeight*len,我这里值提取一页所以不需要
                    	  singleImgRGB = image.getRGB(0, 0, width, imageHeight, null, 0, width);
                          // 写入流中
                          imageResult.setRGB(0, shiftHeight, width, imageHeight, singleImgRGB, 0, width);
    				}else if(i>page_end) {
    					continue;
    				}
                  
                    
                }
    
                pdDocument.close();
                // 写图片
                ImageIO.write(imageResult, DEFAULT_FORMAT, new File(imgPath));
                
            } catch (Exception e) {
              
                e.printStackTrace();
            }
            //OVER
        }
    

      

  • 相关阅读:
    <转>使用IdentifyTask查询图层属性
    转:Java+blazeds+Flex的例子 .
    转 ArcGIS Runtime 加载SHAPE数据的另一种方式动态图层 .
    序列密码之A5
    哈希函数之MD5
    DjangoRestFramework使用总结
    公钥密码之RSA
    Request Line is too large (xxxx > 4094) 问题处理
    古典密码之仿射密码
    Linux重定向
  • 原文地址:https://www.cnblogs.com/c546170667/p/11187563.html
Copyright © 2011-2022 走看看