zoukankan      html  css  js  c++  java
  • Java 查找并替换PDF中的指定文本

    本文介绍通过Java程序批量替换PDF中的指定文本内容。

    1. 程序环境准备如下:

    程序使用环境如图,需要注意的是,本文使用了免费版的PDF jar工具;另外JDK版本建议使用高版本更佳。

      jar文件导入后,可调用Spire.PDF提供的接口、方法等操作PDF,参考如下导入结果:

     注:可手动下载jar包。下载后,解压文件,将lib文件夹下的Spire.Pdf.jar文件导入Java程序。

     

    Java 代码示例

    import com.spire.pdf.*;
    import com.spire.pdf.general.find.PdfTextFind;
    import com.spire.pdf.general.find.PdfTextFindCollection;
    import com.spire.pdf.graphics.PdfBrushes;
    import com.spire.pdf.graphics.PdfRGBColor;
    import com.spire.pdf.graphics.PdfSolidBrush;
    import com.spire.pdf.graphics.PdfTrueTypeFont;
    
    import java.awt.*;
    import java.awt.geom.Rectangle2D;
    
    public class FindAndReplaceText {
        public static void main(String[] args) {
            //加载示例PDF文档
            PdfDocument pdf = new PdfDocument();
            pdf.loadFromFile("咖啡豆.pdf");
    
            //遍历文档每一页
            for (int i = 0; i < pdf.getPages().getCount(); i++)
            {
                //获取所有页面
                PdfPageBase page = pdf.getPages().get(i);
    
                //查找指定文本
                PdfTextFindCollection textFindCollection;
                textFindCollection = page.findText("咖啡",false);
    
                //创建画刷、字体
                PdfSolidBrush brush1 = new PdfSolidBrush(new PdfRGBColor(Color.red));
                PdfTrueTypeFont font1= new PdfTrueTypeFont(new Font("宋体",Font.PLAIN,9),true);
    
                //用新的文本字符替换原有文本
                Rectangle2D rec;
                for(PdfTextFind find: textFindCollection.getFinds())
                {
                    rec = find.getBounds();
                    page.getCanvas().drawRectangle(PdfBrushes.getWhite(), rec);
                    page.getCanvas().drawString("Coffee", font1, brush1, rec);
                }
    
            }
    
            //保存文档
            pdf.saveToFile("FindAndReplaceText.pdf");
            pdf.close();
        }
    }

    文本替换前后效果:

  • 相关阅读:
    Python学习小目录汇总
    进制转换的知识
    计算机组成原理目录
    python基础知识-8-三元和一行代码(推导式)
    python基础知识-7-内存、深浅、文件操作
    IT工具使用
    Python基础知识-06-集合内存布尔False
    Python基础知识-05-数据类型总结字典
    elk收集tomcat日志
    pycharm重命名文件
  • 原文地址:https://www.cnblogs.com/Yesi/p/14206526.html
Copyright © 2011-2022 走看看