zoukankan      html  css  js  c++  java
  • 使用Aspose.Words实现word,pdf,html的相互转换,去水印和头部文字版本(附jar包)

       最近需要将实现一个word和html,pdf相互转换的功能,考虑到了很多技术,例如 POI,Freemarker等等,发现都有不少缺陷,

       例如:  POI转换的表格样式丢失,freemarker导出的word文件格式不行(PS:freemarker导出的word使用的是xml,转换出来的word格式非标准格式,POI不支持转html,freemarker直接转html的话虽然也行,但是无法做到一个文件多种格式转换)

       于是找到了 Aspose.Words这个组件,Aspose.Words支持Doc,Docx,RTF,HTML,OpenDocument,PDF,XPS,EPUB和其他格式。可以在不使用Microsoft.Word的情况下生成、修改、转换和打印文档。

        Aspose.Words是收费的,我找到了破解的license.xml,并做了第二次封装.将license.xml直接封装到jar包,并提供验证license方法,

        下载地址: 

                   链接:https://pan.baidu.com/s/1p_A_P7F1G9wGMkfT9nFMkA
                   提取码:1234

       将jar包引入到项目即可

        1. word转pdf操作/**

        * Word转PDF操作
        *@param sourcerFile 源文件
        *@param targetFile 目标文件
        */
        public static void doc2pdf(String sourcerFile,String targetFile) {
             LicenseLoad.getLicense(); //验证License 若不验证则转化出的pdf文档会有水印产生
    try { long old = System.currentTimeMillis(); File file = new File(targetFile); //新建一个空白pdf文档 FileOutputStream os = new FileOutputStream(file); Document doc = new Document(sourcerFile); //sourcerFile是将要被转化的word文档 doc.save(os, SaveFormat.PDF);//全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF, EPUB, XPS, SWF 相互转换 os.close(); long now = System.currentTimeMillis(); System.out.println("共耗时:" + ((now - old) / 1000.0) + "秒"); //转化用时 } catch (Exception e) { e.printStackTrace(); } }

         2.  word 转html操作

         /**
          * 将word的内容转为html返回字符串,图片全部转为base64编码。
          * @param in
          * @return
          */
          public static String wordToHtml(InputStream in) {
            LicenseLoad.getLicense();// 验证License 若不验证则转化出的文件会有水印产生
            ByteArrayOutputStream htmlStream = new ByteArrayOutputStream();
            String htmlText = "";
            try {
                Document doc = new Document(in);
                HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
                opts.setExportXhtmlTransitional(true);
                opts.setExportImagesAsBase64(true);
                opts.setExportPageSetup(true);
                doc.save(htmlStream,opts);
                htmlText = new String(htmlStream.toByteArray(), StandardCharsets.UTF_8);
                htmlStream.close();
            } catch (Exception e) {
                e.printStackTrace();
            }
            return htmlText;
        }

       3. html 转 word

        /**
         * html内容转word
         * @param html  html内容
         * @param wordPath  word保存路径
         * @return
         */
         public static boolean htmlToWord(String html,String wordPath) {
            LicenseLoad.getLicense();
            try {
                Document doc = new Document();
                DocumentBuilder builder = new DocumentBuilder(doc);
                builder.insertHtml(html);
                //生成doc文件
                doc.save(wordPath, SaveOptions.createSaveOptions(SaveFormat.DOC));
                return true;
            } catch (Exception e) {
                e.printStackTrace();
            }
            return false;
        }

      4. 其他转换:  以上3个方法都是示例,对于 Aspose.words支持的其他操作的,代码流程如下

       /**
         *  其他操作方法
         */
         public static void otherOperate () {
               //加载监听,用于去除水印 
               LicenseLoad.getLicense();
               //apose.words的其他操作,详见相关API
               .........    
        }

         PS: 其他操作可以见  Aspose.words 的相关文档,这里有个博主翻译过,附上链接: Aspose.words文档

    5. 此jar包已封装了针对以上 1,2,3 转换操作的转换方法,我在二次封装的时候已经一并打包进去了,可以直接调用,如下

       public static void main(String[] args) {
            try {
               String wordPath = "E:\test.doc";    
               //word转html
               FileInputStream inputStream = new FileInputStream(new File(wordPath));
               String htmlStr = WordConverUtil.wordToHtml(inputStream);    
               inputStream.close();
               //word 转 pdf
               String pdfPath = "E:\test.pdf";
               WordConverUtil.wordToPdf(wordPath, pdfPath);
               //html转word
                HtmlConverUtil.htmlToWord(htmlStr, wordPath);
             } catch (Exception e) {
                e.printStackTrace();
             }
       }

    PS :  Aspose.Words 为商用软件,为避免纠纷,如需商用,还是建议请购买正版.

             

  • 相关阅读:
    Python subprocess- call、check_call、check_output
    Java Annotation认知(包括框架图、详细介绍、示例说明) (转)
    NVME SSD vs SATA SSD(转)
    scala中“_”的用法
    maven scope 'provided' 和 ‘compile’的区别
    scala tuple中的syntactic sugar
    Scala中的"null" 和“_”来初始化对象
    scala可变长度参数(转)
    Java中的Builder模式
    Scala中“=>”用法及含义
  • 原文地址:https://www.cnblogs.com/huaixiaonian/p/14700007.html
Copyright © 2011-2022 走看看