zoukankan      html  css  js  c++  java
  • Java 将Word转为HTML的方法

    本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

    【程序环境】

    1. IntelliJ IDEA 2018( jdk 1.8.0)

    2. 测试文档:Word 2013(.docx)

    3. Jar包:Free Spire.Doc for Java 3.9.0

    导入jar的两种方法:

    方法1下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

     

     

    导入结果:

     

    方法2maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

    <repositories>
            <repository>
                <id>com.e-iceblue</id>
                <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
            </repository>
        </repositories>
    
    <dependencies>
        <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.doc.free</artifactId>
            <version>3.9.0</version>
        </dependency>
    </dependencies>

    【Java】

    import com.spire.doc.*;
    
    public class WordtoHtml {
        public static void main(String[] args) {
            Document  doc = new Document();
            doc.loadFromFile("test.docx");
            doc.saveToFile("wordtohtml.html",FileFormat.Html);
            doc.dispose();
        }
    }

    转换效果

    Word测试文档:

    转换后的HTML文件:

     

    注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:IDEAProjectConversion_Doc est.docx ,文件路径可以另行自定义为其他路径。

    —End—

  • 相关阅读:
    python输出shell命令执行结果
    python实验二:字符串排序
    python学习系列
    linux命令系列目录
    git初步
    HTML基础教程 七 高级
    HTML/CSS基础教程 六
    linux命令---sed
    linux命令---unzip
    模块
  • 原文地址:https://www.cnblogs.com/Yesi/p/15384554.html
Copyright © 2011-2022 走看看