zoukankan      html  css  js  c++  java
  • dom4j解析

    dom4j解析

    1.简介

      当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的旧知识是可以完成的,

    不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,

    并提交对应的解析器,方便开发人员操作XML。

    2.解析方式和解析器

    开发中比较常见的解析方式有三种,如下:

       1.DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

        a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

        b) 缺点:XML文档过大,可能出现内存溢出显现。

       2.SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,

    每执行一行,都将触发对应的事件。

        a) 优点:处理速度快,可以处理大文件

        b) 缺点:只能读,逐行后将释放资源。

          3. PULL:  Android内置的XML解析方式,类似SAX。

    解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

     常见的解析开发包:

      JAXP: sun公司提供支持DOM和SAX开发包

      JDom:dom4j兄弟

      jsoup:一种处理HTML特定解析开发包

      dom4j:比较常用的解析开发包,hibernate底层采用。

    3.DOM解析原理及结构模型

      XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,

    并获得一个Document对象,通过Document对象就可以对DOM进行操作

     

      DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!

    4.API使用

      如果需要使用dom4j,必须导入jar包。

      dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。

    步骤:

      1.获取解析器

      2.获得document文档对象

      3.获取根元素

      4.获取根元素下的子元素

      5.遍历子元素

      6.判断元素名称为servlet的元素

      7.获取servlet-name元素

      8.获取servlet-class元素

    import java.util.List;
    
    import org.dom4j.Document;
    import org.dom4j.DocumentException;
    import org.dom4j.Element;
    import org.dom4j.io.SAXReader;
    import org.junit.Test;
    
    public class TestDom4j {
        @Test
        public void testReadWebXML() {
            try {
                // 1.获取解析器
                SAXReader saxReader = new SAXReader();
                // 2.获得document文档对象
                Document doc = saxReader.read("src/com/oracle/demo06/web.xml");
                // 3.获取根元素
                Element rootElement = doc.getRootElement();
                // System.out.println(rootElement.getName());//获取根元素的名称
                // System.out.println(rootElement.attributeValue("version"));//获取根元素中的属性值
                // 4.获取根元素下的子元素
                List<Element> childElements = rootElement.elements();
                // 5.遍历子元素
                for (Element element : childElements) {
                    //6.判断元素名称为servlet的元素
                    if ("servlet".equals(element.getName())) {
                        //7.获取servlet-name元素
                        Element servletName = element.element("servlet-name");
                        //8.获取servlet-class元素
                        Element servletClass = element.element("servlet-class");
                        System.out.println(servletName.getText());
                        System.out.println(servletClass.getText());
                    }
                }
    
            } catch (DocumentException e) {
                e.printStackTrace();
            }
        }
    
    }
  • 相关阅读:
    trim标签:可以自定义字符串的截取规则
    登录框(用获取value值方法)
    C++在ARM Linux下的交叉编译
    happybase导入报错:thriftpy.parser.exc.ThriftParserError: ThriftPy does not support generating module with path in protocol 'c'
    Nginx报错总结
    ubuntu安装Nginx
    mqtt在debian strench 9 docker环境下的搭建
    evokly/kafka-connect-mqtt 不支持kafka集群部署
    树莓派mqtt安装
    kafka和mqtt的区别和联系
  • 原文地址:https://www.cnblogs.com/luzhijin/p/13495498.html
Copyright © 2011-2022 走看看