zoukankan      html  css  js  c++  java
  • java-xml解析

    XML文档解析方式

             (1)sax解析:逐行解析,只能查询。

               (2)dom解析:一次性将文档加载到内存中,增删改查的操作 都可以。

    常见的XML解析开发包

           JAXP:sun公司提供支持DOM和SAX开发包

           JDom:dom4j前身

           dom4j:实际开发中最常用的解析开发包

    2-4 使用dom4j技术解析XML案例

           (1)导入jar包

                         dom4j-1.6.1.jar

           (2)操作流程

                dom4j 必须使用核心类SaxReader加载xml文档获得                   Document,通过Document 对象获得文档的根元素,然后就可             以继续操作了。

           (3)常用API

                         a、SaxReader对象

                                read(…) 加载执行xml文档

                                Document对象

                                getRootElement() 获得根元素

                         b、Element对象

                                elements(…) 获得指定名称的所有子元素。可以不指定                            名称

                                element(…) 获得指定名称第一个子元素。可以不指定                              名称

                                getName() 获得当前元素的元素名

                                getText() 获得当前元素的文本内容

           (4)具体代码实现方式:

                                a.导入jar包

                                b.创建一个核心对象 SAXReader

                                       new SAXReader();

                                c.将xml文档加载到内存中形成一棵树

                                       Document doc=reader.read(文件)

                                d.获取根节点

                                       Element root=doc.getRootElement();

                                e.通过根节点就可以获取其他节点(文本节点,属性节点,                                   元素节点)

                                       获取所有的子元素

                                       List<Element> list=root.elements()

    2-5 dom4j技术的扩充--xpath的解析方式

           (1)什么是xpath解析

           (2)xpath常用方式

                 

  • 相关阅读:
    url 百分号解密
    16.UA池和代理池
    15.scrapy框架之日志等级、请求传参、提高scrapy框架的爬取效率
    14. scrip框架之5大核心组件和post请求
    13.scrapy 框架之递归解析(手动发送请求),
    12. scrapy 框架持续化存储
    11.scrapy框架简介和基础应用
    10. 移动端数据爬取
    09.python之网络爬虫之selenium、phantomJs和谷歌无头浏览器的自动化操作
    08 python之网络爬虫之乱码问题
  • 原文地址:https://www.cnblogs.com/Tpf386/p/11154121.html
Copyright © 2011-2022 走看看