zoukankan      html  css  js  c++  java
  • Xml二(解析思想)、

    XML解析:
      * 解析xml可以做:
          * 如果xml作为配置文件:读取
          * 如果xml作为传输文件:写,读
      * xml解析思想:
          * DOM:将文档加载进内存,形成一颗dom树(document对象),将文档的各个组成部分封装为一些对象。
            * 优点:因为,在内存中会形成dom树,可以对dom树进行增删改查。
            * 缺点:dom树非常占内存,解析速度慢。

          Document
          Element
          Text
          Attribute
          Comment


          * SAX:逐行读取,基于事件驱动
            * 优点:不占内存,速度快
            * 缺点:只能读取,不能回写


      * xml常用的解析器:
        * JAXP:sun公司提供的解析。支持dom和sax。
        * JDOM:
        * DOM4J:dom for java民间方式,但是是事实方式。非常好。 支持dom
            1.导入jar包 dom4j.jar
            2.创建解析器
                SAXReader reader = new SAXReader();
            3.解析xml 获得document对象
                Document document = reader.read(url);

        * XPATH:专门用于查询
            * 定义了一种规则。
            * 使用的方法:
              * selectSingleNode():
              * selectNodes():
            使用步骤:
              1、注意:要导包 jaxen...jar
              2、创建解析器
                SAXReader reader = new SAXReader();
              3、解析xml 获得document对象
                Document document = reader.read(url);


        XPath:
          //   nodename   选取此节点。
          //   /         从根节点选取。
          //   //        从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
          //   ..        选取当前节点的父节点。
          //   @        选取属性。
          //    [@属性名]   属性过滤
          //    [标签名]      子元素过滤

  • 相关阅读:
    find . name "*.py" print | xargs.exe grep py
    opensource license 的区别图解
    python urllib2 httplib HTTPConnection
    【转帖】使用python爬虫抓站的一些技巧总结:进阶篇
    ssh keyboard interactive
    using Net::SSH2 shell method
    【转帖】用python爬虫抓站的一些技巧总结
    PySide QtWebKit 读取网页
    qt single instance solution for PySide qt 4.7
    vim 首字符注释自动取消缩进问题
  • 原文地址:https://www.cnblogs.com/soficircle/p/6870129.html
Copyright © 2011-2022 走看看