zoukankan      html  css  js  c++  java
  • xml

    一、标注

      转载自:http://www.cnblogs.com/cxcco/archive/2012/01/10/2318420.html

    二、正文  

      在上一篇中提到过说在Android系统中,存储数据的方式除了SQLite外,还有很多其他的方式,比较常用的就是XML方式。在Android中,比较常用的XML解析方式有SAX方式和DOM方式。下面就来看看这两种方式吧。

    1、 SAX解析

      SAX——Simple API for XML,在org.xml.sax包中被提供使用。SAX是基于事件驱动的,有事件就一定有事件源,这个事件源就是SAX解析XML时的一个XMLReader对象。当XMLReader对象读取到XML文件的开始和结束标签时或者在取到一个节点内容时,都会触发在Handler(事件处理器)中注册的相应事件。

      在XMLReader中可以通过setContentHandler(ContentHandler handler)方法来调用我们自己的Handler,而这个Handler就是我们解析XML文件的核心。我们可以通过继承SDK中的DefaultHandler类来实现一个我们自己的Handler。针对我们今天的主题,主要需要实现以下几个方法。

    • public void startDocument() throws SAXException{}——读取到文档时触发的事件,通常可以通过这个事件来处理一些IO错误之类的事情。
    • public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException{}——读取到XML文档内容中的标签时触发,如<work></work>中的<work>标签。
      • uri  XML文档中NameSpace的URI,如果不清楚XML文档中Namespace的可以去网上看看。
      • localName  无前缀的标签名,如<works><work></work></works>标签,返回的可以是work字符串。
      • qName  有前缀具有完整路径的标签名,如<works><work></work></works>中返回的是/works/work字符串。
      • attributes  标签中的属性名,如<work id=”111”></work>这里面的id就是属性,而”111”就是属性值。
    • public void endElement(String uri, String localName, String qName)throws SAXException{}——读取到XML文档内容中的结束标签时触发。
    • public void endDocument() throws SAXException{}——读取到XML文档结尾时触发该事件。
    • public void characters(char[] ch, int start, int length)throws SAXException{}——读取到XML文档某个标签下的内容时,就会调用这个方法返回该内容。
      • ch  内容的字符值。
      • start   读取的开始位置。
      • length  读取的内容长度。

      a) 现在来理下要解析XML文档的整个思路

      • 新建一个SAXParserFactory对象,通过该对象的newSAXParser()方法来获得一个SAXParser对象。
      • 通过SAXParser对象的getXMLReader()方法来获得一个XMLReader对象。
      • 利用XMLReader对象的setConentHandler()方法来注册一个我们自己的Handler对象。
      • 利用XMLReader对象的parse()方法来开始处理我们的XML文档。
      • 实现自己的Handler类。

      b) 普通方式下的解析

    View Code
     1 package LiB.XMLDemo;
     2  
     3  import org.xml.sax.Attributes;
     4  import org.xml.sax.SAXException;
     5  import org.xml.sax.helpers.DefaultHandler;
     6  
     7  public class SAXHandler extends DefaultHandler {
     8  
     9      String tagName;
    10      //当有值存在时,就调用该方法解析取值(如果是空值,也会调用这个方法)
    11      @Override
    12      public void characters(char[] ch, int start, int length)
    13              throws SAXException {
    14          String value= new String(ch, start,length);
    15          if(tagName.equals("name"))
    16          {
    17              System.out.println("name="+ value);
    18          }
    19           if(tagName.equals("age"))
    20          {
    21              System.out.println("age="+value);
    22          }
    23      }
    24    
    25      @Override
    26      public void endDocument() throws SAXException {
    27  
    28              System.out.println("---end----");
    29      }
    30  
    31      @Override
    32      public void endElement(String uri, String localName, String qName)
    33              throws SAXException {
    34          if(localName.equals("work"))
    35          {
    36              System.out.println("-----end----work");
    37          }
    38      }
    39  
    40      @Override
    41      public void startDocument() throws SAXException {
    42  
    43              System.out.println("---begin----");
    44      }
    45  
    46      @Override
    47      public void startElement(String uri, String localName, String qName,
    48              Attributes attributes) throws SAXException {
    49          tagName = localName;
    50          if(localName.equals("work"))
    51          {
    52              for(int i=0;i< attributes.getLength();i++)
    53              {
    54                  System.out.println(attributes.getLocalName(i)+"="+attributes.getValue(i));
    55              }
    56          }
    57      }
    58  
    59  }

     

      上面这个方法中存在一个问题:在读取出来的数据中,没区分开始标签和结束标签,所以出现了空值的状况。这个问题我一直都很奇怪,因为在不久前我处理的时候是不存在这个问题的,可是现在出现了。

      c) 改进后的解析

      解决的方法在网上也挺多的,而且大家都比较相似,就是在startElement和endElement方法中设置相应的标志位,然后在characters方法中通过标志位来决定是否需要读取它的内容。

      修改后的方法有兴趣的朋友可以把源码下载下来看看。

    2、 DOM解析

      DOM方式解析XML文件呢,就需要将整个XML文档装入我们的手机内存中,如果文档过大,那么将非常的耗费内存,但是这样的好处是解析速度很快,同时DOM解析方式可以只解析你需要的那个部分,灵活性非常大。

      DOM解析的原理呢,其实就是把动过DOM API访问XML文档的树形结构,并获取相应的数据。在java中通过DOM解析XML文件,一般会涉及到以下几个类。

    • DocumentBuilderFactory——创建DocumentBuilder对象的工厂类。
    • DocumentBuilder——通过这个方法可以创建一个能够获取Document实例的API。
    • Document——加载XML文档的入口,这是解析文档的源所在。
    • Element——元素,在DOM中,所有的节点都可以称作Element。
    • NodeList——节点的集合。

      来看看通过DOM方式解析XML文档的步骤吧:

    • 通过javax.xml.parsers包中的DocumentBuilderFactory类的newInstance()方法新建一个DocumentBuilderFactory对象。
    • 通过DocumentBuilderFactory对象的newDocumentBuilder ()方法创建一个DoucumentBuilder对象。
    • 通过DoucumentBuilder的parse()方法读取外部流来创建一个Document对象。
    • 通过Document对象来获得文档中的所有节点的根节点。
    • 通过根节点来解析所需要的文件内容。
      View Code
       1 package LiB.XMLDemo;
       2  
       3  
       4  import javax.xml.parsers.DocumentBuilder;
       5  import javax.xml.parsers.DocumentBuilderFactory;
       6  
       7  import org.w3c.dom.Document;
       8  import org.w3c.dom.Element;
       9  import org.w3c.dom.Node;
      10  import org.w3c.dom.NodeList;
      11  import org.xml.sax.InputSource;
      12  
      13  public class DomHandler {
      14      public static void GetStringFromDom(InputSource inputSource) {
      15          try {
      16              DocumentBuilderFactory factory = DocumentBuilderFactory
      17                      .newInstance();
      18              DocumentBuilder builder = factory.newDocumentBuilder();
      19              Document document = builder.parse(inputSource);
      20              //获取根节点
      21              Element rootElement = document.getDocumentElement();
      22              //获取第一级子节点
      23              NodeList nodeList = rootElement.getElementsByTagName("work");
      24              for(int i=0 ; i<nodeList.getLength();i++)
      25              {
      26              //String work = rootElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
      27  
      28                  Element workElement = ((Element)nodeList.item(i));
      29                  //获取节点中的属性值
      30  //String attr= workElement.getAttribute("XXX");
      31  //通过节点的标签名字来获取值
      32                  String name = workElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
      33                  String age = workElement.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();
      34                  System.out.println("name="+name);
      35                  System.out.println("age="+age);
      36              }
      37  
      38          } catch (Exception e) {
      39          }
      40      }
      41  }

      其实是用DOM方式来解析XML文件,有一些.NET和java开发经验的同学看到上面的代码都应该非常亲切,因为这和在.NET和java中相似。

    3、 二者区别

      SAX——流式解析,通过事件模型解析XML文件,对内存消耗比较小。但是只能顺序解析,也就是说如果你需要的数据在文件的末尾,那么你将需要把整个XML文件全部解析才能得到你想要的数据。

      Dom解析——符合W3C标准的一种解析方式。解析速度非常快。在几乎所有的语言中,都能使用,可以解析你所需要的数据(不管这个数据在文件中间还是文件末尾)。但是这个需要全部加载进系统内存中才能进行解析。

    三、总结

      这这个笔记中介绍了两种解析XML文档的方法。从下篇笔记开始,我将介绍如何与蓝牙、WIFI、网络传输相关的一些知识。

     

  • 相关阅读:
    《Python编程入门(第3版)》PDF 百度云盘免费下载||python零基础入门pdf教程
    Python编程:从入门到实践PDF高清完整版百度云盘免费下载||零基础入门学pythonPDF教程
    python3 爬虫学习python爬虫库-requests使用方法详细介绍
    Python基础教程(第3版) PDF高清完整版免费下载|百度云盘
    Python编程快速上手 让繁琐工作自动化PDF高清完整版免费下载|百度云盘
    我的python世界玩《Minecraft我的世界》学python编程(程晨)PDF高清完整版免费下载|百度云盘
    像计算机科学家一样思考Python(第2版)PDF高清完整版免费下载|百度云盘|python免费基础教程
    趣学Python编程(for kids)PDF高清完整版免费下载|百度云盘|青少年孩子学python零基础入门
    教孩子学编程-Python语言版PDF高清完整版免费下载|百度云盘|青少年孩子学Python基础教程
    从Python开始学编程PDF高清完整版免费下载|百度云盘|python系列课程
  • 原文地址:https://www.cnblogs.com/wyqfighting/p/3009718.html
Copyright © 2011-2022 走看看