zoukankan      html  css  js  c++  java
  • java 解析 xml 文档

       为读取和分析xml文档的内容,需要一个xml解析器。解析器是读取文档,检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX (xml简单api)规范,另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构(例如,开始标签<price> ),它就会调用必须提供的一个方法。相反,dom解析器则构建表示被解析文档的树。一旦解析器建树完毕,就可以分析此树。对需要大量内存来处理树结构的大型xml来说,sax解析器的效率更高。但是,对大多数应用程序来说,dom解析器更容易使用--解析树给出了数据的完成概况,而sax解析器只给出零散的信息。

        在sax解析器分析文档时,会激活事件,而dom解析器则构建文档树。

         Document接口描述xml文档的树结构,为了生成实现Document接口类的对象,就需要一个DocumentBuilder对象,为了得到DocumentBuilder,首先调用DocumentBuilderFactory类的静态方法newInstance方法,然后在工厂对象上调用newDocumenBuilder方法。

    File f=new File(" "); 
    DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
    DocumentBuilder builder=factory.newDocumentBuilder(); 
    Document doc = builder.parse(f);

        DocumentBuilder能够从文件,url或者输入流中读取xml文件,其结果是包含数的Document对象。

    如果文档位于Internet上,就使用URL;

    URL url=new URL(urlname);

    也可以从任意输入流中读取文档:

    InputStream in=......;

    Document doc=builder.parse(in);

            一旦创建了新文档或从文件中读取了文档,就可以检查并修改它。

    下面是一份简单的xml文档,no是车牌号码,addr是车主地址:

    <?xml version="1.0" encoding="GB2312"?>
    <result>
      <value>
          <no>A123</no>
          <addr>广东省珠海市香洲区</addr>
      </value>
     
      <value>
           <no>b456 </no>
           <addr>北京市朝阳区</addr>
      </value>
     
    </result>

      用dom解析程序如下:

    package dom;
     
    import javax.xml.parsers.*;
    
    import org.w3c.dom.*;
    
    import java.io.*;
    import java.util.*;
    public class MyXMLReader{  
          public static void main(String arge[]){  
    
        long lasting =System.currentTimeMillis();  
        try{
         File f=new File("resource/data_10k.xml");  
         DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();  
         DocumentBuilder builder=factory.newDocumentBuilder();  
         Document doc = builder.parse(f); 
         NodeList nl = doc.getElementsByTagName("value");  
         
          for (int i=0;i<nl.getLength();i++)
         
        {  
          System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue());  
          System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue());
        
        }  
         
        
        }catch(Exception e){  
          e.printStackTrace();  
        }
       }
     }

      注意 import javax.swing.text.Document;包中也有一个Document类,不要导入这个包,应导入import org.w3c.dom.Document;这个包

    输出:

    车牌号码:A123车主地址:广东省珠海市香洲区
    车牌号码:b456 车主地址:北京市朝阳区

     

     

  • 相关阅读:
    二分查找思路以及可能出现情况对应解决办法
    多线程知识点大纲
    服务器consul启动方法
    大白话带你认识 ZooKeeper !重要概念一网打尽!
    「Netty实战 02」手把手教你实现自己的第一个 Netty 应用!新手也能搞懂!
    从 BIO、NIO 聊到 Netty,最后还要实现个 RPC 框架!
    什么是P问题、NP问题和NPC问题
    期刊汇总
    Typora 使用
    TCA 复习
  • 原文地址:https://www.cnblogs.com/youxin/p/2507624.html
Copyright © 2011-2022 走看看