zoukankan      html  css  js  c++  java
  • java利用dom4j对任意xml的解析

                 最近完成了java对任意对象生成xml,有写了下java对任意一个xml文件的解析,生成主要靠反射原理来完成,而解析则主要是遍历xml树的每个节点,并对每个节点进行处理。刚刚开始我写了个如下的解析文件。

    package javaForXML;

    import java.io.File;
    import java.util.ArrayList;
    import java.util.HashMap;
    import java.util.Iterator;
    import java.util.List;
    import java.util.Map;

    import org.dom4j.Attribute;
    import org.dom4j.Document;
    import org.dom4j.DocumentException;
    import org.dom4j.Element;
    import org.dom4j.io.SAXReader;

    /**
     * 利用dom4j进行XML解析
     * 没用递归,本类只能解析到两层嵌套的属性和值
     * @date Dec 25, 20094:43:47 PM
     * @author zhangjp
     * @param
     */
    public class PraseXMLTest5 {
       
        /**
         * 遍历每个节点和属性
         * @param filename
         * @returnPraseXMLTest5.java
         */
     public  static  List<Map<String,String>> iterateWholeXML(String filename) {
     
      List <Map<String,String>>list = new ArrayList<Map<String,String>>();
      SAXReader saxReader = new SAXReader();
     
       try {
        Document document = saxReader.read(new File(filename));
        Element root = document.getRootElement();

        // 遍历根结点的所有孩子节点
        for (Iterator iter = root.elementIterator(); iter.hasNext();) {
         HashMap<String, String> map = new HashMap<String, String>();

         Element element = (Element) iter.next();
         if (element == null)
          continue;
         // 获取属性和它的值
         for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
          Attribute attr = (Attribute) attrs.next();
          if (attr == null)
           continue;
          String attrName = attr.getName();
          String attrValue = attr.getValue();

          map.put(attrName, attrValue);
         }
         if(element.isTextOnly()){
          String elementName = element.getName();
          String elementValue = element.getText();
          map.put(elementName, elementValue);
         }else{
         // 遍历结点的所有孩子节点,并进行处理
         for (Iterator iterInner = element.elementIterator(); iterInner.hasNext();) {
           Element elementInner = (Element) iterInner.next();
           //如果没有孩子结点,则直接取值
           if (elementInner == null){
            String elementName = element.getName();
            String elementValue = element.getText();
            map.put(elementName, elementValue);
           }
            
           //孩子结点的属性
           for(Iterator innerAttrs = elementInner.attributeIterator();innerAttrs.hasNext();){
            Attribute innerAttr = (Attribute)innerAttrs.next();
            if(innerAttr == null)
             continue;
            String innerAttrName = innerAttr.getName();
            String innerAttrValue = innerAttr.getValue();
            map.put(innerAttrName, innerAttrValue);
           }
           //假定没有第三层嵌套,获得第二层的值
           String innerName = elementInner.getName();
           String innerValue = elementInner.getText();
           map.put(innerName, innerValue);
          
          }
         
         }
         list.add(map);
        }
           return list;
       } catch (DocumentException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
       }
       return null;
     
     }
       

     /**
      * 测试
      * @param args
      * @throws DocumentExceptionPraseXMLTest5.java
      */
     public static void main(String[] args) throws DocumentException {
      String filename = "d:\data.xml";
      List<Map<String,String>> list = PraseXMLTest5.iterateWholeXML(filename);
      for(Map <String,String>map:list){
      for (String ss : map.keySet()) {
       System.out.println(ss + ":" + map.get(ss));
      }
      }
     }
    }

    这个写的很累,具体说很累赘,而且只能遍历xml的两层嵌套,对三层或更多的嵌套无能无力。于是很明显的看到这里用一个递归式多么容易的事情。于是写了下面这个代码:

    package javaForXML;

    import java.io.File;
    import java.util.ArrayList;
    import java.util.HashMap;
    import java.util.Iterator;
    import java.util.List;
    import java.util.Map;

    import org.dom4j.Attribute;
    import org.dom4j.Document;
    import org.dom4j.DocumentException;
    import org.dom4j.Element;
    import org.dom4j.io.SAXReader;

    /**
     * 利用dom4j进行XML解析
     * 利用递归,本类对所有嵌套进行递归遍历
     * @date Dec 25, 20094:43:47 PM
     * @author zhangjp
     * @param
     */
    public class PraseXMLTest6 {
       
        /**
         * 遍历每个节点和属性
         * @param filename
         * @returnPraseXMLTest5.java
         */
     public  static  List<Map<String,String>> iterateWholeXML(String filename) {
     
      List <Map<String,String>>list = new ArrayList<Map<String,String>>();
      SAXReader saxReader = new SAXReader();
     
       try {
        Document document = saxReader.read(new File(filename));
        Element root = document.getRootElement();
        recursiveNode(root,list);
           return list;
       } catch (DocumentException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
       }
       return null;
     
     }
       
     /**
      * 递归遍历所有的节点获得对应的值
      * @param rootPraseXMLTest6.java
      */
     private static void recursiveNode(Element root,List <Map<String,String>>list ){
      // 遍历根结点的所有孩子节点
      for (Iterator iter = root.elementIterator(); iter.hasNext();) {
       HashMap<String, String> map = new HashMap<String, String>();

       Element element = (Element) iter.next();
       if (element == null)
        continue;
       // 获取属性和它的值
       for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
        Attribute attr = (Attribute) attrs.next();
        if (attr == null)
         continue;
        String attrName = attr.getName();
        String attrValue = attr.getValue();

        map.put(attrName, attrValue);
       }
       //如果有PCDATA,则直接提出
       if(element.isTextOnly()){
        String innerName = element.getName();
        String innerValue = element.getText();
        map.put(innerName, innerValue);
         list.add(map);
       }else{
         list.add(map);
            //递归调用
               recursiveNode(element ,list);   
       }

      }
     }

     /**
      * 测试
      * @param args
      * @throws DocumentExceptionPraseXMLTest5.java
      */
     public static void main(String[] args) throws DocumentException {
      String filename = "d:\zhang.xml";
      List<Map<String,String>> list = PraseXMLTest6.iterateWholeXML(filename);
      for(Map <String,String>map:list){
      for (String ss : map.keySet()) {
       System.out.println(ss + ":" + map.get(ss));
      }
      }
     }
    }

     
            用了递归后,节省很多代码。看起来也比较简单明了,最大的好处是对于任意多个嵌套的xml文件的解析都不在话下。

            以上解析构造Document的时候都是文件,而在实际使用中很多情况不是来自文件,而是来自一个String,那么需要DocumentHelper这个类,如以下处理方法:

         Document document=DocumentHelper.parseText(xml);
         Element root = document.getRootElement();

    呵呵 ~ 好了 ,这个解析比生成要简单的多,好好悟吧。

  • 相关阅读:
    以正确的方式开源 Python 项目
    如果你喜欢Python 那么你不得不知的几个开源项目
    如何自学 Python(干货合集)
    不老的新丁 Python何以让人着迷
    流行的Python项目汇总
    AccountManager使用教程
    设计模式大全
    ubuntu12.04安装深度音乐播放器和深度影音
    完毕port(CompletionPort)具体解释
    关于jdbc注冊驱动的那点事
  • 原文地址:https://www.cnblogs.com/alaricblog/p/3278344.html
Copyright © 2011-2022 走看看