zoukankan      html  css  js  c++  java
  • Java Dom解析xml文件

    import java.io.IOException;
    import javax.xml.parsers.*;
    import org.w3c.dom.Document;
    import org.w3c.dom.Element;
    import org.w3c.dom.NamedNodeMap;
    import org.w3c.dom.Node;
    import org.w3c.dom.NodeList;
    import org.xml.sax.SAXException;
    
    public class Domtest {
    
        public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
            //创建一个DocumentBuilderFactory对象
            DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
            //创建一个Doucumentbuild对象
            DocumentBuilder db=dbf.newDocumentBuilder();
            //解析对应的xml文件
            Document doc=db.parse("tes.xml");
            //根据标签名获取Node节点list
            NodeList nodelist=doc.getElementsByTagName("book");
            System.out.println("共有"+nodelist.getLength()+"本书");
            //遍历每一个book节点
            for(int i=0;i<nodelist.getLength();i++) {    
                System.out.println("第"+i+"本书");
                //获取个book节点
                //使用Node类型获取book
                Node book=nodelist.item(i);
                System.out.println("Name: "+book.getNodeName()+" Value: "+book.getNodeValue()+" Type: "+book.getNodeType());
                //获取Node节点中的属性
                NamedNodeMap attrs= book.getAttributes();
                //遍历获取属性
                for(int j=0;j<attrs.getLength();j++) { 
                Node x=attrs.item(j);
                //System.out.println(x.getNodeName()+" "+x.getNodeValue()+" "+x.getNodeType());
                }
                
                //使用Element对象获取节点
                Element node =(Element) nodelist.item(i); 
                //使用Element对象下的getAttribute方法可以获取指定名字的属性值
                String id=node.getAttribute("id");
                System.out.println(id); 
                String type=node.getAttribute("type");
                System.out.println(type);
                 
                //使用Node节点下的getChildNode可以获取Nodelist数组,以此进行循环解析
                NodeList childnode=book.getChildNodes();
                for(int j=0;j<childnode.getLength();j++) {//getLength后会获取9个节点,因为text类型也算节点,一个<name>……</name>算一个节点,所以共有9个节点,而这些节点中,只有对象节点是我们需要的 
                    Node x=childnode.item(j);
                    if(x.getNodeType()==Node.ELEMENT_NODE){//当节点类型为Element时,获取该节点
                        //获取element类型的节点名
                        System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getLastChild().getNodeValue()+"/种类为"+x.getLastChild().getNodeType());//<name>xyz<name>,xyz属于<name>的子节点,使用getfirstChild或getLastNode效果相同
                        System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getTextContent()+"/种类为"+x.getNodeType());//getTextContent方法可以获取节点中所有的text内容 将<name>xyz</name>改为<name><a>123</a>xyz</name>,会获取到xyz123
                    }
                }
            }
        }
    }
    //为了将获取到的xml文件中内容保存下来,可以将内容保存到对象数组中一次来存储数据
    <?xml version="1.0" encoding="UTF-8" ?>
    <Bookstore>
    	<book id="1" type="text">
    	<name>冰与火之歌</name>
    	<author>乔治马丁</author>
    	<year>2014</year>
    	<price>80</price>
    	</book>
    <book id="2">
    	<name>安徒生童话</name>
    	<year>2004</year>
    	<price>79</price>
    	<language>English</language>
    </book>
    </Bookstore>
    

      

     注意点 

    1 空白换行符也算节点,所以遍历节点时需要注意这些无用的节点会混在list中

    2 text类节点返回Name值都是#text,而Element类节点返回value值都是null,需要注意

  • 相关阅读:
    os 模块删除图片操作
    python base64基本使用
    django 跨域
    git 回滚
    多线程
    原生sql子查询 和psql 子查询
    Python 3.x 中"HTTP Error 403: Forbidden"问题的解决方案
    报错(AttributeError: 'str' object has no attribute 'items')的解决办法
    C++虚函数
    C++泛型程序设计和多态
  • 原文地址:https://www.cnblogs.com/wjune-0405/p/12182498.html
Copyright © 2011-2022 走看看