SAX解析XML文件采用事件驱动的方式进行,也就是说,SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序。使用SAX的优势在于其解析速度较快,占用内存较少(相对于DOM而言)。而且SAX在解析文件的过程中得到自己需要的信息后可以随时终止解析,并不一定要等文件全部解析完毕。凡事有利必有弊,其劣势在于SAX采用的是流式处理方式,当遇到某个标签的时候,它并不会记录下以前所遇到的标签,也就是说,在处理某个标签的时候,比如在startElement方法中,所能够得到的信息就是标签的名字和属性,至于标签内部的嵌套结构,上层标签、下层标签以及其兄弟节点的名称等等与其结构相关的信息都是不得而知的。实际上就是把XML文件的结构信息丢掉了,如果需要得到这些信息的话,只能你自己在程序里进行处理了。所以相对DOM而言,SAX处理XML文档没有DOM方便,SAX处理的过程相对DOM而言也比较复杂。
使用SAX解析XML文件一般有以下五个步骤:
1、创建一个SAXParserFactory对象(通过类名很容易得知它利用工厂方法模式实现的);
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象;
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象;
4、在XMLReader中注册事件处理接口,一般有ContentHandler、ErrorHandler、DTDHandler、EntityHandler四种;
5、调用XMLReader中的parse方法解析指定的XML字符串对象;
步骤四中提到的四个Handler是事件处理接口,SAX的事件处理函数就定义在这四个接口中,利用SAX解析XML文件需要重写接口中的方法。其中ContentHandler用来处理XML中的内容,ErrorHandler用来处理错误,DTDHandler用来处理DTD,EntityHandler用来处理XML文档中的实体;最常用的是ContentHandler这个接口,下面是该接口中的一些常用方法:
startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
endDocument()
和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
startElement(String uri, String localName, String qName, Attributes atts)
当读到一个开始标签的时候,会触发这个方法。uri是命名空间(通过xmlns声明),localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。注意,如果没有指定Namespace,则qName可能为空,当然不同的SAX实现会有所不同,比如在Android中qName为空,而J2SE中localName为空,所以想要总是得到标签名,就需要检查这两个参数的值了。
endElement(String uri, String localName, String name)
这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。
下面是利用SAX解析XML文件的DEMO程序,首先定义一个XML文件users.xml,内容如下:
- <?xml version="1.0" encoding="utf-8"?>
- <users>
- <user id="1">
- <name>wuxianglong</name>
- <password>199098</password>
- </user>
- <long:user id="2">
- <name>wuwenyuan</name>
- <password>199189</password>
- </long:user>
- </users>
然后我们来实现ContentHandler这个接口,并重写其中的方法来处理上面的XML文件,代码如下:
- <span style="font-family:FangSong_GB2312;font-size:13px;">package sax.test;
- import java.util.ArrayList;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
- public class MyHandler extends DefaultHandler {
- private ArrayList<User> users;
- private User user;
- private String content;
- public ArrayList<User> getUsers() {
- return users;
- }
- @Override
- public void startDocument() throws SAXException {
- super.startDocument();
- users = new ArrayList<User>();
- System.out.println("----------Start Parse Document----------" );
- }
- @Override
- public void endDocument() throws SAXException {
- System.out.println("----------End Parse Document----------" );
- }
- @Override
- public void characters(char[] ch, int start, int length)
- throws SAXException {
- super.characters(ch, start, length);
- // 获得标签中的文本
- content = new String(ch, start, length);
- }
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException {
- super.startElement(uri, localName, qName, attributes);
- // 打印出localname和qName
- System.out.println("LocalName->" + localName);
- System.out.println("QName->" + qName);
- if ("user".equals(localName)) {
- user = new User();
- user.setId(Integer.parseInt(attributes.getValue("id")));
- }
- }
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException {
- super.endElement(uri, localName, qName);
- if ("name".equals(localName)) {
- user.setName(content);
- } else if ("password".equals(localName)) {
- user.setPassword(content);
- } else if ("user".equals(localName)) {
- users.add(user);
- }
- }
- }</span>
- <span style="font-family:FangSong_GB2312;font-size:13px;">package sax.test;
- import java.io.IOException;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.InputSource;
- import org.xml.sax.SAXException;
- import org.xml.sax.XMLReader;
- import android.app.Activity;
- import android.os.Bundle;
- import android.widget.TextView;
- public class TestSAX extends Activity {
- private TextView text;
- /** Called when the activity is first created. */
- @Override
- public void onCreate(Bundle savedInstanceState) {
- super.onCreate(savedInstanceState);
- setContentView(R.layout.main);
- text = (TextView) findViewById(R.id.result);
- try {
- // 创建一个工厂对象
- SAXParserFactory factory = SAXParserFactory.newInstance();
- // 通过工厂对象得到一个解析器对象
- SAXParser parser = factory.newSAXParser();
- // 通过parser得到XMLReader对象
- XMLReader reader = parser.getXMLReader();
- // 为reader对象注册事件处理接口
- MyHandler handler = new MyHandler();
- reader.setContentHandler(handler);
- // 解析指定XML字符串对象
- reader.parse(new InputSource(TestSAX.class.getClassLoader().getResourceAsStream("users.xml")));
- String usersInfo = "";
- for (User user : handler.getUsers()) {
- usersInfo += "ID->" + user.getId() + " ";
- usersInfo += "NAME->" + user.getName() + " ";
- usersInfo += "PASSWORD->" + user.getPassword() + " ";
- usersInfo += " ";
- }
- text.setText(usersInfo);
- } catch (SAXException e) {
- e.printStackTrace();
- } catch (ParserConfigurationException e) {
- e.printStackTrace();
- } catch (IOException e) {
- e.printStackTrace();
- }
- }
- }
- </span>
这样就算是完成了,运行之后得到以下结果:
附带贴上工程目录结构,如下图: