在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。
SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
•解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
•解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内 容作为方法的参数传递给事件处理器。
•事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
book.xml
<?xml version="1.0" encoding="UTF-8"?> <书架> <书> <书名>java web就业</书名> <作者>张孝祥</作者> <售价>40</售价> </书> <书> <书名>C++教程</书名> <作者>自己</作者> <售价>50</售价> </书> </书架>
package com.xmlsax; import java.io.IOException; import java.util.ArrayList; import java.util.List; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; import org.xml.sax.helpers.DefaultHandler; //自定义事件处理器, 封装xml中的配置bean到list中 class BeanListHandler extends DefaultHandler{ private List<Book> books = new ArrayList<Book>(); private Book book = null; private String currentTag = null; @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { currentTag = qName; if ("书".equals(currentTag)) { book = new Book(); } } @Override public void characters(char[] ch, int start, int length) throws SAXException { //System.out.println(currentTag); if ("书名".equals(currentTag)) { String name = new String(ch, start, length); book.setName(name); } if ("作者".equals(currentTag)) { String author = new String(ch, start, length); book.setAuthor(author); } if ("售价".equals(currentTag)) { String price = new String(ch, start, length); book.setPrice(Double.parseDouble(price)); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { if ("书".equals(qName)) { books.add(book); book = null; } currentTag = null; //必须置空,否则我们会得到标签之间的空值 } public List<Book> getBooks() { return books; } } public class SaxTest { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //1:得到sax解析器工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); //2:获得sax解析器 SAXParser parser = factory.newSAXParser(); //3:获得XMLReader读取器 XMLReader reader = parser.getXMLReader(); //4: 配置事件处理器 BeanListHandler beanListHandler = new BeanListHandler(); reader.setContentHandler(beanListHandler); //5:读取XML文件 reader.parse("src/book.xml"); List<Book> list = beanListHandler.getBooks(); for (Book b : list) { System.out.println(b.getName() + ": " + b.getAuthor() + " : " + b.getPrice()); } } }