* 使用Sax解析XML文档
*
* 使用Sax解析文档和DOM解析不一样。
* 概述:
* 是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM
* ,SAX可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂。。。。。
* SAX的工作原理:
* 简单地说就是对文档进行顺序扫描,当扫描到文档
* (document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数
* ,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
*
*
* 和DOM不同的是 SAX需要自己写处理器,处理器分为:(ContentHandeler)内容处理器
* (ErrorHandler)错误处理器,(DTDHandler)DTD约束处理器, (EntityHandler)实体处理器
*
* 重要的就是ContentHandler,这里也用内容处理器做例子
XML文档
<?xml version="1.0" encoding="UTF-8" standalone="no"?><书架> <书> <书名 name="xxxxx">第一本书</书名> <作者>六道01</作者> <售价>100</售价> </书> <书> <书名>第二本书</书名> <作者>六道02</作者> <售价>200</售价> </书> </书架>
对XML文档进行操作 使用SAX解析
import java.io.IOException; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.ContentHandler; import org.xml.sax.Locator; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; public class ExSax { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { // 1,创建解析工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); // 2,得到解析器 SAXParser sp = factory.newSAXParser(); // 3,得到读取器 XMLReader reader = sp.getXMLReader(); // 4,设置内容处理器 reader.setContentHandler(new ListHandler()); // 5,读取XML文档内容 reader.parse("src/MyBook.xml"); } } class ListHandler implements ContentHandler { @Override public void setDocumentLocator(Locator locator) { // TODO Auto-generated method stub } @Override public void startDocument() throws SAXException { // TODO Auto-generated method stub } @Override public void endDocument() throws SAXException { // TODO Auto-generated method stub } @Override public void startPrefixMapping(String prefix, String uri) throws SAXException { // TODO Auto-generated method stub } @Override public void endPrefixMapping(String prefix) throws SAXException { // TODO Auto-generated method stub } @Override public void startElement(String uri, String localName, String qName, Attributes atts) throws SAXException { //将获得的开始标签打印 System.out.println("<"+qName+">"); //atts是标签里面的属性 现在打印他,因为属性可能有好几个所以做循环,但是属性也可能为空所以要判断下 //属性有属性名和值。现在分别获取他们并打印 for(int i = 0; atts!=null && i<atts.getLength();i++) { //获得属性名 String attName = atts.getQName(i); //获得属性值 String attValue = atts.getValue(i); System.out.println(attName +"" +attValue); } } //打印结束标签 @Override public void endElement(String uri, String localName, String qName) throws SAXException { System.out.println("</" + qName + ">"); } //打印获得的标签里面的内容 @Override public void characters(char[] ch, int start, int length) throws SAXException { System.out.println(new String(ch,start,length)); } @Override public void ignorableWhitespace(char[] ch, int start, int length) throws SAXException { // TODO Auto-generated method stub } @Override public void processingInstruction(String target, String data) throws SAXException { // TODO Auto-generated method stub } @Override public void skippedEntity(String name) throws SAXException { // TODO Auto-generated method stub } }
使用SAX解析 获取指定内容
import java.io.IOException; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.ContentHandler; import org.xml.sax.Locator; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; import org.xml.sax.helpers.DefaultHandler; /** * 使用Sax解析XML文档 * * 获取指定内容 * * @author Administrator * */ public class ExSax2 { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { // 1,创建解析工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); // 2,得到解析器 SAXParser sp = factory.newSAXParser(); // 3,得到读取器 XMLReader reader = sp.getXMLReader(); // 4,设置内容处理器 reader.setContentHandler(new TagValueHandler()); // 5,读取XML文档内容 reader.parse("src/MyBook.xml"); } } // 获取指定标签的值,不需要实现接口,重写所有方法,只需要继承接口的子类DefaultHandler // 覆盖开始标签,结束标签,获取内容方法 就好了 class TagValueHandler extends DefaultHandler { // 定义当前标签 private String currentTag; // 记住想要获取的第几个作者标签的值 private int needNumber = 1; // 当前解析到的是第几个 private int currentNumber; @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { // 得到当前标签 currentTag = qName; // 如果获得到的是作者那么当前解析到的加一 if (currentTag.equals("作者")) { currentNumber++; } } @Override public void characters(char[] ch, int start, int length) throws SAXException { // 如果标签内容是作者 ,并且是指定的第几个作者,那么将打印作者内容 if ("作者".equals(currentTag) && currentNumber == needNumber) { System.out.println(new String(ch, start, length)); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { // 最后要将当前标签置空 currentTag = null; } }