zoukankan      html  css  js  c++  java
  • xml解析之sax解析原理图和技术介绍




    SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

                                                核心的API:

                                                            SAXParser类: 用于读取和解析xml文件对象

                                                                          parse(File f,DefaultHandler dh)方法:解析xml文件

                           使用指定的DefaultHandler 将指定文件的内容解析为 XML。

                                                         个人理解:(使用指定的DefaultHandler解析传入的xml文件)

                                      

                                                         参数一: File:表示 读取的xml文件。

                                                    参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

    例如:{

                      1.创建SAXParser对象 

                  SAXParserparser=SAXParserFactory.newInstance().newSAXParser();

                      2.调用parse方法

                parser.parse(new File("./src/contact.xml"),new MyDefaultHandler());

                 [一个类继承class类名(extends DefaultHandler 在调用是创建传进去

     

                                       DefaultHandler类的API:

                                                         voidstartDocument()  :  在读到文档开始时调用

                                                         voidendDocument()  :在读到文档结束时调用

                                                         void startElement(String uri, String localName, String qName,Attributes attributes)  :读到开始标签时调用                           

                                                         voidendElement(String uri, String localName, String qName)   :读到结束标签时调用

                                                         voidcharacters(char[] ch, int start, int length) 读到文本内容时调用



    接下来,举例来认识sax解析xml过程。

  • 相关阅读:
    爬虫(七):爬取猫眼电影top100
    爬虫(六):Selenium库使用
    爬虫(五):PyQuery的使用
    爬虫(四):BeautifulSoup库的使用
    爬虫(三):Requests库的基本使用
    爬虫(一):基本原理
    爬虫(二):Urllib库详解
    安装mongodb
    利用 Chromium Embedded Framework (CEF) 定制提取 Flash 视频的浏览器
    Flash Player 19.0.0.124 Beta + IHTMLDocument3 IHTMLDocument2 ->get_innerHTML
  • 原文地址:https://www.cnblogs.com/wanghang/p/6299720.html
Copyright © 2011-2022 走看看