zoukankan      html  css  js  c++  java
  • xml

    什么是XML

     XML个称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

        W3C19982月发布1.0版本,20042月义发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在20042W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!

     XML语法

     XML文档声明

     

    1.文档声明必须为<?xml开头,以?>结束;

    2.文档声明必须从文档的0行0列位置开始:

    3.文档声明只有属性:

    a) versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;

    b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8:

    元素element

    1.元素是XML文档中最重要的组成部分,

    2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>

    3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>

    4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>

    5.元素命名:

    a) 区分大小写

    b) 不能使用空格,不能使用冒号:

    c) 不建议以XML,  xml,  Xml开头

    6.格式化良好的XML文档,必须只有一个根元素。

    l 属性

    1.属性是元素的一部分,它必须出现在元素的开始标签中

    2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引

    3.一个元素可以有O ~ N个属性,但一个元素中不能出现同名属性

    4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头

    l 注释

    XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

    l 转义字符

    XML中的转义字符与HTML一样。

    因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"”>”、” ’ ”、” ” ”、”&”。

    l CDATA

    当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

    CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

       CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

    什么是DTD

      DTD (Document Type Definition ),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。

    DTD重点要求

    开发中,我们很少自己编写DTD约束文档,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2,  hibernate等。

    案例实现

    步骤1:创建web.xml文档,并将“web-app_ 2_ 3.dtd"拷贝相同目录下。

    步骤2:DTD文档开始处,拷贝需要的“文档声明”

    步骤3:完成xml内容编写

    DTD语法(了解)

    文档声明
    1. 内部DTD,在XML文档内部嵌入DTD,只对当前XML有效
    2. 外部DTD——本地DTDDTD文档在本地系统上,公司内部自己项目使用。
    3. 外部DTD——公共DTDDTD文档在网络上,一般都有框架提供。
    元素声明

    Schema约束

    什么是Schema

    Schema是新的XML文档约束:

    Schema要比DTD强大很多,是DTD替代者;

    Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .

    Schema功能更强大,数据类型更完善

    Schema支持名称空间

    Schema重点要求

    DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档

    案例实现

    1. 步骤1:创建web.xml,并将"web-app_2_5.xsd"拷贝到同级目录
    2. 步骤2:xsd文档中拷贝需要的“命名空间”
    3. 完成xml内容编写

    dom4j解析

    当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的旧知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML

    解析方式和解析器

    开发中比较常见的解析方式有三种,如下:

    1. DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

    a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

    b) 缺点:XML文档过大,可能出现内存溢出显现。

    1. SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)

    a) 优点:处理速度快,可以处理大文件

    b) 缺点:只能读,逐行后将释放资源。

    3. PULL:  Android内置的XML解析方式,类似SAX(了解)

    解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

    常见的解析开发包:

    JAXP: sun公司提供支持DOMSAX开发包

    JDom:dom4j兄弟

    jsoup:一种处理HTML特定解析开发包

    dom4j:比较常用的解析开发包,hibernate底层采用。

    API使用

    如果需要使用dom4j,必须导入jar包。

    dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。

    步骤:

    1.获取解析器

    2.获得document文档对象

    3.获取根元素

    4.获取根元素下的子元素

    5.遍历子元素

    6.判断元素名称为servlet的元素

    7.获取servlet-name元素

    8.获取servlet-class元素

  • 相关阅读:
    2020.2.5随笔
    2020.2.4
    2020.2.3随笔
    2020.2.2随笔
    2020/2/1随笔
    python3 百度AI-v3之 人脸对比 & 人脸检测 & 在线活体检测 接口
    python:Json模块dumps、loads、dump、load介绍
    python3之selenium.webdriver 库练习自动化谷歌浏览器打开百度自动百度关键字
    python之https爬虫出现 SSL: CERTIFICATE_VERIFY_FAILED (同时打开fiddler就会出现)
    调试python 程序的几种方法总结
  • 原文地址:https://www.cnblogs.com/cst123/p/13456343.html
Copyright © 2011-2022 走看看