zoukankan      html  css  js  c++  java
  • XML Schema介绍

    XML Schema 是基于 XML 的 DTD 替代者。

    XML Schema 描述 XML 文档的结构。

    XML Schema 语言也称作 XML Schema 定义(XML Schema Definition,XSD)。

    什么是 XML Schema?

    XML Schema 的作用是定义 XML 文档的合法构建模块,类似 DTD。

    XML Schema:

    • 定义可出现在文档中的元素
    • 定义可出现在文档中的属性
    • 定义哪个元素是子元素
    • 定义子元素的次序
    • 定义子元素的数目
    • 定义元素是否为空,或者是否可包含文本
    • 定义元素和属性的数据类型
    • 定义元素和属性的默认值以及固定值

    XML Schema 是 DTD 的继任者

    我们认为 XML Schema 很快会在大部分网络应用程序中取代 DTD。

    理由如下:

    • XML Schema 可针对未来的需求进行扩展
    • XML Schema 更完善,功能更强大
    • XML Schema 基于 XML 编写
    • XML Schema 支持数据类型
    • XML Schema 支持命名空间

    XML Schema 支持数据类型

    XML Schema 最重要的能力之一就是对数据类型的支持。

    通过对数据类型的支持:

    • 可更容易地描述允许的文档内容
    • 可更容易地验证数据的正确性
    • 可更容易地与来自数据库的数据一并工作
    • 可更容易地定义数据约束(data facets)
    • 可更容易地定义数据模型(或称数据格式)
    • 可更容易地在不同的数据类型间转换数据

    编者注:数据约束,或称 facets,是 XML Schema 原型中的一个术语,中文可译为“面”,用来约束数据类型的容许值。

    XML Schema 使用 XML 语法

    另一个关于 XML Schema 的重要特性是,它们由 XML 编写。

    由 XML 编写 XML Schema 有很多好处:

    • 不必学习新的语言
    • 可使用 XML 编辑器来编辑 Schema 文件
    • 可使用 XML 解析器来解析 Schema 文件
    • 可通过 XML DOM 来处理 Schema
    • 可通过 XSLT 来转换 Schema

    简单例子:

    XML 文档可对 DTD 或 XML Schema 进行引用。

    一个简单的 XML 文档:

    请看这个名为 "note.xml" 的 XML 文档:

    <?xml version="1.0"?>

    <note>

    <to>George</to>

    <from>John</from>

    <heading>Reminder</heading>

    <body>Don't forget the meeting this weekend!</body>

    </note>

    DTD 文件

    下面这个例子是名为 "note.dtd" 的 DTD 文件,它对上面那个 XML 文档的元素进行了定义:

    <!ELEMENT note (to, from, heading, body)>

    <!ELEMENT to (#PCDATA)>

    <!ELEMENT from (#PCDATA)>

    <!ELEMENT heading (#PCDATA)>

    <!ELEMENT body (#PCDATA)>

    第 1 行定义 note 元素有四个子元素:"to, from, heading, body"。

    第 2-5 行定义了 to, from, heading, body 元素的类型是 "#PCDATA"。

    XML Schema

    下面这个例子是一个名为 "note.xsd" 的 XML Schema 文件,它定义了上面那个 XML 文档的元素:

    <?xml version="1.0"?>

    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

    targetNamespace="http://www.w3school.com.cn"

    xmlns="http://www.w3school.com.cn"

    elementFormDefault="qualified">

     

    <xs:element>

        <xs:complexType>

          <xs:sequence>

            <xs:element/>

            <xs:element/>

            <xs:element/>

            <xs:element/>

          </xs:sequence>

        </xs:complexType>

    </xs:element>

     

    </xs:schema>

    note 元素是一个复合类型,因为它包含其他的子元素。其他元素 (to, from, heading, body) 是简易类型,因为它们没有包含其他元素。您将在下面的章节学习更多有关复合类型和简易类型的知识。

    DTD 的引用

    此文件包含对 DTD 的引用:

    <?xml version="1.0"?>

    <!DOCTYPE note SYSTEM "http://www.w3school.com.cn/dtd/note.dtd">

    <note>

    <to>George</to>

    <from>John</from>

    <heading>Reminder</heading>

    <body>Don't forget the meeting this weekend!</body>

    </note>

    XML Schema 的引用

    此文件包含对 XML Schema 的引用:

    <?xml version="1.0"?>

    <note

    xmlns="http://www.w3school.com.cn"

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    xsi:schemaLocation="http://www.w3school.com.cn note.xsd">

     

    <to>George</to>

    <from>John</from>

    <heading>Reminder</heading>

    <body>Don't forget the meeting this weekend!</body>

    </note>

     

    具体语法:

    <?xml version="1.0"?>

     

    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

    targetNamespace="http://www.w3school.com.cn"

    xmlns="http://www.w3school.com.cn"

    elementFormDefault="qualified">

     

    ...

    ...

    </xs:schema>

    代码解释:

    下面的片断:

    xmlns:xs="http://www.w3.org/2001/XMLSchema"

    显示 schema 中用到的元素和数据类型来自命名空间 "http://www.w3.org/2001/XMLSchema"。同时它还规定了来自命名空间 "http://www.w3.org/2001/XMLSchema" 的元素和数据类型应该使用前缀 xs:

    这个片断:

    targetNamespace="http://www.w3school.com.cn"

    显示被此 schema 定义的元素 (note, to, from, heading, body) 来自命名空间: "http://www.w3school.com.cn"。

    这个片断:

    xmlns="http://www.w3school.com.cn"

    指出默认的命名空间是 "http://www.w3school.com.cn"。

    这个片断:

    elementFormDefault="qualified"

    指出任何 XML 实例文档所使用的且在此 schema 中声明过的元素必须被命名空间限定。

    XML 文档中引用 Schema

    此 XML 文档含有对 XML Schema 的引用:

    <?xml version="1.0"?>

     

    <note xmlns="http://www.w3school.com.cn"

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    xsi:schemaLocation="http://www.w3school.com.cn note.xsd">

     

    <to>George</to>

    <from>John</from>

    <heading>Reminder</heading>

    <body>Don't forget the meeting this weekend!</body>

    </note>

    代码解释:

    下面的片断:

    xmlns="http://www.w3school.com.cn"

    规定了默认命名空间的声明。此声明会告知 schema 验证器,在此 XML 文档中使用的所有元素都被声明于 "http://www.w3school.com.cn" 这个命名空间。

    一旦您拥有了可用的 XML Schema 实例命名空间:

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    您就可以使用 schemaLocation 属性了。此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置:

    xsi:schemaLocation="http://www.w3school.com.cn note.xsd"

    定义简易元素

    定义简易元素的语法:

    <xs:element/>

    此处 xxx 指元素的名称,yyy 指元素的数据类型。XML Schema 拥有很多内建的数据类型。

    最常用的类型是:

    • xs:string
    • xs:decimal
    • xs:integer
    • xs:boolean
    • xs:date
    • xs:time

    定义属性的语法是:

    <xs:attribute/>

    在此处,xxx 指属性名称,yyy 则规定属性的数据类型。XML Schema 拥有很多内建的数据类型。

    最常用的类型是:

    • xs:string
    • xs:decimal
    • xs:integer
    • xs:boolean
    • xs:date
    • xs:time

    可选的和必需的属性

    在缺省的情况下,属性是可选的。如需规定属性为必选,请使用 "use" 属性:

    <xs:attribute use="required"/>

     

    限定(restriction)用于为 XML 元素或者属性定义可接受的值。对 XML 元素的限定被称为 facet。

    对值的限定

    下面的例子定义了带有一个限定且名为 "age" 的元素。age 的值不能低于 0 或者高于 120:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:integer">

        <xs:minInclusive value="0"/>

        <xs:maxInclusive value="120"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    对一组值的限定

    如需把 XML 元素的内容限制为一组可接受的值,我们要使用枚举约束(enumeration constraint)。

    下面的例子定义了带有一个限定的名为 "car" 的元素。可接受的值只有:Audi, Golf, BMW:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:enumeration value="Audi"/>

        <xs:enumeration value="Golf"/>

        <xs:enumeration value="BMW"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    上面的例子也可以被写为:

    <xs:element/>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:enumeration value="Audi"/>

        <xs:enumeration value="Golf"/>

        <xs:enumeration value="BMW"/>

      </xs:restriction>

    </xs:simpleType>

    注释:在这种情况下,类型 "carType" 可被其他元素使用,因为它不是 "car" 元素的组成部分。

    对一系列值的限定

    如需把 XML 元素的内容限制定义为一系列可使用的数字或字母,我们要使用模式约束(pattern constraint)。

    下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值只有小写字母 a - z 其中的一个:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="[a-z]"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下一个例子定义了带有一个限定的名为 "initials" 的元素。可接受的值是大写字母 A - Z 其中的三个:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="[A-Z][A-Z][A-Z]"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下一个例子也定义了带有一个限定的名为 "initials" 的元素。可接受的值是大写或小写字母 a - z 其中的三个:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="[a-zA-Z][a-zA-Z][a-zA-Z]"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下一个例子定义了带有一个限定的名为 "choice 的元素。可接受的值是字母 x, y 或 z 中的一个:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="[xyz]"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下一个例子定义了带有一个限定的名为 "prodid" 的元素。可接受的值是五个阿拉伯数字的一个序列,且每个数字的范围是 0-9:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:integer">

        <xs:pattern value="[0-9][0-9][0-9][0-9][0-9]"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    对一系列值的其他限定

    下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值是 a - z 中零个或多个字母:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="([a-z])*"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下面的例子定义了带有一个限定的名为 "letter" 的元素。可接受的值是一对或多对字母,每对字母由一个小写字母后跟一个大写字母组成。举个例子,"sToP"将会通过这种模式的验证,但是 "Stop"、"STOP" 或者 "stop" 无法通过验证:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="([a-z][A-Z])+"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下面的例子定义了带有一个限定的名为 "gender" 的元素。可接受的值是 male 或者 female:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="male|female"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    下面的例子定义了带有一个限定的名为 "password" 的元素。可接受的值是由 8 个字符组成的一行字符,这些字符必须是大写或小写字母 a - z 亦或数字 0 - 9:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:pattern value="[a-zA-Z0-9]{8}"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    对空白字符的限定

    如需规定对空白字符(whitespace characters)的处理方式,我们需要使用 whiteSpace 限定。

    下面的例子定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "preserve",这意味着 XML 处理器不会移除任何空白字符:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:whiteSpace value="preserve"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    这个例子也定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "replace",这意味着 XML 处理器将移除所有空白字符(换行、回车、空格以及制表符):

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:whiteSpace value="replace"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    这个例子也定义了带有一个限定的名为 "address" 的元素。这个 whiteSpace 限定被设置为 "collapse",这意味着 XML 处理器将移除所有空白字符(换行、回车、空格以及制表符会被替换为空格,开头和结尾的空格会被移除,而多个连续的空格会被缩减为一个单一的空格):

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:whiteSpace value="collapse"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    对长度的限定

    如需限制元素中值的长度,我们需要使用 length、maxLength 以及 minLength 限定。

    本例定义了带有一个限定且名为 "password" 的元素。其值必须精确到 8 个字符:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:length value="8"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    这个例子也定义了带有一个限定的名为 "password" 的元素。其值最小为 5 个字符,最大为 8 个字符:

    <xs:element>

     

    <xs:simpleType>

      <xs:restriction base="xs:string">

        <xs:minLength value="5"/>

        <xs:maxLength value="8"/>

      </xs:restriction>

    </xs:simpleType>

     

    </xs:element>

    数据类型的限定

    限定

    描述

    enumeration

    定义可接受值的一个列表

    fractionDigits

    定义所允许的最大的小数位数。必须大于等于0。

    length

    定义所允许的字符或者列表项目的精确数目。必须大于或等于0。

    maxExclusive

    定义数值的上限。所允许的值必须小于此值。

    maxLength

    定义所允许的字符或者列表项目的最大数目。必须大于或等于0。

    minExclusive

    定义数值的下限。所允许的值必需大于此值。

    minInclusiv

    定义数值的下限。所允许的值必需大于或等于此值。

    minLength

    定义所允许的字符或者列表项目的最小数目。必须大于或等于0。

    pattern

    定义可接受的字符的精确序列

    totalDigits

    定义所允许的阿拉伯数字的精确位数。必须大于0。

    whiteSpace

    定义空白字符(换行、回车、空格以及制表符)的处理方式。

    什么是复合元素?

    复合元素指包含其他元素及/或属性的 XML 元素。

    有四种类型的复合元素:

    • 空元素
    • 包含其他元素的元素
    • 仅包含文本的元素
    • 包含元素和文本的元素

    注释:上述元素均可包含属性

    复合元素的例子

    复合元素,"product",是空的:

    <product pid="1345"/>

    复合元素,"employee",仅包含其他元素:

    <employee>

    <firstname>John</firstname>

    <lastname>Smith</lastname>

    </employee>

    复合元素,"food",仅包含文本:

    <food>Ice cream</food>

    复合元素,"description",包含元素和文本:

    <description>

    It happened on <date lang="norwegian">03.03.99</date> ....

    </description>

    如何定义复合元素?

    请看这个复合 XML 元素,"employee",仅包含其他元素:

    <employee>

    <firstname>John</firstname>

    <lastname>Smith</lastname>

    </employee>

    XML Schema 中,我们有两种方式来定义复合元素:

    1. 通过命名此元素,可直接对"employee"元素进行声明,就像这样:

    <xs:element>

      <xs:complexType>

        <xs:sequence>

          <xs:element/>

          <xs:element/>

        </xs:sequence>

      </xs:complexType>

    </xs:element>

    假如您使用上面所描述的方法,那么仅有 "employee" 可使用所规定的复合类型。请注意其子元素,"firstname" 以及 "lastname",被包围在指示器 <sequence>中。这意味着子元素必须以它们被声明的次序出现。您会在 XSD 指示器 这一节学习更多有关指示器的知识。

    2. "employee" 元素可以使用 type 属性,这个属性的作用是引用要使用的复合类型的名称:

    <xs:element type="personinfo"/>

     

    <xs:complexType name="personinfo">

      <xs:sequence>

        <xs:element/>

        <xs:element/>

      </xs:sequence>

    </xs:complexType>

    如果您使用了上面所描述的方法,那么若干元素均可以使用相同的复合类型,比如这样:

    <xs:element/>

    <xs:element/>

    <xs:element/>

     

    <xs:complexType>

      <xs:sequence>

        <xs:element/>

        <xs:element/>

      </xs:sequence>

    </xs:complexType>

    您也可以在已有的复合元素之上以某个复合元素为基础,然后添加一些元素,就像这样:

    <xs:element/>

     

    <xs:complexType>

      <xs:sequence>

        <xs:element/>

        <xs:element/>

      </xs:sequence>

    </xs:complexType>

     

    <xs:complexType>

      <xs:complexContent>

        <xs:extension base="personinfo">

          <xs:sequence>

            <xs:element/>

            <xs:element/>

            <xs:element/>

          </xs:sequence>

        </xs:extension>

      </xs:complexContent>

    </xs:complexType>

    复合空元素:

    一个空的 XML 元素:

    <product prodid="1345" />

    上面的 "product" 元素根本没有内容。为了定义无内容的类型,我们就必须声明一个在其内容中只能包含元素的类型,但是实际上我们并不会声明任何元素,比如这样:

    <xs:element>

      <xs:complexType>

        <xs:complexContent>

          <xs:restriction base="xs:integer">

            <xs:attribute/>

          </xs:restriction>

        </xs:complexContent>

      </xs:complexType>

    </xs:element>

    在上面的例子中,我们定义了一个带有复合内容的复合类型。complexContent 元素给出的信号是,我们打算限定或者拓展某个复合类型的内容模型,而 integer 限定则声明了一个属性但不会引入任何的元素内容。

    不过,也可以更加紧凑地声明此 "product" 元素:

    <xs:element>

      <xs:complexType>

        <xs:attribute/>

      </xs:complexType>

    </xs:element>

    或者您可以为一个 complexType 元素起一个名字,然后为 "product" 元素设置一个 type 属性并引用这个 complexType 名称(通过使用此方法,若干个元素均可引用相同的复合类型):

    <xs:element/>

     

    <xs:complexType>

      <xs:attribute/>

    </xs:complexType>

    “仅含元素”的复合类型含有一个仅包含其他元素的元素。

    复合类型仅包含元素

    XML 元素,"person",仅包含其他的元素:

    <person>

    <firstname>John</firstname>

    <lastname>Smith</lastname>

    </person>

    您可在 schema 中这样定义 "person" 元素:

    <xs:element>

      <xs:complexType>

        <xs:sequence>

          <xs:element/>

          <xs:element/>

        </xs:sequence>

      </xs:complexType>

    </xs:element>

    请留意这个 <xs:sequence>。它意味着被定义的元素必须按上面的次序出现在 "person" 元素中。

    或者您可以为 complexType 元素设定一个名称,并让 "person" 元素的 type 属性来引用此名称(如使用此方法,若干元素均可引用相同的复合类型):

    <xs:element/>

     

    <xs:complexType>

      <xs:sequence>

        <xs:element/>

        <xs:element/>

      </xs:sequence>

    </xs:complexType>

    仅含文本的复合元素可包含文本和属性。

    仅含文本的复合元素

    此类型仅包含简易的内容(文本和属性),因此我们要向此内容添加 simpleContent 元素。当使用简易内容时,我们就必须在 simpleContent 元素内定义扩展或限定,就像这样:

    <xs:elementLINE-HEIGHT: 150%; FONT-FAMILY: 宋体; COLOR: black; FONT-SIZE: 12pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt">某个名称">

      <xs:complexType>

        <xs:simpleContent>

          <xs:extension base="basetype">

            ....

            ....

          </xs:extension>    

        </xs:simpleContent>

      </xs:complexType>

    </xs:element>

    或者:

    <xs:elementLINE-HEIGHT: 150%; FONT-FAMILY: 宋体; COLOR: black; FONT-SIZE: 12pt; mso-bidi-font-family: 宋体; mso-font-kerning: 0pt">某个名称">

      <xs:complexType>

        <xs:simpleContent>

          <xs:restriction base="basetype">

            ....

            ....

          </xs:restriction>    

        </xs:simpleContent>

      </xs:complexType>

    </xs:element>

    提示:请使用 extension 或 restriction 元素来扩展或限制元素的基本简易类型。

    这里有一个 XML 元素的例子,"shoesize",其中仅包含文本:

    <shoesize country="france">35</shoesize>

    下面这个例子声明了一个复合类型,其内容被定义为整数值,并且 "shoesize" 元素含有名为 "country" 的属性:

    <xs:element>

      <xs:complexType>

        <xs:simpleContent>

          <xs:extension base="xs:integer">

            <xs:attribute />

          </xs:extension>

        </xs:simpleContent>

      </xs:complexType>

    </xs:element>

    我们也可为 complexType 元素设定一个名称,并让 "shoesize" 元素的 type 属性来引用此名称(通过使用此方法,若干元素均可引用相同的复合类型):

    <xs:element/>

     

    <xs:complexType>

      <xs:simpleContent>

        <xs:extension base="xs:integer">

          <xs:attribute />

        </xs:extension>

      </xs:simpleContent>

    </xs:complexType>

    混合的复合类型可包含属性、元素以及文本。

    带有混合内容的复合类型

    XML 元素,"letter",含有文本以及其他元素:

    <letter>

    Dear Mr.<name>John Smith</name>.

    Your order <orderid>1032</orderid>

    will be shipped on <shipdate>2001-07-13</shipdate>.

    </letter>

    下面这个 schema 声明了这个 "letter" 元素:

    <xs:element>

      <xs:complexType mixed="true">

        <xs:sequence>

          <xs:element/>

          <xs:element/>

          <xs:element/>

        </xs:sequence>

      </xs:complexType>

    </xs:element>

    注释:为了使字符数据可以出现在 "letter" 的子元素之间,mixed 属性必须被设置为 "true"。<xs:sequence> 标签 (name、orderid 以及 shipdate ) 意味着被定义的元素必须依次出现在 "letter" 元素内部。

    我们也可以为 complexType 元素起一个名字,并让 "letter" 元素的 type 属性引用 complexType 的这个名称(通过这个方法,若干元素均可引用同一个复合类型):

    <xs:element/>

     

    <xs:complexType mixed="true">

      <xs:sequence>

        <xs:element/>

        <xs:element/>

        <xs:element/>

      </xs:sequence>

    </xs:complexType>

  • 相关阅读:
    在Ubuntu上安装PHPStudy组件
    手把手教你在Ubuntu上分别安装Nginx、PHP和Mysql
    ErrorKiller:Failed to decode response: zlib_decode(): data error
    HTTP和FTP上传文件的区别
    关于HTTP,你知道哪些?
    史上最全的FTP网址
    深入解读TCP/IP
    nefu 462 fib组合
    MZL's xor
    The Highest Mark(01背包)
  • 原文地址:https://www.cnblogs.com/RascallySnake/p/1776271.html
Copyright © 2011-2022 走看看