zoukankan      html  css  js  c++  java
  • XML简介


    针对于不同平台,不同语言之间的数据共享,目前使用最多的技术是XML和JSON。刚做开发不久,根据自己的理解总结一下XML技术。

    一.XML概念

     XML英文全称为Extensible Markup Language,可扩展标记语言。主要用于保存和处理数据同时,保存和处理数据之间的关系。XML的实质是一段字符串,根据这一特点,XML具有跨平台,跨语言特性。

    二.XML的作用

      1.不同平台,不同语言之间实现数据共享

      2.根据XML具有保存和处理数据之间的关系这一特点,常被用于编写配置文件

    三.XML语法

    XML主要由文档声明,元素,属性,注释,CDATA区,特殊字符,处理指令组成。

    文档声明:主要作用是告诉XML解析器怎样正确的解析当前的XML文档。文档声明必须处在XML的第一行,前面不能有其他内容,通常来说一个XML必须包含且只包含一个文档声明,在许多时候即使不包含文档声明,XML也可以被正常使用,但是这是不符合标准的,存在风险。

    encoding默认值为ISO8859-1

    standalone表示当前xml文档是否是一个独立文档,当为yes时表示是一个独立文档,当为no时表示当前文档需要其他文档支持

    <?xml version="1.0"  encoding="UTF-8" standalone="yes"?>

    元素:简单的理解就是XML中的标签。注意标签之间不能交叉嵌套,

    //错误的嵌套:<a>welcome to <b>www.it315.org</a></b>
    //正确的嵌套:<a>welcome to www.it315<b/>.org</a>
    


    元素的命名规范:
                区分大小写,例如,<P>和<p>是两个不同的标记。
                不能以数字或标点符号或"_"开头。
                不能以xml(或XML、或Xml 等)开头。
                不能包含空格。
                名称中间不能包含冒号(:)

    属性:一个标签可以有多个属性,每个属性都有它自己的名称和取值

    CDATA区:当XML中一段内容不希望被解析器解析时可以使用CDATA区将其包住,当解析器遇到CDATA区时会将其内容当作文本对待,不会进行解析。

                    语法:<![CDATA[ 内容 ]]>
    特殊字符:对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理。


    处理指令:简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。

    例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容。

        <?xml-stylesheet type="text/css" href="1.css"?>

    四.XML的约束

      在xml技术里,可以编写一个文档来约束一个xml文档的写法,这称之为XML约束。
      常见的XML约束技术:
       1.XML DTD 技术
       2.XML Schema技术


    XML  DTD约束

    XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

    1.当引用的文件在本地时,采用如下方式:
            <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
            例如:<!DOCTYPE 书架 SYSTEM “book.dtd”>

    2.当引用的文件是一个公共的文件时,采用如下方式:    
            <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
            例如:<!DOCTYPE web-app PUBLIC    "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"   "http://java.sun.com/dtd/web-app_2_3.dtd">

    元素定义:在DTD文档中使用ELEMENT声明一个XML元素。

    语法格式: <!ELEMENT 元素名称 元素约束>

    元素约束可以是元素内容、或存放类型
       1) 如为元素内容:则需要使用()括起来,

        如:<!ELEMENT 书架 (书名,作者,售价)>
                <!ELEMENT 书名 (#PCDATA)>
       2)如为存放类型,则直接书写,DTD规范定义了如下几种类型:
               EMPTY:用于定义空元素,例如<br/> <hr/>
               ANY:表示元素内容为任意类型。

    元素内容中可以使用如下方式,描述内容的组成关系
        用逗号分隔,表示内容的出现顺序必须与声明时一致。
           <!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
       用|分隔,表示任选其一,即多个只能出现一个
          <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>


       在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
            +: 一次或多次 (书+)
            ?: 0次或一次 (书?)
             *: 0次或多次  (书*)

    也可使用圆括号( )批量设置,

        例  <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)


    属性定义:DTD文档中的标签属性需通过ATTLIST为其设置属性
    语法格式:
        <!ATTLIST 元素名
            属性名1 属性类型 属性约束
            属性名2 属性类型 属性约束
            ……
        >

    属性声明举例:
    <!ATTLIST 商品
        类别 CDATA #REQUIRED
        颜色 CDATA #IMPLIED
    >
    对应XML文件:
        <商品 类别="服装" 颜色="黄色">…</商品>
        <商品 类别="服装">…</商品> 
    属性约束:
    #REQUIRED:必须设置该属性
    #IMPLIED:可以设置也可以不设置
    #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。使用该元素时无需为其分配该属性,XML处理器会自动为给属性增加固定值
    直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
    举例:
          <!ATTLIST 页面作者
             姓名 CDATA #IMPLIED
             年龄 CDATA #IMPLIED
             联系信息 CDATA #REQUIRED
             网站职务 CDATA #FIXED "页面作者"
             个人爱好 CDATA "上网"
           >
    CDATA:表示属性值为普通文本字符串。

    实体定义:实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容

    实体可分为两种类型:引用实体和参数实体。

    1):引用实体主要在 XML 文档中被应用
        语法格式: <!ENTITY 实体名称 “实体内容” >
       引用方式:&实体名称;
       举例:
         <!ENTITY copyright “I am a programmer">
           ……
          &copyright;

    2):参数实体被 DTD 文件自身使用
        语法格式:  <!ENTITY % 实体名称 "实体内容" >
        引用方式:%实体名称;
       举例1:
         <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
        
        <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>
         <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>


    XML  Schema技术

    XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言,其出现是为了克服 DTD 的局限性

    Schema与 DTD的比较:
          1.XML Schema符合XML语法结构。
          2.DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
          3.XML Schema对名称空间支持得非常好。
          4.XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
          5.XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。
          6.XML Schema不能像DTD一样定义实体,比DTD更复杂,但Xml Schema现在已是w3c组织的标准,它正逐步取代DTD。

    Schema快速入门

    XML Schema 文件自身就是一个XML文件,但它的扩展名通常为.xsd。
    一个XML Schema文档通常称之为模式文档(约束文档),遵循这个文档书写的xml文件称之为实例文档。
    和XML文件一样,一个XML Schema文档也必须有一个根结点,但这个根结点的名称为Schema。
    编写了一个XML Schema约束文档后,通常需要把这个文件中声明的元素绑定到一个URI地址上,在XML Schema技术中有一个专业术语来描述这个过程,即把XML Schema文档声明的元素绑定到一个名称空间上,以后XML文件就可以通过这个URI(即名称空间)来告诉解析引擎,xml文档中编写的元素来自哪里,被谁约束。

    在XML Schema文档中声明名称空间

    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
                   targetNamespace="http://www. itcast.cn"
                   elementFormDefault="qualified">
    <xs:schema>

    targetNamespace元素用于指定schema文档中声明的元素属于哪个名称空间。
    elementFormDefault元素用于指定,该schema文档中声明的根元素及其所有子元素是否都属于targetNamespace所指定的名称空间。

    XML中使用名称空间引入Schame约束文件

    为了在一个XML文档中声明它所遵循的Schema文件的具体位置,通常需要在Xml文档中的根结点中使用schemaLocation属性来指定,例如:
     

      <itcast:书架 xmlns:itcast="http://www.itcast.cn"
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation=“http://www.itcast.cn book.xsd">

    schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置,两者之间用空格分隔。

    XML Schame文件:

    <?xml version="1.0" encoding="UTF-8" ?> 
    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
    					  targetNamespace=“www.itcast.cn"
    					  elementFormDefault="qualified">
    	<xs:element name='书架' >
    		<xs:complexType>
    			<xs:sequence maxOccurs='unbounded' >
    				<xs:element name='书' >
    					<xs:complexType>
    						<xs:sequence>
    							<xs:element name='书名' type='xs:string' />
    							<xs:element name='作者' type='xs:string' />
    							<xs:element name='售价' type='xs:string' />
    						</xs:sequence>
    					</xs:complexType>
    				</xs:element>
    			</xs:sequence>
    		</xs:complexType>
    	</xs:element>
    </xs:schema>


    XML中引入Schame约束

    <?xml version="1.0" encoding="UTF-8"?>
    
    <itcast:书架 xmlns:itcast=“www.itcast.cn”
    				xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    				xsi:schemaLocation=“www.itcast.cn  book.xsd">
    
    	<itcast:书>
    		<itcast:书名>JavaScript网页开发</itcast:书名>
    		<itcast:作者>张孝祥</itcast:作者>
    		<itcast:售价>28.00元</itcast:售价>
    	</itcast:书>
    </itcast:书架>


    在XML Schema中,每个约束模式文档都可以被赋以一个唯一的名称空间,名称空间用一个唯一的URI(Uniform Resource Identifier,统一资源标识符)表示。 在Xml文件中书写标签时,可以通过名称空间声明(xmlns),来声明当前编写的标签来自哪个Schema约束文档

    XML中引入多个Schame文件

    <?xml version="1.0" encoding="UTF-8"?>
    
    <书架 xmlns="http://www.it315.org/xmlbook/schema" 
    	xmlns:demo="http://www.it315.org/demo/schema"
    	xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    	xsi:schemaLocation="http://www.it315.org/xmlbook/schema 				http://www.it315.org/xmlbook.xsd 
    		http://www.it315.org/demo/schema http://www.it315.org/demo.xsd">
    	<书>
    		<书名>JavaScript网页开发</书名>
    		<作者>张孝祥</作者>
    		<售价 demo:币种=”人民币”>28.00元</售价>
    	</书>
    </书架>

    目前大部分的XML都是使用Schame技术进行XML文档约束。体现最多的是大部分框架的配置文件。




  • 相关阅读:
    DRF
    DRF
    DRF
    DRF
    DRF
    DRF
    DRF
    Mongo错误记录:MongoClient opened before fork. Create MongoClient
    Hive默认分隔符和默认NULL值
    hdfs文件格式比较
  • 原文地址:https://www.cnblogs.com/javawebsoa/p/3020044.html
Copyright © 2011-2022 走看看