XML语言
常见应用:
XML技术除用于 /*保存有关系的数据*/之外,它还经常作软件配置文件,以描述程序模块之间的关系。
在一个系统软件中,为提高系统的灵活性,它所启动的模块通常由其配置文件决定
例如一个软件在启动时,它需要启动A、B两个模块,而A、B这两个模块在启动时,又分别需要A1、A2和B1、B2模块支持,为了准确描述这种关系,此时使用XML文件最为合适。
<soft>
<A>
<A1></A1>
<A2></A2>
</A>
<B>
<B1></B1>
<B2></B2>
</B>
</soft>
一个XML文件分为以下几个内容:
文档声明:<?xml version = "1.0" encoding = "UTF-8" standalone = "yes" ?>
字符编码通常需要写成 UTF-8,但是在windows默认是"gb2312",所以需要另存为 将字符编码改为UTF-8
用encoding属性说明文档的字符编码 ; 用standalone 属性说明文档是否独立
元素:XML元素指XML文件中出现的标签 (不允许交叉嵌套,只有一个根标签)
一个标签有如下几种形式:
包含标签体:<a>***</a>
不包含标签体:<a></a>,简写为<a/>
属性:
一个标签可以有多个属性值,每个属性都有它自己的名称和取值,例如:<input name = "text">
属性值一定要用双号或单引号引起来
定义属性必须遵守与标签相同的命名规范
在XML技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述,例如:
<input>
<name>text</name>
</input>
注释:
XML文件中的注释采用:"<!--注释-->"格式。
注意: 1.XML 声明之前不能有注释 2.注释不能嵌套
CDATA区 、特殊字符:
对于CDATA 区域的内容,XML 解析程序不会处理,而是直接原封不动的输出
语法:<![CDATA[内容]]>
对于一些单个字符,若想显示其原始样式,也可以使用转义字符进行处理
(& < > " ') --(& < > " &apos) "
处理指令(processing instruction):简称PI。处理指令用来指挥解析引擎,应用css文件显示XML文档内容
例如在XML文档中可以使用xml-stylesheet指令。通知XML解析引擎,应用css文件显示xml文档内容
<?xml-stylesheet type = "text/css" href = "1.css"?>
处理指令必须以 "<?" 作为开头,以 "?>"作为结尾,XML声明语句就是最常见的一种指令处理
XMLDTD约束和DTD校验
DTD(文档类型定义)
DTD校验可以在Myeclipse中进行
举例(DTD文件)(book.dtd): 举例(XML文件)
<!ELEMENT 书架(书+)> <?xml version = "1.0" ?>
//引用DTD约束(本地),本地 用 SYSTEM 网上的用 PUBLIC
<!ELEMENT 书(书名,作者,售价)> <!DOCTYPE 书架 SYSTEM "book.dtd">
<!ELEMENT 书名(#PCDATA)>
<!ELEMENT 作者(#PCDATA)>
<!ELEMENT 售价(#PCDATA)>
这个约束文件对应的格式为
<书架>
<书>
<书名>JAVA</书名>
<作者>***</作者>
<售价>23.00元</售价>
<书>
<书名>MySQL</书名>
<作者>****</作者>
<售价>22.00元</售价>
</书>
</书架>
对于这个dtd约束文件的说明:
//使用ELEMENT声明一个XML元素:语法格式: <!ELEMENT 元素名称 元素类型>
元素类型可以是元素内容、或类型
如为元素内容,则需要用()括起来,如 <!ELEMENT 书(书名,作者,售价)> <!ELEMENT 书名(#PCDATA)>
如为元素类型,则直接书写 EMPTY:定义空元素 ANY:表示元素内容为任意类型
元素内容可以使用如下方式,描述内容的组成关系
1.用逗号分隔,表示内容的出现顺序必须和声明时一致 <!ELEMENT MYFILE(TITLE,AUTHOR,EMAIL)>
2.用|分隔,表示任选其一,即多个只能出现一个 <!ELEMENT MYFILE(TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用 + 、 * 、 ? 等符号表示元素出现的次数
+:一次或多次(书+)
?: 0次或一次(书?)
*: 0次或多次(书*)
(书):至少出现一次
也可以使用圆括号()批量设置,例:<!ELEMENT MYFILE((TITLE+,AUTHOR?,EMAIL*)|COMMENT)>
属性定义 attribute
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性明2 属性值类型 设置说明
...
>
例:<!ATTLIST 元素名 对应的XML文件
类别 CDATA #REQUIRED <商品 类别="服装" 颜色="黄色">...</商品>
颜色 CDATA #IMPLIED <商品 类别="服装">...</商品>
...
>
设置说明:#REQUIRED 必须设置该值
#IMPLIED 可选
#FIXED 默认值
属性值类型:CDATA:普通文本字符串
ENUMERATED 属性的类型可以是一组取值的列表,在XML文件中设置的属性值只能是这个列表中的某个值(枚举)
ID:属性的设置值为一个唯一值 ID属性的值只能由字母,下划线开始,不能出现空白字符
ENTITY(实体):用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了
引用实体:语法格式:<!ENTITY 实体名称 "实体内容"> :直接转变成实体内容
引用方式:&实体名称
举例:<!ENTITY copyright "i am a programmer">...
©right (等同于i am a programmer)
参数实体:参数实体被DTD文件自身使用
语法格式:<!ENTITY % 实体名称 "实体内容">
引用方式:%实体名称
举例:
<!ENTITY % TAG_NAMES "姓名|EMAIL|电话|地址">
<!ENTITY 个人信息 (%TAG_NAMES; | 生日)>
<!ENTITY 各户信息 (%TAG_NAMES; | 公司名)>
XML编程(CRUD) 增删改查 create read update delete
XML解析技术:两种方式dom和sax
1.dom(Document Object Model 文档对象模型)是W3C组织推荐的解析XML的一种方式
( 在内存中存储类似一个对象树的东西) 将XML文档变成一个Document对象,将每一个标签(节点)变成一个一个的ELEMENT对象,标签里面有文本,属性等对象
2.sax(Simple API for XML)不是官方标准,但它是XML社区事实上的标准,几乎所有XML解析器都支持它
从上往下读XML文件 读取一行就处理一行 所以无法进行增删改查 只能做读取
/*Dom和Sax解析方法的区别:*/
1.dom解析的优点是对文档crud比较方便,缺点是占用内存比较大
2.sax解析的优点是占用内存小,解析速度快,缺点是只适合做文档的读取,不适合作文档的crud
使用JAXP对XML文档进行DOM解析 对XML文档进行 CRUD操作
/*schema技术*/
XML Schema 也是一种用于定义和描述XML文档结构与内容的模式语言,其出现是为了克服DTD的局限性
XML Schema VS DTD
1.XML Schema 符合XML语法结构(XML Schema就是一种XML 相当于用一个XML去约束另外一个XML)
2.DOM、SAX等XML API 很容易解析出XML Schema 文档中的内容
3.XML Schema 对名称空间支持的非常好
4.XML Schema 比XML DTD支持更多的数据类型,并支持用户自定义新的类型数据
5.XML Schema 定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制
6.XML Schema 不能像DTD一样定义实体,比DTD更复杂,但XML Schema现在已是 w3c组织的标准,它正逐步取代DTD
/*schema语法和案例*/
schema语法可以参考 schema帮助文档