1.声明
<?xml version="1.0" encoding=“gb2312"?>
version属性
指定该文档遵守的版本号,通常为1.0
XML声明中必需指定version属性encoding属性
指定编码格式,代表对XML文档进行解码时所用的字符集
该属性为可选项,如果没有指定encoding属性,默认采用UTF-8编码格式
几种常用的编码格式:
简体中文:GB2312或GBK
繁体中文:BIG5
通用的国际编码:Unicodestandalone属性
指定该文档是否需要引用其他资源
该属性合法的取值:yes或no
该属性为可选项2.元素
XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他子元素、文本或者两者的混合。元素也可以拥有属性元素命名规则
名称可以含字母、数字以及其他的字符,不能包含<、>、,和$等符号
名称不能以数字、中划线和标点符号开始
名称不能以字符 “xml”(或者 XML、Xml)开始
名称不能包含空格
尽量不要出现英文冒号”:”,除非是在使用命名空间空元素:没有子元素也没有元素内容
<school></school>
元素标签大小写敏感
或
<school/>3.实体引用
为了避免发生以上错误,需要用实体引用来代替 这些特殊 字符
解析器在解析这些内容时,会进行正确的转换
实体
描述
字符
<
小于号
<
>
大于号
> "
双引号
" '
单引号
'
& and
&
4.CDATA
不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)
某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将这部分代码放入CDATA中,解析器会忽略CDATA中的内容。
CDATA 语法:由 “<![CDATA[” 开始,由 “]]>” 结束注释:CDATA 部分不能包含字符串 “]]>”;也不允许嵌套的 CDATA 部分;结尾的 "]]>" 不能包含空格或折行
5.注释
XML文档中可以添加注释,注释中的字符串不会被XML解析器处理
在 XML 中编写注释的语法与 HTML 的语法很相似:<!-- This is a comment -->
不要把注释放在标签之内
注释中可以包含标签和元素,但一定要保证删除注释后,剩下的内容满足XML的语法规则
不要把注释放在XML声明之前6.处理指令(ProcessingInstructions, PI)
在XML文档中,有可能包含一些非XML格式的数据(如:样式表),这些数据XML处理器无法处理,需要通过处理指令来告诉其他应用程序如何处理文档中的这些数据
处理指令必须以<?开始,以?>结束<?处理指令名 处理指令信息?>
开发者可以定义任意的处理指令,但需要自己写程序来处理该指令,使该指令生效
不同的应用程序支持不同的处理指令,应用程序从处理指令中取得目标和数据,执行要求的动作
常见处理指令“xml-stylesheet”:通知XML解析引擎,应用后面指定的css文件显示xml文档中的数据内容,该指令总是放在XML声明之后,第一个元素之前<?xml-stylesheet href="hello.css" type="text/css"?>
注意:XML声明不是处理指令,XML处理程序对XML声明和处理指令采取的是不同的处理方式