学东西怎么学,是什么,能做什么,怎么去做!!
1.xml的简介
1.eXtensible Markup Language:可扩展标记型语言
- 标记型语言:html是标记型语言
- 也是使用标签来操作
- 可扩展
- html里面的标签是固定,每个标签都有特定的含义
<h1>
<br/>
<hr/>
- 标签可以自己定义,可以写中文的标签
<person></person>
<猫></猫>
- html里面的标签是固定,每个标签都有特定的含义
2.xml用途
- html是用于显示数据,xml也可以显示数据(不是主要功能)
- xml主要功能,为了存储数据
3.xml是w3c组织发布的技术
4.xml有两个版本 1.0 1.1
- 使用都是1.0版本,(1.1版本不能向下兼容)
2.xml的应用
1.不同的系统之间的传输数据
2.用来表示生活中有关系的数据
3.经常用在配置文件
- 比如现在连接数据库,肯定知道数据库的用户名和密码,数据库名称
- 如果修改数据库的信息,不需要修改源代码,只要修改配置文件就可以了
3.xml的语法
1.xml的文档声明
* 创建一个文件 后缀名是 .xml
* 如果写xml,第一步 必须要有一个文档声明(写了文档声明之后,表示写xml文件的内容)
* `<?xml version="1.0" encoding="utf-8" ?>`
* 文档声明必须写在 第一行 第一列
* 属性
* version:xml的版本 1.0(使用) 1.1
* encoding:xml编码 gbk utf-8 iso8859-1(不包含中文)
* standalone:是否需要依赖其他文件 yes/no
* xml的中文乱码问题解决
* 画图分析乱码问题
* 保存时候的编码和设置打开时候的编码一致,不会出现乱码
2.定义元素(标签)
3.定义属性
4.注释
5.特殊字符
6.CDATA区(了解)
7.PI指令(了解)
4.xml的元素定义
1.标签定义
- 标签定义有开始必须要有结束:
<person></person>
- 标签没有内容,可以在标签内结束:
<aa/>
- 标签可以嵌套,但必须是包含形式的嵌套
- 一个xml中,只能有一个根标签,其他标签都是这个标签下面的标签
- 在xml中把空格和换行都当成内容来解析,下面这两段代码含有是不一样的。
<aa>1111111111</aa>
------
<aa>
1111111111
</aa>
- xml标签可以是中午
- xml中标签的名称规则
- xml代码区分大小写
- xml的表情不能以数字和下划线(_)开头
- xml的标签不能以xml,XML,Xml等开头
- xml的标签不能包含空格和冒号
5.xml中属性的定义
1.html是标记型文档,可以有属性
2.xml也是标记型文档,可以有属性
3.属性定义的要求
* 一个标签上可以有多个属性
* 属性名称不能相同
* 属性名称和属性值之间使用= ,属性值使用引号包起来(可以是单引号,也可以是双引号)
* xml属性的名称规范和原始的名称规范一致
6.xml中的注释
1.写法<!-- xml注释 -->
2.注释不能嵌套
3.注释也不能放到第一行,第一行第一列必须放文档声明
7.xml中的特殊字符
1.如果想要在xml中显示a<b
,不能正常显示,因为把<当作标签
2.如果就想要显示,需要对特殊字符 < 进行转义
特殊字符 1替代符号
& &
< <
> >
" "
' '
8.CDATA区
1.可以解决多个字符都需要转义的操作 if(a<b && b<c && d>f) {}
2.把这些内容放到CDATA区里面,不需要转义了
3.写法<![CDATA[ if(a<b && b<c && d>f) {} ]]>
4.把特殊字符,当作文本内容,而不是标签
9.PI指令(处理指令)
1.可以在xml中设置样式
2.写法:<?xml-stylesheet type="text/css" href="css的路径">
3.设置样式,只能对英文标签名称起作用,对于中文的标签名称不起作用的。
10.xml的语法的总结
1.所有 XML 元素都须有关闭标签
2.XML 标签对大小写敏感
3.XML 必须有正确地嵌套顺序
4.XML 文档必须有根元素(只有一个)
5.XML 的属性值须加引号
特殊字符必须转义 --- CDATA
6.XML 中的空格、回车换行会解析时被保留
11.xml的约束
1.为什么需要约束
比如现在定义一个person的xml文件,只想要这个文件里面保存人的信息,比如name age等,但是如果在xml文件中写了一个标签<猫>,发现可以正常显示,因为符合语法规范,但是猫肯定不是人的信息,xml的标签是自定义的,需要技术来规定xml中只能出现的元素,这个时候需要约束。
2.xml的约束技术:dt的约束 和 schema约束
12.dtd的快速入门
1.创建一个文件 后缀名 .dtd
步骤:
- 看xml中有多少个元素,有几个元素,在dtd文件中写几个<!ELEMENT>
- 判断元素是简单元素还是复杂元素
- 复杂元素:有子元素的元素
<!ELEMENT 元素名称 (子元素)>
- 简单元素:没有子元素
<ELEMENT 元素名称 (#PCDATA) >
- 复杂元素:有子元素的元素
- 需要在xml文件中引入dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd文件的路径">
2.打开xml文件使用浏览器打开的,浏览器只负责校验xml的语法,不负责校验约束
3.如果想要校验xml的约束,需要使用工具(myeclipse工具)
4.打开myeclipse开发工具
* 创建一个项目 test
* 在test的src目录下面创建一个xml文件和一个dtd文件
* 当xml中引入dtd文件之后,比如只能出现name age,多写了一个a,会提示出错
13.dtd的三种引入方式
1.引入外部的dtd文件 <!DOCTYPE 根元素名称 SYSTEM "dtd"路径>
2.使用内部的dtd文件
<!DOCTYPE person [
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
3.使用外部的dtd文件(网络上的dtd文件)
<!DOCTYPE 根元素 PUBLIC "DTD名称" "DTD文档的URL">
- 后面学到的框架struts2使用配置文件 使用 外部的dtd文件
<!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.0//EN" "http://struts.apache.org/dtds/struts-2.0.dtd">
14.使用dtd定义元素
1.语法:<!ELEMENT 元素名 约束>
2.简单元素:没有子元素的元素
-
<!ELEMENT name (#PCDATA)>
- (#PCDATA):约束name是字符串类型
- EMPTY :元素为空(没有内容)
- ANY:任意
3.复杂元素:
-
<!ELEMENT person (name,age,sex,school)>
- 子元素只能出现一次
-
<!ELEMENT 元素名称 (子元素>
-
表示子元素出现的次数
+
表示一次或者多次?
表示零次或者一次*
表示零次或者多次
-
子元素直接使用逗号进行隔开
- 表示元素出现的顺序
-
子元素直接使用
|
进行隔开- 表示元素只能出现其中的任意一个
15.使用dtd定义属性
1.语法:<!ATTLIST 元素名称 属性名称 属性类型 属性的约束>
2.属性类型
- CDATA:字符串
- 枚举:表示只能在一定的范围内出现值,但是只能每次出现其中的一个
- ID:值只能是字母或者下划线开头
3.属性的约束
- #REQUIRED:属性必须存在
- #IMPLIED:属性可有可无
- #FIXED:表示一个固定值 #FIXED "AAA"
- 属性的值必须是设置的这个固定值
- 直接值
- 不写属性,使用直接值
- 写了属性,使用设置那个值
16.实体的定义
1.语法: <!ENTITY 实体名称 "实体的值">
<!ENTITY TEST "HAHAHEHE">
- 使用实体 &实体名称; 比如 &TEST;
2.注意
- 定义实体需要写在内部dtd里面,如果写在外部的dtd里面,有某些浏览器下,内容得不到。
17.xml的解析的简介(写到java代码)
1.xml是标记型文档
2.js使用dom解析标记型文档?
- 根据html的层级结构,在内存中分配一个树形结构,把html的标签,属性和文本都封装成对象
- document对象、element对象、属性对象、文本对象、Node节点对象
3.xml的解析方式(技术):dom和sax
-
画图分析使用dom和sax解析xml过程
-
dom方式解析
- 根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象
- 缺点:如果文件过大,造成内存溢出
- 优点:很方便实现增删改操作
-
sax方式解析
- 采用事件驱动,边读边解析
- 从上到下,一行一行的解析,解析到某一个对象,返回对象名称
- 缺点:不能实现增删改操作
- 优点:如果文件过大,不会造成内存溢出,方便实现查询操作
4.想要解析xml,首先需要解析器
- 不同的公司和组织提供了针对dom和sax方式的解析器,通过api方式提供
- sun公司提过了针对dom和sax解析器 jaxp
- dom4j组织,针对dom和sax解析器 dom4j(*** 实际开发中)
- jdom组织,针对dom和sax解析器 jdom
- 采用事件驱动,边读边解析