/* * 一、Xml? * * 1.是什么? * Extensible markup Language 可拓展标记性语言 * 功能是 储存数据 * 1.配置文件 * 2.在网络中传输数据 * xml和HTML的区别? * 1.xml标记全是自定义的 * 2.xml的语法严格 * 3.xml是存储数据的 HTML是 展示数据的 * * 二、.怎么用? * 语法:1.xml文档的后缀名是.xml * * 2.xml第一行必须是定义的文档声明 * <?xml version="1.0" encoding="utf-8" standalone="no"?> * version 版本号 必须写的属性 * encoding 编码方式 ISO-8859-1 gbk * standalone 是否独立 no 就是依赖其他文件 * yes 不依赖其他文件 * * 注意!3.xml文档中有且仅有一个跟标签 * 属性值必须用引号 标签必须关闭 标签名区分大小写 * * 4.约束? * 框架的使用者 规定xml文档的书写规则 * 1.能够在xml文档中引入约束文档 * 2.能够简单的读懂约束文档 * 5.约束的分类? * 1.DTD 2.Schema * * 三、解析? * * 1.操作xml文档 将文档中的数据读到内存中 * 1.操作文档 * 2.读取 将文档数据读取到内存 * 3.写入 将内存数据保存到xml文档中 是一种持久化的存储 * * 2.解析xml的方式 * 1.DOM树 将xml文档一次性加载进内存 操作方便 可进行crud操作 缺点是 消耗内存 * * 2.sax 逐行读取 基于事件驱动 不占内存 只能读取 不能增删改! * * 3.xml常见的解析器 * jaxp sun公司解析器 支持dom和sax两种思想 * dom4j * jsoup 一套API 直接解析 url 地址 标记内容 * pull Android 操作系统内置的解析器 SAX 方式 * * 四、jsoup入门 1.导包 2.获得Document 对象 3.获取对应的标签 Element 4.获取数据 * 五、对象的使用 * 1.jsoup 工具类可以解析xml HTML文档 并返回Document 对象 * parse 解析文档 parse(URL url.int timeoutMills) * 2.Document 文档对象 获得Element * getElementByTag("标签名|") * getElementById(String id) * 3.获取属性值 * String attr(Sting key); 根据属性值获取值 * String text();只想获得文本内容 * String html(); 包括标签的字符串内容 * 4.选择器 * selector(String cssQuery); * * */ <?xml version="1.0" encoding="utf-8"?> <!-- 注释 xml有且仅有一个根元素 --> <books> <book id="a1"> <name>周旭峰</name> <age>23</age> <like>run</like> </book> </books>