zoukankan      html  css  js  c++  java
  • XML学习(一)

    本文主要记录xml学习过程中的一些笔记,包括xml作用,语法以及解析。

    1、HTML和XML的区别     

    1.1、HTML

    名称:     HyperText Markup Languae(超文本标记语言)

    标签:     标签是w3c组成指定,固定的,约100来个。也可以自定义标签。(自定义标签也可叫xml标签)

    作用:     负责网页的结构 。被设计用来显示数据

    HTML: 负责网页的结构 

    CSS: 负责网页的样式(美观)

    Javascript: 负责在浏览器端与用户进行交互。

                    负责静态的网页制作的语言。HTML语言特点:

    1)由标签组成。 <title> <p> <hr/> <br/>等。

    2)语法结构松散的。表现在:大小写不区分,结束标签和开始标签不一定匹配。

    1.2、XML    

    名称:Extend Markup Languge(可扩展标签语言)。是一种标记语言,很类似 HTML

    标签:标签由开发者自己制定的(要按照一定的语法定义),没有被预定义。

    作用:设计宗旨是传输数据,而非显示数据。被设计为具有自我描述性。

    • 描述带关系的数据(作为软件的配置文件): 包含与被包含的关系。
    • 作为数据的载体(存储数据,小型的"数据库")

    2 XML作用

    2.1 描述带关系的数据(软件的配置文件

                web服务器(PC):

                使用ip(255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。

                    把ip地址端口配置到xml文件:

                            host.xml

                                <host>

                                    <ip>255.43.12.55</ip>

                                    <port>1521</port>

                                </host>

    2.2 数据的载体(小型的"数据库")

                教师管理系统:  教师信息:姓名+工龄+邮箱

               当发送教师数据给财务管理系统时,可以有多种发送方式,如:

    1. 字符串发送:String teacher = name=张三&email=zhangsan@qq.com&workage=2 。此法存在问题: 1)不好解析 2)不是规范)。
    2.  xml格式发送:

                        teacher.xml

                            <teacher>    

                                    <name>张三</name>

                                    <email>zhangsan@qq.com</email>

                                    <workage>2</workage>

                            </teacher>

                        这种一种规范

    3 XML语法

            xml文件以xml后缀名结尾。

            xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

    3.1 标签

                语法: <student></student> 开始标签 标签体内容 结束标签

                    1)<student/> 或 <student></student> 空标签。没有标签体内容

                    2)xml标签名称区分大小写

                    3)xml标签一定要正确配对

                    4)xml标签名中间不能使用空格。

                    5)xml标签名不能以数字开头

                    6)注意: 在一个xml文档中,有且仅有一个根标签

    3.2 属性

                语法: <Student name="eric">student</Student>

                注意:

                        1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

                        2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

    3.3 注释

                        语言: <!-- xml注释 --> 。在 XML 中编写注释的语法与 HTML 的语法很相似:

    <!-- This is a comment --> 

    3.4 xml文档声明

    语法: <?xml version="1.0" encoding="utf-8"?>

            version: xml的版本号

            encoding: 解析xml文件时查询的码表(解码过程时查询的码表)

            注意:

                    1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。

                    2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

    3.5 转义字符/实体引用

            在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

    如果你把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。

    这样会产生 XML 错误:

    <message>if salary < 1000 then</message>

    为了避免这个错误,请用实体引用来代替 "<" 字符:

    <message>if salary &lt; 1000 then</message> 

    在 XML 中,有 5 个预定义的实体引用:

    &lt; < 小于
    &gt; > 大于
    &amp; & 和号
    &apos; ' 单引号
    &quot; " 引号

    注释:在 XML 中,只有字符 "<" 和 "&" 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。       

    3.6 CDATA块

            作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

    3.7 处理指令

                作用: 告诉xml解析如果解析xml文档

                案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件

                 需要提取xml内容可以使用xml-stylesheet指令指令

    4 XML解析    

    4.1 引入

            xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

          4.2 XML解析方式(原理不同)

                DOM解析

                SAX解析

    4.3 XML解析工具

                    DOM解析原理:

                            1)JAXP (oracle-Sun公司官方)

                            2)JDOM工具(非官方)

                            3)Dom4J工具(非官方)

                                java三大框架(默认读取xml的工具就是Dom4j)

                            .......

                    SAX解析原理:

                            1)Sax解析工具(oracle-sun公司官方)

    4.4 什么是DOM解析

                DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

    4.5 Dom4j工具

                非官方,不在java jdk中。

                使用步骤:

                    1)导入dom4j的核心包。 dom4j-1.6.1.jar

                    2)编写Dom4j读取xml文件代码

                    

    public static void main(String[] args) {

            try {

                //1.创建一个xml解析器对象

                SAXReader reader = new SAXReader();

                //2.读取xml文档,返回Document对象

                Document doc = reader.read(new File("./src/contact.xml"));

                System.out.println(doc);

            } catch (DocumentException e) {

                e.printStackTrace();

                throw new RuntimeException(e);

            }       

        }

    4.6 Domj4读取xml文件

                    节点:

                        Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点

                    标签:

                         Element Document.getRootElement(); //获取xml文档的根标签        

                         Element ELement.element("标签名") //指定名称的第一个子标签

                         Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签

                            List<Element>     Element.elements(); //获取所有子标签

                    属性:

                        String Element.attributeValue("属性名") //获取指定名称的属性值

                         Attribute Element.attribute("属性名");//获取指定名称的属性对象    

                        Attribute.getName() //获取属性名称

                        Attibute.getValue() //获取属性值

                         List<Attribute>     Element.attributes(); //获取所有属性对象

                        Iterator<Attribute>        Element.attibuteIterator(); //获取所有属性对象

                    文本:

                                Element.getText(); //获取当前标签的文本

                                Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

    5、总结:

    本文主要介绍了一下:XML的作用、XML语法以及XML解析(DOM解析),下一篇将继续学习 xPath技术、 SAX解析 、 XML约束等xml操作知识。

    参考文档:http://www.w3school.com.cn/xml/xml_syntax.asp

  • 相关阅读:
    事后诸葛亮
    冲刺总结
    Alpha第十天
    Alpha第八天
    Alpha第九天
    Alpha第六天
    Alpha第七天
    Alpha第五天
    Python之pytesseract模块-实现OCR
    Selenium4 IDE初体验
  • 原文地址:https://www.cnblogs.com/VueDi/p/10896021.html
Copyright © 2011-2022 走看看