一、什么是XML?
XML指可扩展标记语言
XML是一种标记语句,很类似HTML
XML标签没有被预定义,需要自行定义标签
二、XML和HTML的差异:
1.XML为不同的目的而设计
2.XML被设计为传输和存储数据,其焦点是数据的内容,HTML被设计用来显示数据, 其焦点是数据的外观
3.XML意在传输信息,而HTML意在显示信息
三、XML的特点
1.XML可以自定义标签
<a></a>
<b></b>
2.XML必须包含根元素
XML 文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。
所有的XML标签都必须有关闭标签,在XML中省略标签是非法的,所有的元素都必须有关闭标签
3.XML标签对大小写敏感
4.XML 的属性值须加引号
四、XML 中的注释
<!-- This is a comment -->
五、什么是 XML 元素?
XML 元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。
元素可包含其他元素、文本或者两者的混合物。元素也可以拥有属性。
六、XML 命名规则
XML 元素必须遵循以下命名规则:
名称可以含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能以字符 “xml”(或者 XML、Xml)开始
名称不能包含空格
七、XML读取文本
from xml.dom import minidom
#打开文件
root =minidom.parse(filepath)
firstnode =root.getElementsByTagName(onenode)[0]
secondnode=firstnode.getElementsByTagName(twonodee)[0].firstChild.data