xml是一种文档的格式
xml模块的作用:
是帮我们解析xml格式的文档
xml 可扩展标记语言
所有内容都已标签的形式存在
标签由三部分组成
<tag 属性='属性值'>文本</tag>
1.标签名称
2.标签属性 可以是多个 必须放到引号里面
3.文本
如下所示:
<root>
<person name="阿狗" age="20">
hello 你好
<sub>111</sub>
<person>1212121</person>
</person>
<person name="阿猫" age="19">
hello 你不好
</person>
</root>
import xml.etree.ElementTree as ET #相当于类
# 创建一个树的对象
tree =ET.ElementTree() #实例化
#解析这个文档
tree.parse('test.xml')
#获取根标签
root=tree.getroot()
person_tags = root.findall('person')
for tag in person_tags:
print(tag)
print(tag.tag,tag.attrib,tag.text)
person_tag = root.find('person')
print(person_tag)
print(person_tag.tag,person_tag.attrib,person_tag.text)
person_tag = root.iter('person')
for tag in person_tag:
print(tag)
print(tag.tag,tag.attrib,tag.text)
学习xml的重点就是 学习如何在文档中找你所需要的标签
有三种方式获取需要的标签
1.iter 全文查找
2.find 返回第一个 是在当前标签的子级标签中查找,只要名称匹配就能找到
3.findall 返回所有 是在当前标签的子级标签中查找,只要名称匹配就能找到
找到标签后获取三个属性来获取内容
tag 名字
attrib 属性
text 文本