python使用ElementTree解析XML文件 - 走看看

zoukankan html css js c++ java

python使用ElementTree解析XML文件
一、将XML网页保存到本地

要加载XML文件首先应该将网页上的信息提取出来，保存为本地XML文件。抓取网页信息可以python的urllib模块。

代码如下：
from urllib import urlopen url = "http://********/**" resp = urlopen(url).read() f = open('文件保存路径', 'w') f.write(resp) f.close()
二、解析XML文件

python有许多可以用来解析XML文件的函数，在这里介绍ElementTree（简称ET）.它提供轻量级的python式API。实现逻辑简单，解析效率高。利用ET解析XML文件的方法是：先找出父级标签，然后再一级一级循环找出所需要的子标签，代码如下：
import xml.etree.cElementTree as ET tree = ET.parse("***.xml") #加载xml文件 root = tree.getroot() #得到第二级标签 for child_of_root in root[1]:#root[1]为第二级标签中的第二个子标签 for child1 in child_of_root[7]: #原理同上 for child2 in child1: print child2.tag, child2.attrib, child2.text for child3 in child_of_root[8]: for child4 in child3: print child4.tag, child4.attrib, child4.text
在上述代码中，child_of_root[7]表示在该级标签中的第八个子标签，在for child2 in child1中是遍历child1的所有子标签，打印出子标签的名称、属性、文本。这样就可以将XML文件解析完成，得到我们所想要的信息。
查看全文

相关阅读:
计算机视觉的常用测试数据集和源码
 Demo：基于 Flink SQL 构建流式应用
 102万行代码，1270 个问题，Flink 新版发布了什么？
bilibili 实时平台的架构与实践
 阿里云2020上云采购季来啦！降本增效1亿补贴！
阿里云助力宁波市教育局“甬上云校”停课不停学
 Quick BI新版本功能解读系列之-V3.5
百万TPS高吞吐、秒级低延迟，阿里搜索离线平台如何实现？
五分钟学会使用 go modules（含在家办公使用技巧）
OAM 深入解读：OAM 为云原生应用带来哪些价值？

原文地址：https://www.cnblogs.com/l5623064/p/8574624.html

Copyright © 2011-2022 走看看