zoukankan html css js c++ java

BeautifulSoup库整理

BeautifulSoup库

pip3 install beautifulsoup4

improt bs4

解析器	使用方法	优势	劣势
bs4的HTML解析器	BeautifulSoup(mk,'html.parser')	Python 的内置标准库执行速度适中文档容错能力强	Python 2.7.3 or 3.2.2)前的版本中文档容错能力差
lxml的HTML解析器	BeautifulSoup(mk,'lxml')	速度快文档容错能力强	需要安装C语言库
lxml的XML解析器	BeautifulSoup(mk,'xml')	速度快唯一支持XML的解析器	需要安装C语言库
html5lib解析器	BeautifulSoup(mk,'html5lib')	最好的容错性以浏览器的方式解析文档生成HTML5格式的文档	速度慢

条件 :

注意:如果是html的父标签就是他自己,soup本身也是种特殊的标签的他的父标签是空

注意:必须在同一个父节点下才有平行关系,平行遍历获得的对象不一定是标签,也可能是文本,如果上下没来就为空

解析后的页面

prettify():会把解析的网页加上的文本文档,能使它打印变得更加好看

查看全文

相关阅读:
APK Multi-Tool强大的APK反编译工具终极教程
 Android中Intent组件详解 .
Android游戏开发之旅 View类详解
 深入理解Android中View
SQLite学习手册(数据表和视图)
转)sqlite 数据类型
 (转)SQLite内置函数
 Android权限Uri.parse的几种用法(转载)
android中与SQLite数据库相关的类
 JDK核心包学习