假期十一 - 走看看

zoukankan html css js c++ java

假期十一

.find_all(name,attrs,recursive,string,**kwargs)

name：对标签名称的检索字符串
attrs：对标签属性值的检索字符串，可标注属性检索
recursive：是否对子孙全部检索，默认为True
string <>....</>中字符串区域的检索字符串

soup.find_all('a')
寻找a标签

soup.find_all('a','b')
寻找a标签和b标签并作为列表复制

for tag in soup.find_all(True)
print(tag.name)
打印出所有的标签

import re #正则表达式库
for tag in soup.find_all(re.compile('b')):
print(tag.name)
以b开头的标签

soup.find_all('p','course')
打印p标签class属性为course的标签

soup.find_all(id='link1')
打印id=link1的属性的标签

soup.find_all(id=re.compile('link')
打印id中存在link如link，link1，link2......等等的标签

soup.find_all('a')
soup.find_all('a',recursive=False)
从soup根节点开始儿子节点无a标签

soup.find_all(string="Basic Python")
可以检索Basic Python
如果引入正则表达式库
soup.find_all(string=re.compile("python"))
可以检索出所有含有python的标签内部内容

查看全文

相关阅读:
广商14级软件工程团队第一次冲刺相关问题
 Github团队开发示例(二)
广商14级软件工程团队作业分数
 Github团队开发示例（一）
《Head First 设计模式》之装饰者模式
 《Head First 设计模式》之观察者模式
 《Head First 设计模式》之策略模式
 AD域登录验证
 广商14级软件工程：助教总结
 广商14级软件工程分数：第十四回合

原文地址：https://www.cnblogs.com/jbwen/p/12297369.html

Copyright © 2011-2022 走看看