zoukankan html css js c++ java

Python爬网常见方法:find及find_all的使用方法

第一步:

创建一个Html5文件:

第二步:

代码如下:

import re
from bs4 import BeautifulSoup
htmlDoc='''<!DOCTYPE html><html><head><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><title>标题</title><link rel="stylesheet" href=""></head><body><h2>航天大学</h2><ol><li>abc</li><li id="myid">bbb</li><li>ccc</li><li class="myred">ddd</li><li class="myred">eee</li><li data-x="cs">fff</li><li>ggg</li><li>hhh</li><li>iii</li></ol></body></html>'''
soup = BeautifulSoup(htmlDoc, "html.parser")  
print(soup.prettify())
print(soup.find_all(re.compile("^me")))
print(soup.find_all(attrs={"data-x":'cs'}))
print(soup.find(id="myid"))
print(soup.find_all(class_="myred"))
print(soup.find_all(text="ccc"))
lis=soup.find_all("li")
for li in lis:
    print(li.string)

查看全文

相关阅读:
java encoding
[转]shell 变量的作用域
 [转] shell ：解析json的命令-jq
[转] Linux user-space Atomic Operations && GCC Atomic builtins
[转]reference counting
[转]memory order，memory barrier，原子操作
 [转]c语言volatile 关键字
 OCF介绍
 [转]计算机存储 cache介绍
 [转] linux IO

原文地址：https://www.cnblogs.com/exesoft/p/13230778.html

热门文章
stream数据流
 原生node的header
Q的深层嵌套
 asymptote
初始化
 git graph
数学分类
 apple script
expect
language tag