zoukankan html css js c++ java

bs4和css选择器的基本使用

import  requests
html=requests.get('url')

soup=BeautifulSoup(html.text,'lxml')

解析器的种类：
html.parser:     python自带，但容错性不够高
lxml:      解析速度快，需额外安装（推荐使用）
xml:       同lxml库,支持xmlx文档
html5lib  :最好的容错性，但速度稍慢

（一）使用Tag对象按照文档结构获取数据
soup.title   #title元素
soup.p     #第一个p
soup.p['class']    #p元素的class属性
soup.p.b   #p元素下的b元素
soup.p.parent.name    #p元素的父节点标签

搜索
（二）find_all 和 find选择器
(1)a=soup.find_all('标签',class_='属性')   #找出所有的
a.text             #获取内容
(2)b=soup.find('标签',class_='属性')        #获取第一个 
b.get_text()    #获取内容
b.text             #获取内容

（三）css选择器
soup.select('title')      #通过标签获取元素
soup.select('.title')     #通过class="title"来获取元素
soup.select('#link2')    #通过id="link2"来获取元素
soup.select('html body p')    #获取html下的body标签下的p标签中内容
soup.select('p,.text')     #同时获取p标签和class="text"

查看全文

相关阅读:
用python抓取百度指数以及用cxfreeze打包的经验
 selenium中send_keys的使用
 python之文件调用
 学习python之selenium
学习python图像识别
 解决方案：运行ugarchroll，报错Error in try(.C("c_qstd", p = as.double(p), mu = as.double(mu), sigma = as.double(sigma), : NA/NaN/Inf in foreign function call (arg 3)
int 转 const char*
均值，方差，协方差，协方差矩阵，特征值，特征向量
 OpenCv 图片上添加汉字
 OpenCV获取与设置像素点的值的几个方法

原文地址：https://www.cnblogs.com/luckiness/p/13177875.html