zoukankan
html css js c++ java
爬虫基础总结4
正则表达式
P = re.compile(regex, re.S)
P.findall("str")
P.sub("_", "str")
re.findall(regex, "str")
re.sub(regex,"_", str)
原始字符串r 在正则中忽略转义带来的影响
re.findall("<p>(.*?)</p>", sre)
xpath
获取文本
A/text()
A//text()
A[text()="下一页"]
@符号
获取属性 A/@href
根据属性定位 A[@class='a']
//
放在xpath最前面表示选择当前页面html页面任意元素
A//text()获取A下的任意元素的文本
//a[1] 第一个
//a[last()] 最后一个
//a[position()<3] 取前两个
//a[1]|//a[3] |表示或的意思
lxml
1.from lxml import stree
2.element=stree.HTML(bytes/str)
返回element对象,具有xpath
3.etree.tostring(element) 返回element中的字符串格式
element.xpath
1.先分组
2.分组提取数据
li.xpath("./a/text()")
li.xpath("./a/@href")
查看全文
相关阅读:
JavaWeb:JSP标准标签库
SpringMVC:学习笔记(6)——转换器和格式化
SpringMVC:学习笔记(5)——数据绑定及表单标签
SpringMVC:学习笔记(1)——理解MVC及快速入门
SpringMVC:学习笔记(4)——处理模型数据
SpringMVC:学习笔记(2)——RequestMapping及请求映射
SpringMVC:学习笔记(3)——REST
Spring MVC中使用Swagger生成API文档和完整项目示例Demo,swagger-server-api
Spring MVC中使用Swagger生成API文档和完整项目示例Demo,swagger-server-api
隆中对,程序员修炼之道,技术学习前进之路
原文地址:https://www.cnblogs.com/wsilj/p/12736407.html
最新文章
jvm实例的个数
图片存储系统TFS
jsp和servlet的区别和联系
servlet container:tomcat jetty and undertow
jboss相关的术语
web container和spring container之间的关系
矩阵连乘问题
动态规划
[MongoDB] 安装MongoDB配置Replica Set
mongodb replica set 添加/删除节点方法--http://www.ii123.com/jc/bc/bczh/258948.html
热门文章
mongodb local数据库的空间初始化好大啊!
Mongodb启动命令mongod参数说明
【MangoDB分片】配置mongodb分片群集(sharding cluster)
Mongodb慢查询笔记 (Mongodb slow query log)
mongodb慢查询记录
PPT竞赛课件制作教程-PPT利用触发器制作摘苹果游戏课件...
ppt 课件制作大全
vb 运行ppt示例代码
SpringMVC:学习笔记(9)——文件下载
SpringMVC:学习笔记(8)——文件上传
Copyright © 2011-2022 走看看