zoukankan
html css js c++ java
爬虫基础总结4
正则表达式
P = re.compile(regex, re.S)
P.findall("str")
P.sub("_", "str")
re.findall(regex, "str")
re.sub(regex,"_", str)
原始字符串r 在正则中忽略转义带来的影响
re.findall("<p>(.*?)</p>", sre)
xpath
获取文本
A/text()
A//text()
A[text()="下一页"]
@符号
获取属性 A/@href
根据属性定位 A[@class='a']
//
放在xpath最前面表示选择当前页面html页面任意元素
A//text()获取A下的任意元素的文本
//a[1] 第一个
//a[last()] 最后一个
//a[position()<3] 取前两个
//a[1]|//a[3] |表示或的意思
lxml
1.from lxml import stree
2.element=stree.HTML(bytes/str)
返回element对象,具有xpath
3.etree.tostring(element) 返回element中的字符串格式
element.xpath
1.先分组
2.分组提取数据
li.xpath("./a/text()")
li.xpath("./a/@href")
查看全文
相关阅读:
【转】Android实战技巧:ViewStub的应用
3.11 返回数据到前一个Activity
在用android日志的时候老是弹出一个窗口,内容为:"Copy" did not complete normally. Please see the log 和 什么函数,能达到和android手机上按“返回”键一样的效果?
Windows下的Android模拟器设置内存大小
AlertDialog.Builder对话框类的用法(二)
android版计算器
【转】Android中字符串的拆分split
readelf
6200 uboot 测试版分析(二)
cpp
原文地址:https://www.cnblogs.com/wsilj/p/12736407.html
最新文章
VB操作ISNULL
sqlserver自定义函数
Oledb 读取execl
返回一个表的自定义函数
合并单元格
经常用到的js
【转】:TCP/IP详解学习笔记(3)IP协议,ARP协议,RARP协议
深入理解windows Phone 7 运行模式
Windows Phone 7 学习网址总结
Windows Phone 7 网络编程之使用Socket(芒果更新)
热门文章
HTTP协议(收藏)
【转】:TCP/IP详解学习笔记(2)数据链路层
【转】:TCP/IP详解学习笔记(1)基本概念
【转】:TCP/IP详解学习笔记(4)ICMP协议,ping和Traceroute
[转】:HTTP协议浅析(附HTTP协议中文版.PDF)
【转】: TCP/IP协议的体系
ORACLE_RESETLOGS浅析
从android游戏框架看其生命周期
【转】Android中ExpandableListView控件基本使用
ListView_split 分割
Copyright © 2011-2022 走看看