正则表达式
1,元字符
. 匹配除换行符以外的任意字符
w 匹配字母数字和下划线
d 匹配数字
s 匹配空白符
匹配换行符
匹配制表符
匹配单词的结尾
^ 匹配字符串的开始
$ 匹配字符串的结尾
W 匹配非字母数字下划线
D 匹配非数字
S 匹配非非空白符
() 括号内的表达式,表示一个组
[ ] 匹配字符组中的字符
[^ ] 匹配除了字符组中的所有字符
2,量词
* 重复零次或多次
+ 一次或多次
? 重复零次或一次
{m} 重复m次
{m,} 重复m次或更多次
{m,n} 重复m到n次
3,转义符
当我们在碰到有特殊意义的转义符,例如 ,s就需要用到转义符,“\n”,"\s",也可用r,如r" "
4贪婪匹配与惰性匹配
.* 贪婪匹配
.*? 惰性匹配
5,re模块的常用方法
1 import re 2 print(re.findall('www.(.*).com','www.baidu.com')) #['baidu'] 3 pat='www.(.*).com' 4 ret=re.search(pat,"www.baidu.com") 5 if ret: 6 print(ret.group()) #www.baidu.com