https://www.cnblogs.com/sunny3096/p/7201403.html正则表达式30min
首先,正则表达式是一种记录文本规则的代码
1.简单的正则表达式匹配:findall是其中一个方法,用来按照提供的正则表达式,去匹配文本中的所有符合条件的字符串。返回结果是一个包含所有匹配的list
import re text = "Hi, I am Shirley Hilton. I am his wife." m = re.findall('Hi', text) if m: print(m) else: print('not match')
2.“”在正则表达式中表示单词的开头或结尾,空格、标点、换行都算是单词的分割。而“”自身又不会匹配任何字符,它代表的只是一个位置。所以单词前后的空格标点之类不会出现在结果里。
在前面那个例子里,“hi”匹配不到任何结果。但“hi”的话就可以匹配到1个“hi”,出自“his”。
3.[]表示满足括号中任一字符。比如“[hi]”,它就不是匹配“hi”了,而是匹配“h”或者“i”。
=====================================================================================
4.[0-9]或者d都是匹配数字的意思
5.+在上面的正则符号后面表示的是匹配任何长度为1以上的数字串,*也包括长度为零
6.{}指定要匹配的数字的位数
example:::1d{10}用来匹配手机号
=====================================================================================
常用的元字符:
.:除了换行符以外的任意字符
*:任意数量连续字符
?:一个任意字符
S:除了空白符以外的任意字符