findall:返回每一个匹配的标的,放在一个列表里
ret = re.findall('i','aike listen to me') print(ret) #打印: ['i', 'i']
search:返回第一个匹配到的匹配信息,需要调用group方法才能将标的打印,若没有匹配到,返回None
ret = re.search('i','aike listen to me') print(ret) print(ret.group()) #打印: <re.Match object; span=(1, 2), match='i'> i 一般使用方法为: ret = re.search('i','aike listen to me') if ret: print(ret.group())
match:以什么为开头,返回匹配标的的匹配信息,需要调用group方法才能将标的打印出来,若没有匹配,则返回None
ret = re.match('ai','aike listen to me') print(ret.group()) #打印: ai
split:切割
ret = re.split('[ab]', 'abcd') # 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割 print(ret) # ['', '', 'cd'] ret = re.split('(ab)', 'abcd') #优先级的原因,加上括号会保留需要切割的内容 print(ret) #['', 'ab', 'cd']
sub:更换符合匹配规则的标的,可以设置更换次数,默认全部更换
ret = re.sub('i','1','aike listen to me',1) print(ret) #打印: a1ke listen to me
subn:更换符合匹配规则的标的,可以设置更换次数,默认全部更换。返回一个元祖(更换后的结果,更换次数)
ret = re.subn('i','1','aike listen to me') print(ret) #打印: ('a1ke l1sten to me', 2)
compile:编译字符串类型的正则表达式
job = re.compile('d{4}') #将正则表达式编译成一个正则表达式对象,规则匹配的是4个连续的数字 ret = job.search('1121aaa12ak4543as6adas1111aa1524a') #正则表达式对象调用search方法,参数为待匹配的字符串 print(ret.group()) #1121
finditer:返回一个存放匹配结果的迭代器
ret = re.finditer('d{4}','1121aaa12ak4543as6adas1111aa1524a') print(ret.__next__().group()) print(ret.__next__().group()) for i in ret: print(i.group()) #打印: 1121 4543 1111 1524
findall的优先级:
ret = re.findall('name(aike)','nameaikename') #findall会先把优先组里匹配到的标的返回 print(ret) ret = re.findall('name(?:aike)','nameaikename')#想要获取全部的匹配结果,取消权限方式是在优先组里面加'?:' print(ret) #打印: ['aike'] ['nameaike']
split的优先级:
ret = re.split('(d)','hello1ai2ke') print(ret)#加上括号,会保留匹配的标的 ret = re.split('d','hello1ai2ke') print(ret)#正常情况下不会保留 #打印: ['hello', '1', 'ai', '2', 'ke'] ['hello', 'ai', 'ke']