re模块简单介绍与使用
简介
re模块是python独有的匹配字符串的模块;
该模块中的很多功能是基于正则表达式实现的;
Python自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式;
导包
import re
正则表达式的基础语法
正则表达式是什么
描述了一种字符串匹配的模式(pattern)
功能一:用来检查一个字符串串是否含有某种子字符串
功能二:将匹配的子串(满足规则的字符串)进行替换
功能三:从某个字符串中取出符合某个条件的子
元字符
量词
re模块代码基础及应用
compile
格式:
re.compile(pattern,flags = 0 )
用于编译正则表达式,生成一个正则表达式对象
示例:
search
格式:
re.search(pattern,string,flags = 0 )
扫描字符串以查找正则表达式模式产生匹配项的第一个位置 ,然后返回相应的match对象。
search方法与match方法极其类似,区别在于match()函数只检测re是不是在string的开始位置匹配,search()会扫描整个string查找匹配,match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回None。同样,search方法的返回对象同样match()返回对象的方法和属性。
示例:
match
格式:
re.match(pattern,string,flags = 0 )
这个方法将会从string(我们要匹配的字符串)的开头开始,尝试匹配pattern,一直向后匹配,如果遇到无法匹配的字符,立即返回None,如果匹配未结束已经到达string的末尾,也会返回None。两个结果均表示匹配失败,否则匹配pattern成功,同时匹配终止,不再对string向后匹配。
示例:
输出结果:
split
格式:
re.split(pattern,string,maxsplit = 0,flags = 0 )
按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。
示例:
输出:
findall
格式:
re.match(pattern,string,flags = 0 )
搜索string,以string列表形式返回string中pattern的所有非重叠匹配项;
示例:
输出: