正则网站:regex101.com
在了解re模块之前,我们可以先了解一下正则表达式,正则表达式在很多语言中都有使用,但是不同的语言直接又有有些细小的区别,下面我们就来列举一下在python语言中常用的一些正则表达式:
![](https://images2017.cnblogs.com/blog/1103692/201711/1103692-20171115224537171-372245992.png)
re模块
re模块是python中处理正则表达式的一个模块,通过re模块的方法,把正则表达式pattern编译成正则对象,以便使用正则对象的方法。那为什么要使用re模块来把正则表达式搞成正则对象呢,最主要的是可以提高代码的执行效率,我们来看个例子:
1 import timeit 2 print timeit.timeit(setup='''import re; reg = re.compile('<(?P<tagname>w*)>.*</(?P=tagname)>')''', stmt='''reg.match('<h1>xxx</h1>')''', number=1000000) 3 print timeit.timeit(setup='''import re''', stmt='''re.match('<(?P<tagname>w*)>.*</(?P=tagname)>', '<h1>xxx</h1>')''', number=1000000)
打印结果为:
![](https://images2017.cnblogs.com/blog/1103692/201711/1103692-20171115224558452-1510373387.png)
#1.正则匹配是,优先编译成正则对象,然后再进行匹配,这样程序的效率更高
编译正则对象
正则匹配总写一个r是什么意思?
r表示raw的简及raw string 意思是原生字符,也就是说是这个字符串中间的特殊字符不用转义
比如你要表示‘
’,可以这样:r'
'
但是如果你不用原生字符 而是用字符串你得这样:‘\n’
1 import re 2 reg = re.compile(r'abc.*') 3 print(type(reg)) 4 print(reg)
打印结果为:
![](https://images2017.cnblogs.com/blog/1103692/201711/1103692-20171115224639359-1575130124.png)