zoukankan      html  css  js  c++  java
  • python(十五)

    re模块

    就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

    字符匹配(普通字符,元字符):

    1 普通字符:大多数字符和字母都会和自身匹配
                  >>> re.findall('alvin','yuanaleSxalexwupeiqi')
                          ['alvin'] 

    2 元字符:. ^ $ * + ? { } [ ] | ( )

    元字符

    . ^ $

    复制代码
    import re
    
    ret1=re.findall('李.','李爽
    alex
    李四
    egon
    alvin
    李二')
    
    ret2=re.findall('^李.','李爽
    alex
    李四
    egon
    alvin
    李二')
    
    ret3=re.findall('李.$','李爽
    alex
    李四
    egon
    alvin
    李二')
    复制代码

    * + ? { }

    复制代码
    import re
    
    ret1=re.findall('李.*','李杰
    alex
    李莲英
    egon
    alvin
    李二棍子')
    ret2=re.findall('李.+','李杰
    alex
    李莲英
    egon
    alvin
    李二棍子')
    
    ret3=re.findall('(李.{1,2})
    ','李杰
    alex
    李莲英
    egon
    alvin
    李二棍子') # 设定优先级的原因
    
    # 匹配一个数字包括整型和浮点型
    ret4=re.findall('d+.?d*','12.45,34,0.05,109')
    
    print(ret4)
    复制代码

    注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配

    ret=re.findall('131d+?','1312312312')
    print(ret)  ['1312']

    转义符

    1、反斜杠后边跟元字符去除特殊功能,比如.

    2、反斜杠后边跟普通字符实现特殊功能,比如d

    复制代码
    d  匹配任何十进制数;      它相当于类 [0-9]。
    D  匹配任何非数字字符;    它相当于类 [^0-9]。
    s  匹配任何空白字符;      它相当于类 [ 	
    
    fv]。
    S  匹配任何非空白字符;    它相当于类 [^ 	
    
    fv]。
    w  匹配任何字母数字字符;   它相当于类 [a-zA-Z0-9_]。
    W  匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_]
      匹配一个特殊字符边界,比如空格 ,&,#等
    复制代码

    让我们看一下的应用:

    ret=re.findall(r'I','I am LIST')
    print(ret)#['I']

    接下来我们试着匹配下“abcle”中的‘cl’:

    复制代码
    import re
    
    ret=re.findall('cl','abcle')
    print(ret)#[]
    
    ret=re.findall('c\l','abcle')
    print(ret)#[]
    
    ret=re.findall('c\\l','abcle')
    print(ret)#[]
    
    ret=re.findall(r'c\l','abcle')
    print(ret)#[]
    
    
    # 是特殊符号所以,'abce'前面需要加r
    ret=re.findall(r'c\b',r'abce')
    print(ret)#[]
    复制代码

    分组 ()

    m = re.findall(r'(ad)+', 'add')
    print(m)
     
    ret=re.search('(?P<id>d{2})/(?P<name>w{3})','23/com')
    print(ret.group())#23/com
    print(ret.group('id'))#23

    元字符之|

    ret=re.search('(ab)|d','rabhdg8sd')
    print(ret.group())#ab

    字符集[]

    复制代码
    #--------------------------------------------字符集[]
    ret=re.findall('a[bc]d','acd')
    print(ret)#['acd']
     
    ret=re.findall('[a-z]','acd')
    print(ret)#['a', 'c', 'd']
     
    ret=re.findall('[.*+]','a.cd+')
    print(ret)#['.', '+']
     
    #在字符集里有功能的符号: - ^ 
     
    ret=re.findall('[1-9]','45dha3')
    print(ret)#['4', '5', '3']
     
    ret=re.findall('[^ab]','45bdha3')
    print(ret)#['4', '5', 'd', 'h', '3']
     
    ret=re.findall('[d]','45bdha3')
    print(ret)#['4', '5', '3']
  • 相关阅读:
    ArcGis面要素空间连接,取相交面积最大者 C#
    迅雷下载器无限制版_无敏感_无限速
    redhat 6.8 配置 centos6 163 的 yum 源
    apache cgi 程序: End of script output before headers
    centos php 安装 decrypt
    url传输中+转为%2B取到变空格的问题
    快速搭建自己的搜索引擎
    ffmpeg 文件推流 rtsp和rtmp
    svn 服务器操作
    edusoho迁移
  • 原文地址:https://www.cnblogs.com/guozhenle/p/7080100.html
Copyright © 2011-2022 走看看