zoukankan      html  css  js  c++  java
  • Day 18 正则表达式.

    一、字符

    .匹配除换行符以外的任意字符. 

    w 匹配字母数字或者下划线.

    s 匹配任意的空白符

    d 匹配数字 

    匹配一个换行符

    匹配一个制表符

    ^ 匹配字符串的开始.

    $ 匹配字符串的结尾.

    W 匹配非字母或者数字下划线 

    D 匹配非数字 

    S 匹配非空白符

    a|b 

    ()  匹配空号内的表达式 ,也表示一个组 

    [...]匹配字符组中的字符.

    [^....] 匹配除了字符组中字符的所有字符.

    量词 :

    二、量词

    * 重复零次或者更多次

    +重复一次或者更多次

    ?重复零次或者一次

    {n}重复n次

    {n,}重复n次或者更多次 

    {n,m}重复n到m次

    #* + ? { }实例:
    import re
    obj1=re.findall('李.?','李杰和李莲英和李二棍子')
    print(obj1) #['李杰', '李莲', '李二'],?表示匹配0或者1次,即匹配李后面任意字符1次


    obj2=re.findall('李.*','李杰和李莲英和李二棍子')
    print(obj2) #['李杰和李莲英和李二棍子'],*表示匹配0次或者多次,即匹配李后面任意字符多次


    obj3=re.findall('李.+','李杰和李莲英和李二棍子')
    print(obj3) #['李杰和李莲英和李二棍子'],+表示匹配1次或者多次,即匹配李后面任意字符多次


    obj3=re.findall('李.{1,2}','李杰和李莲英和李二棍子')
    print(obj3) #['李杰和', '李莲英', '李二棍'],{1,2}表示匹配1到2次,即匹配李后面任意字符2次

    非贪婪模式 用法说明
    *? 
    重复0次或更多次,但尽可能少重复
    +?
    重复1次或更多次,但尽可能少重复
    ?? 
    重复0次或1次,但尽可能少重复
    {n,}?
    重复n次以上,但尽可能少重复
    {n,m}?
    重复n到m次,但尽可能少重复

    import re
    obj1=re.findall('李.??','李杰和李莲英和李二棍子')
    print(obj1) #输出结果:['李', '李', '李']


    obj2=re.findall('李.*?','李杰和李莲英和李二棍子')
    print(obj2) #输出结果:['李', '李', '李']


    obj3=re.findall('李.+?','李杰和李莲英和李二棍子')
    print(obj3) #输出结果:['李杰', '李莲', '李二']


    obj3=re.findall('李.{1,2}?','李杰和李莲英和李二棍子')
    print(obj3) #输出结果:['李杰', '李莲', '李二']

    import re
    obj1=re.findall('李.??','李杰和李莲英和李二棍子')
    print(obj1) #输出结果:['李', '李', '李']
    obj2=re.findall('李.*?','李杰和李莲英和李二棍子')
    print(obj2) #输出结果:['李', '李', '李']
    obj3=re.findall('李.+?','李杰和李莲英和李二棍子')
    print(obj3) #输出结果:['李杰', '李莲', '李二']
    obj3=re.findall('李.{1,2}?','李杰和李莲英和李二棍子')
    print(obj3) #输出结果:['李杰', '李莲', '李二']

    4、字符集[]和[^]

     

    import re
    obj1=re.findall('李.[杰莲英二棍子]*','李杰和李莲英和李二棍子')
    print(obj1) #输出结果:['李杰', '李莲英', '李二棍子']
    obj2=re.findall('李.[^和]*','李杰和李莲英和李二棍子')
    print(obj2) #输出结果:['李杰', '李莲英', '李二棍子'],表示匹配李后面不是和的任意字符
    obj3=re.findall('[d]','456bdha3')
    print(obj3) #输出结果:['4', '5', '6', '3'],表示匹配任意一个数字
    obj3=re.findall('[d]+','456bdha3')
    print(obj3) #输出结果:['456', '3'],表示匹配任意个数字

     5、分组()与或|

     身份证号码是由15位或者18位的字符组成,如果是15位,首位不能是0,其他位数均为数字,如果是18位,则最后一位可能是数字或者X,用正则表达式匹配的两种方式如下:

    正则表达式 结果说明
    ^[1-9]d{14}(d{2}[0-9x])?$
    ()表示分组,将d{2}[0-9x]分成一组,就可以整体约束他们出现的次数为0-1次
    ^([1-9]d{16}[0-9x]|[1-9]d{14})$
    表示先匹配[1-9]d{16}[0-9x]如果没有匹配上就匹配[1-9]d{14}
  • 相关阅读:
    四十四 常用内建模块 struct
    四十三 常用内建模块 base64
    Django Haystack 全文检索与关键词高亮
    python实现简单tftp(基于udp)
    多线程socket UDP收发数据
    Python 线程复习
    python 进程复习
    python pdb 调试
    Linux 复习
    Django 博客
  • 原文地址:https://www.cnblogs.com/mengbin0546/p/8479035.html
Copyright © 2011-2022 走看看