zoukankan      html  css  js  c++  java
  • re模块的基本用法

    findall:返回每一个匹配的标的,放在一个列表里

    ret = re.findall('i','aike listen to me')
    print(ret)
    
    #打印:
    ['i', 'i']

    search:返回第一个匹配到的匹配信息,需要调用group方法才能将标的打印,若没有匹配到,返回None

    ret = re.search('i','aike listen to me')
    print(ret)
    print(ret.group())
    
    #打印:
    <re.Match object; span=(1, 2), match='i'>
    i
    
    一般使用方法为:
    ret = re.search('i','aike listen to me')
    if ret:
        print(ret.group())

    match:以什么为开头,返回匹配标的的匹配信息,需要调用group方法才能将标的打印出来,若没有匹配,则返回None

    ret = re.match('ai','aike listen to me')
    print(ret.group())
    
    #打印:
    ai

    split:切割

    ret = re.split('[ab]', 'abcd')   # 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割
    print(ret)  # ['', '', 'cd']
    
    
    ret = re.split('(ab)', 'abcd') #优先级的原因,加上括号会保留需要切割的内容
    print(ret)  #['', 'ab', 'cd']

    sub:更换符合匹配规则的标的,可以设置更换次数,默认全部更换

    ret = re.sub('i','1','aike listen to me',1)
    print(ret)
    
    #打印:
    a1ke listen to me

    subn:更换符合匹配规则的标的,可以设置更换次数,默认全部更换。返回一个元祖(更换后的结果,更换次数)

    ret = re.subn('i','1','aike listen to me')
    print(ret)
    
    #打印:
    ('a1ke l1sten to me', 2)

    compile:编译字符串类型的正则表达式

    job = re.compile('d{4}') #将正则表达式编译成一个正则表达式对象,规则匹配的是4个连续的数字
    ret = job.search('1121aaa12ak4543as6adas1111aa1524a') #正则表达式对象调用search方法,参数为待匹配的字符串
    print(ret.group()) #1121

    finditer:返回一个存放匹配结果的迭代器

    ret = re.finditer('d{4}','1121aaa12ak4543as6adas1111aa1524a')
    print(ret.__next__().group())
    print(ret.__next__().group())
    for i in ret:
        print(i.group())
    
    #打印:
    1121
    4543
    1111
    1524

    findall的优先级:

    ret = re.findall('name(aike)','nameaikename') #findall会先把优先组里匹配到的标的返回
    print(ret)
    
    ret = re.findall('name(?:aike)','nameaikename')#想要获取全部的匹配结果,取消权限方式是在优先组里面加'?:'
    print(ret)
    
    #打印:
    ['aike']
    ['nameaike']

    split的优先级:

    ret = re.split('(d)','hello1ai2ke')
    print(ret)#加上括号,会保留匹配的标的
    
    ret = re.split('d','hello1ai2ke')
    print(ret)#正常情况下不会保留
    
    #打印:
    ['hello', '1', 'ai', '2', 'ke']
    ['hello', 'ai', 'ke']
  • 相关阅读:
    linux-指令
    rabbitmq启动
    [浪峰前端开发]JS获取当前时间戳的方法
    [浪峰JQuery开发]jquery最有意思的IFrame类似应用--值得深入研究
    [浪峰分享]移动电商:不是渠道拓展,而是一次重新创业
    [浪峰分享]App必死 Web永生 看Web的前世今生 必会卷土重来
    [浪峰分享]推荐一些不错的计算机书籍
    [浪峰转载]Jquery取得iframe中元素的几种方法
    [浪峰分享] 如何管理一个远程团队
    [浪峰分享] 博客园博客导航固顶--简单实用的css代码
  • 原文地址:https://www.cnblogs.com/aizhinong/p/11420649.html
Copyright © 2011-2022 走看看