zoukankan      html  css  js  c++  java
  • python爬虫(二十二) 正则表达式匹配多个字符

    一、1、* :匹配0个或者任意多个字符

    text="1234"
    ret=re.match('d*',text)
    print(ret.group())
    >>1234

    2、+:匹配一个或多个字符

    text="abcd"
    ret=re.match('w+',text)
    print(ret.group())
    >>abcd

    3、?:匹配0个或者1个字符

    text="abcd"
    ret=re.match('w?',text)
    print(ret.group())
    >>a

    4、{m}:匹配m个字符

    text="abcd"
    ret=re.match('w{2}',text)
    print(ret.group())
    >>ab

    5、{m,n}:匹配m到n个字符

    text="abcd"
    ret=re.match('w{1,5}',text)  //匹配一个、两个、三个到五个都行
    print(ret.group())
    >>abcd

    二、验证手机号

    text="180123456789"
    ret=re.match('1[34578]d{9}',text)
    print(ret.group())
    >>180123456789

    三、验证邮箱

    text="2605072149@qq.com"
    ret=re.match('w+@[a-z0-9]+.[a-z]+',text)
    print(ret.group())
    >>2605072149@qq.com

    四、验证url

    text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
    ret=re.match('(http|https|ftp)://[^s]+',text)
    print(ret.group())

     五、验证身份证

    text="311111222222111445"
    ret=re.match('d{17}[dxX]',text)
    print(ret.group())

  • 相关阅读:
    L1-046. 整除光棍
    L2-014. 列车调度
    L2-009. 抢红包
    L2-005. 集合相似度
    L2-021. 点赞狂魔
    L1-033. 出生年
    设计模式之生成器模式
    设计模式之抽象工厂模式
    设计模式之工厂方法模式
    设计模式之简单工厂模式
  • 原文地址:https://www.cnblogs.com/zhaoxinhui/p/12468387.html
Copyright © 2011-2022 走看看