zoukankan      html  css  js  c++  java
  • python中的re模块

    正则表达式有很多很多,我在这边只列出比较常用的表达式,几乎涵盖了90%的正则表达式的使用场所,正则表达式一般式在python爬虫中使用的比较广泛。

    常用正则式表达式符号如下所示:

    '.'     默认匹配除
    之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
    '^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","
    abc
    eee",flags=re.MULTILINE)
    '$'     匹配字符结尾,或e.search("foo$","bfoo
    sdfsf",flags=re.MULTILINE).group()也可以
    '*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
    '+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
    '?'     匹配前一个字符1次或0次
    '{m}'   匹配前一个字符m次
    '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
    '|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
    '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
     
     
    'A'    只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的
    ''    匹配字符结尾,同$
    'd'    匹配数字0-9
    'D'    匹配非数字
    'w'    匹配[A-Za-z0-9]
    'W'    匹配非[A-Za-z0-9]
    's'     匹配空白字符、	、
    、
     , re.search("s+","ab	c1
    3").group() 结果 '	'
     
    '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
    
    

    我在这边介绍了五种正则表达式中的方法,分别是match(从字符串开始处匹配)、search(从字符串中搜索)、findall(匹配所有的要求匹配的字符串)、split(分割)、sub(替换)

    下面是我列举的几个比较常用的正则表达式的实例:

    1.在后面的字符串中匹配到的是‘Yan’
    在这里插入图片描述

    2.主要介绍的是group()的用法
    在这里插入图片描述

    3. d可以匹配到后面的数字YanFeixud匹配的是在YanFeixu后面含有一个数字的字符串
    在这里插入图片描述
    4. d+是匹配到多个数字
    在这里插入图片描述
    5. 这边介绍的是findall方法;
    在这里插入图片描述
    6.这边介绍的是search方法:
    在这里插入图片描述
    7.分组匹配(也就是匹配多个内容):可以用下身份证中
    在这里插入图片描述
    8.这边介绍的是split的用法:
    在这里插入图片描述
    在这里插入图片描述
    9.最后介绍最后一个正则表达式的方法sub:
    在这里插入图片描述

    总而言之,正则表达式其实不是很难,也比较容易理解,平时多回忆一下,就能记住的,是在不会的话就Google!

    本人目前在学习python、前端、数据库和linux相关的内容,故打算写一些学习笔记,包括安装软件遇到的一些问题、编程语言的学习。 学习如逆水行舟,你在原地踏步的同时,别人一直在前进!
  • 相关阅读:
    (转)Unity3D 开发优秀技术资源汇总
    (转)Unity3d通过Action注册事件,回调方法
    (转)Unity3D研究院之游戏架构脚本该如何来写(三十九)
    (转)Unity3D研究院之异步加载游戏场景与异步加载游戏资源进度条(三十一)
    Unity3D的主要类图
    C# 事件和Unity3D
    unity3d 场景配置文件生成代码
    497. Random Point in Non-overlapping Rectangles
    478. Generate Random Point in a Circle
    470. Implement Rand10() Using Rand7() (拒绝采样Reject Sampling)
  • 原文地址:https://www.cnblogs.com/souhaite/p/10585606.html
Copyright © 2011-2022 走看看