zoukankan      html  css  js  c++  java
  • Pyhton入门 笔记 第三天 正则表达式与JSON

    一,判断字符中是否包含指定的单词

    a='C|C++|Json|Java|C#|Python|javascript'

    print('Python' in a) #方式一

    print(a.index('Pyghon')>-1) #方式二

    re.findall('Python',a)  #方式三,前提要先引入 import re

    二,提取字符中的数字

    import re   #引入re模块

    a='C0C++2C#3java8Python7javascirpt'

    r=re.findall('d',a)   #d在正则中代表数字.

    print(r)

    注,同上实例,一例中'Python'为普通字符,二例中'd'为元字符。

    三,在字符中找到多个指定的单词

    import re

    a='abc,acc,adc,afc,aec,agc,ahc'   #在此字符中找出acc,afc

    r=re.findall('a[cf]c',a) #普通字符a和c做为定界字符,c和f为元字符。此例中如果^a[cf]c作为正则,表示在字符a中找出除去acc 和afc的所有单词。再如果c到f为顺序的字符可写为[c-f]。

    print(r)

    四,概括字符集

    import re   #引入re模块

    a='C0C++2C#3java8Python7javascirpt'

    r=re.findall('d',a)   #d在正则中代表数字.

    print(r)

    注,此例与例二同,但也可以使用例三的方式来打印出来

    r=re.findall('[0-9]',a)  #如果想要打印出非数字的集合为:r=re.findall('[^0-9]',a)

    print(r)

    五,匹配所有数字和字母

    import re

    a='C0C++2C#3java8Python7javascirpt*&%$'

    r=re.findall('w',a)   #'w'只能匹配也有数字和字母,但特殊字符#*$&%等是不可以匹配到的。如果用字符集来表示'w'可以用'[A-Za-z0-9_]'表示.注下划线'_'是可以匹配到的。

    print(r)

    六,匹配特殊字符

    import re

    a='C0C++2C#3java8Python7javascirpt*&%$'

    r=re.findall('W',a)  #与例五不同,这里匹配特殊字符是使用大写的'W'来表示。

    print(r)

    注,'W'也可以匹配出空白字符集,如回车,换行等.

    七,匹配空白字符集

    import re

    a='C0C++2C#3java8Python7javascirpt*&%$'

    r=re.findall('s',a) 

    print(r)

    注,此处's'并没有匹配出特殊字符%&等,只匹配空白字符,回车换行等。

    附加案例   # '.'点号匹配除换行符 之外的其他所有字符

    八,数量词(匹配一串字符中不同位数组成的单词)

    import re

    a='C0C++2C#3java8Python7javascirpt*&%$'    #注,字符集a中,能组成单词的有C,java,Python,javascirpt,但单词的位数不同

    r=re.findall('[a-zA-Z]{1,9}',a)    #注,'[a-zA-Z]'为能组合的字母集,{1,9}为能组成单词的位数,从1到9。

    print(r)

    结果为C java Python javascript

    注,数量词的匹配在Python中存在贪婪与非贪婪两种模式,本例'[a-z]{1,9}'为贪婪模式,在匹配过程中先以能通过的字母的最大数原则,如果是非贪婪模式‘[a-z]{3,9}?’注后有?号,输出的结果中,C是不会被输出的,而且java也会被分开打印,只打印出jav,而最后的a是不会被打印出的。只匹配三位,而且后面的就算有字母,但不够三位,也不会被打印出。

    九,数量词匹配的限制

    9.1)*星号匹配0次或者无限多次

    import re

    a='pytho0python1pythonn2'

    r=re.findall('python*',a)   #'*'星号为匹配0次或者无限多次,以n匹配python。虽然第一个没有n,也可以表示为0次.

    print(r)

    结果为:pytho  python pythonn

    9.2)+加号匹配一次或者无限多次

    import re

    a='pytho0python1pythonn2'

    r=re.findall('python+',a)   # +加号表示以n结束匹配python出现一次或者无限多次

    print(r)

    结果为: python pythonn

    9.3) ?问号匹配0次或者一次

    import re

    a='pytho0python1pythonn2'

    r=re.findall('python?',a)     # ?问号表示以n匹配python出现0次或者一次

    print(r)

    结果为:pytho  python python

    注,本例是的?号与上例的非贪婪不同,上例有{1,9}的限位。

    9.4)指定数次匹配

    import re

    a='pytho0python1pythonn2'

    r=re.findall('python{2}',a)      #指定2次

    print(r)

    结果为: pythonn

    十,边界匹配

    import re

    qq= 10000001

    r=re.findall('^000$',qq)    #^号表示字符串必须以000为开始,$号表示字符串必须以000为结尾。

    print(r) 

    结果为[]空

    十一,组匹配 (以组的形式为匹配)

    import re

    a='pyhtonpythonpythonpythonpython

    r=re.findall('(python){3}',a)      #注在例9.4中,pyhton没有加()括号,表示以n为结束匹配,本例加()括号表示以python为结束来匹配,

    print(r)

    结果为:pyhton

     注,正则内()括号为且的关系,[]中括号为或的关系.

    十二,正则的第三个参数    模式

    import re

    lanuage='PyhthonC#JavaScript'

    r=re.findall('c#',lanuage,re.I)  #正则表达式的第三个参数称为模式如:re.I(忽略大小写),当多个模式一齐存在时用'|'竖线连接如:re.I|re.s    re.s为改为.点号的规则(七案例下,附加案例)

    print(r)

  • 相关阅读:
    django-templates 模板变量
    实用代码
    游戏渠道后台上线
    游戏投放中的-LTV概念与价值
    转字符串格式format技巧
    mysql -数据库设计三范式
    OAuth2.0基本原理及应用
    回调函数
    GitHub 博客园快捷发布工具
    前端react antd加载错误解决
  • 原文地址:https://www.cnblogs.com/tngh/p/9315298.html
Copyright © 2011-2022 走看看