zoukankan      html  css  js  c++  java
  • python re 模块小结

    前言:

    本人环境windows 7 64位,python2.7

     

    re是什么:

    regular expression缩写,意为正则表达式,是python的众多模块之一

     

    re用途:

    从文本中有选择的批量抽取想要的文本碎片

     

    re类型:

    分为DFA(确定的有穷状态自动机)NFA(非确定的有穷状态自动机)

     

    re的安装:

    打开DOSCDpip目录下;输入命令pip install re

     

    re常用方法:

    1.re.compile(pattern, flags=0)

      patternstr类型的,例:pattern  = r‘^.*?$’

    2.re.findall(pattern, string, flags=0)

      Return a list of all non-overlapping matches in the string.返回字符串中所有非重叠匹 配的列表。

      例1print re.findall(r’(s)(d)’, ‘gsd sd fsa ggh sd hf sdgf ’)

      结果:[('s', 'd'), ('s', 'd'), ('s', 'd'), ('s', 'd')]

      例2print re.findall(r'(s)d','gsd sd fsa ggh sd hf sdgf')

      结果:['s', 's', 's', 's']

      例3print re.findall(r'sd','gsd sd fsa ggh sd hf sdgf')

      结果:['sd', 'sd', 'sd', 'sd']

      用途:抽取网页源代码中的链接等

    3.re.split(pattern, string, maxsplit=0, flags=0)

        Split the source string by the occurrences of the pattern,

        returning a list containing the resulting substrings.返回list

      例:print re.split(r's','jsjkjoishioshuisguusnjshbsg')

      结果:['j', 'jkjoi', 'hio', 'hui', 'guu', 'nj', 'hb', 'g']

      用途:将大段文本分成易于处理的小片段

    4.re.match(pattern, string, flags=0)

        Try to apply the pattern at the start of the string, returning

        a match object, or None if no match was found.返回的object类似指针

    5.re.search(pattern, string, flags=0)

        Scan through string looking for a match to the pattern, returning

        a match object, or None if no match was found.返回的object类似指针

     

     

    参考资料:IDLEhelp命令;

    后记:如有错漏,欢迎指正,有时间就更新

    本文是博主原创,转载请注明出处,并@我心飞翔2015,谢谢合作!

  • 相关阅读:
    Luogu P1962 斐波那契数列
    Luogu P2370 yyy2015c01的U盘
    Luogu P2678跳石头
    POJ3111 K Best
    表单内容相关操作
    框架集与框架.
    spring aop的使用
    sql查询的优化(六)
    mysql数据库视图(五)
    mysql数据库索引(四)
  • 原文地址:https://www.cnblogs.com/woxinfeixiang2015/p/woxinfeixiang2015.html
Copyright © 2011-2022 走看看