zoukankan      html  css  js  c++  java
  • Learning Python 008 正则表达式-001

    Python 正则表达式 总结

    这节课讲讲正真使用的技术 — 正真表达式。

    文本爬虫

    什么是正则表达式

    正则表达式这个名词听起来就有一种很官方的感觉,但是它是一个很很很有用的技术。我用语言是不能形容它的。那举个例子好了。下面是一段加密的文本:

    sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxoosjdlsjl

    如果你知道上面这段文本的解密规律,就可以知道上面这段文本的真正内容。
    * 解密规律:ooxx 真正的内容 xxoo
    * 解密:I am Aobo Sir

    所以,就算你知道了解密规律,你也需要花一定时间去找,这种事情是可以交个程序去做的,正则表达式做的就是这样的事情。


    简单的看看下面的列表

    常用符号:*.?(

    符号 说明
    . 匹配任意字符, (换行符)除外
    * 匹配前一个字符0次或无限次
    ? 匹配前一个字符0次或1次
    .* 贪心算法。(获取所有符合需求的信息)
    .*? 非贪心算法
    () 括号内的数据作为结果返回

    常见方法:findall()search()sub()

    方法 说明
    findall() 匹配所有符合规律的内容,返回包含结果的列表
    search() 匹配并提取第一个符合规律的内容,返回一个正则表达式对象(object)
    sub() 替换符合规律的内容,返回替换的值

    请见下一讲:Learning Python008 正则表达式 - 002


    参考网站:
    http://www.jikexueyuan.com/course/777_2.html?ss=1

  • 相关阅读:
    ES6入门 阮一峰
    NPM
    移动端BUG
    配置每次git push 不需要输入账号密码
    移动端rem布局,用户调整手机字体大小或浏览器字体大小后导致页面布局出错问题
    课程表
    岛屿数量
    二叉树的右视图
    c++设计模式——工厂模式
    克隆图
  • 原文地址:https://www.cnblogs.com/aobosir/p/5928644.html
Copyright © 2011-2022 走看看