zoukankan      html  css  js  c++  java
  • 正则表达式用于数据清洗

    在平时调试过程中,有时候需要打印很多高频log,通过正则表达式可以很轻易的匹配出需要的信息。

    常用语法:

    [ABC] 匹配 [...] 中的所有字符
    [^ABC] 匹配除了 [...] 中字符的所有字符
    [A-Z] [A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母
    . 匹配除换行符( 、 )之外的任何单个字符,相等于 [^ ]
    [sS] 匹配所有。s 是匹配所有空白符,包括换行,S 非空白符,包括换行
    w 匹配字母、数字、下划线。等价于 [A-Za-z0-9_]
    匹配一个换行符。等价于 x0a 和 cJ
    匹配一个回车符。等价于 x0d 和 cM
    转义
    $ 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *
    + 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +
    ^ 匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合
    ? 匹配前面的子表达式零次或一次
    * 匹配前面的子表达式零次或多次

     

    举例:

    匹配以error开头的整行字符串

    ^error.*$

    匹配以error结尾的整行字符串

    ^.*error$

    如下匹配任意含error的整行

    ^.*error.*$

     

     

  • 相关阅读:
    K-邻近算法
    算法
    (12)ubunto 快捷键
    (38)C#IIS
    RichEditControl(富文本控件)
    Gaugecontrol(测量仪器图形控件)
    鏖战字符串
    bzoj3713 [PA2014]Iloczyn|暴力(模拟)
    约会安排HDU
    hdu4614 线段树+二分 插花
  • 原文地址:https://www.cnblogs.com/didada/p/13589051.html
Copyright © 2011-2022 走看看