正则表达式:
简单来说,正则表达式就是一套处理字符串的规则和方法,以行为单位对字符串进行处理,通过特殊的符号辅助,快速过滤,替换某些特定的字符串。
在工作中,通过正则表达式,可以快速处理大量访问日志,错误日志,大数据等
正则表达式搭配awk,sed和grep命令,是处理字符串的强大工具。
基础正则表达式:BRE
正则表达式实际就是一些特殊字符,赋予了他特定的含义。
1 ^word 匹配word开头的字符串
2 word$ 匹配word结尾的
3 . 代表任意单个字符
4 * 重复0个或多个前面的单个字符
5 .* 匹配任意字符
6 转义符,屏蔽有特殊意义字符的额外含义,还原其本身
7 [word] 匹配里面字符的析取
8 [^word] 匹配里面字符合取的非
9 {n,m} 重复前面单个字符n到m次
{n,} 重复前面单个字符至少n次
{,m} 重复前面单个字符至多m次
扩展的正则表达式:ERE
1 + 重复一个或一个以上前面单个字符
2 ? 重复前面单个字符0次或一次
3 | 查找多个字符串的析取
4 () 找出子串