写在前面
正则表达式
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、以及这些特定字符的组合,组成一个“规则字符串”,这个规则字符串用来表达对字符串的一种过滤逻辑,在Python用re模块实现。
在线正则表达式工具
元字符
元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来写匹配的规则。
1.常用元字符
| 元字符 | 描述 |
|---|---|
| ^ | 匹配以什么字符开始 |
| $ | 匹配以什么字符结束 |
| . | 匹配任意除换行符" "外的字符 |
| d | 匹配数字 0-9 |
| D | 匹配非数字 |
| s | 匹配任何空白字符 空格 f v |
| S | 匹配除了空白符以外的任一字符 |
| w | 匹配包括下划线在内的任何字字符 |
| W | 匹配非字母字符,即匹配特殊字符 |
2.限定符
| 限定符 | 描述 |
|---|---|
| ? | 匹配前面的字符零次或一次 |
| + | 匹配前面的字符一次或者多次 |
| * | 匹配前面的字符零次或者多次 |
| {n} | 匹配前面的字符n次 |
| {n,} | 匹配前面的字符最少n次 |
| {n,m} | 匹配前面的字符最少n次,最多m次 |
3.排除字符和选择字符
| 字符 | 描述 |
|---|---|
| [ ] | 匹配 [ ] 中的任意一个字符 |
| [ ^ ] | 匹配除了 [ ] 中的任意一个字符 |
| | | 匹配一个或者另一个字符 |
4.转义字符和分组
| 字符 | 描述 |
|---|---|
| 将字符串中含有特殊字符进行转义,使其称为普通字符串的一部分 | |
| () | 改变限定符的作用范围,和进行分组 |
| r或者R | 使 的转义功能失效 |