定义:一些用来匹配和处理文本的字符串
主要用途:搜索,替换
1. 匹配单个字符
.字符(英文符号)可以匹配任何一个单一的字符、字母、数字、甚至是.本身。但是在绝大多数的正则表达式实现里,不能匹配换行符
.意思是匹配.本身,而不是任意字符
2. 匹配一组字符
这个主要通过字符集的方式来实现。用[]来定义一个字符集. [a-z], [A-Z], [0-9]
取非匹配:^, [^0-9], ^的效果作用于给定字符集合中的所有字符或字符区间,而不仅限于在^字符后面的那一个字符或字符区间
3. 元字符
元字符要匹配本身的话,需要用来进行转义
空白元字符:
[] 回退(并删除)一个字符(backspace键)
f 换页符
换行符
回车符
制表符(Tab键)
v 垂直制表符
s 任何一个空白字符,等价于[f
v]
S 任何一个非空白字符,等价于[^f
v] 注意:[]不包含在内
数字元字符:
d 任何一个数字字符,等价于[0-9]
D 任何一个非数字字符,等价于[^0-9]
字母数字元字符:
w 任何一个字母数字字符(大小写均可)或下划线字符,等价于[a-zA-Z0-9_]
W 任何一个非字母数字或下划线字符,等价于[^a-zA-Z0-9_]
16进制:x0a == ,ascii字符10
8进制: