元字符大概可以分为2类:
(1)用来匹配文本的
(2)正则表达式的语法所要求的。
空白元字符
元字符
|
说明
|
[]
|
回退(并删除)一个字符(Backspace键)
|
f
|
换页符
|
|
换行符
|
|
回车符
|
|
制表符(Tab键)
|
v
|
垂直制表符
|
Windows所使用的文本行结束标签
。一般使用两个
匹配两条记录之间的空白行
Linux/Unix系统上匹配空白行只使用
即可
同时适用Windows和Linux/Unix的正则表达式:[
]?[
]?[
]
数字元字符
元字符
|
说明
|
d
|
任何一个数字字符(等价于[0-9])
|
D
|
任何一个非数字字符(等价于[^0-9])
|
字母数字元字符
元字符
|
说明
|
w
|
任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
|
W
|
任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])
|
空白字符元字符
元字符
|
说明
|
s
|
任何一个空白字符(等价于[f
v])
|
S
|
任何一个非空白字符(等价于[^f
v])
|
在正则表达式里,十六进制数值要用前缀x给出。如x0A
在正则表达式里,八进制数值要用前缀 给出。如 11
使用POSIX字符类:
使用POSIX字符类的模式以[[开头,以]]结尾。POSIX字符类必须扩在[:和:]之间。如[:xdigit:]
用来进行大小写转化的元字符
元字符
|
说明
|
E
|
结束L或U转换
|
l
|
把下一个字符转化为小写
|
L
|
把L到E之间的字符全部转换为小写
|
u
|
把下一个字符转换为大写
|
U
|
把U到E之间的字符全部转换为大写
|