正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它 用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
目的:
- 字符串匹配(字符匹配)
- 字符串查找
- 字符串替换
- 字符串分割
例如:
- 从网页中揪出email地址
- IP地址是否正确
- 从网页中揪出链接
特殊字符:
限定符(数量词)
预定义字符类