JavaScript-正则表达式

zoukankan html css js c++ java

JavaScript-正则表达式
匹配规则

1、元字符

点字符（.)

点字符（.）匹配除回车（）、换行() 、行分隔符（u2028）和段分隔符（u2029）以外的所有字符。注意，对于码点大于0xFFFF字符，点字符不能正确匹配，会认为这是两个字符。

注意：只匹配一个字符

位置字符

位置字符用来提示字符所处的位置，主要有两个字符。
- ^ 表示字符串的开始位置
- $ 表示字符串的结束位置
^表示字符串的开头，^d表示必须以数字开头。

$表示字符串的结束，d$表示必须以数字结束。

选择符（|）

竖线符号（|）在正则表达式中表示“或关系”（OR），即cat|dog表示匹配cat或dog。

注意：选择符会包括它前后的多个字符，如果想修改这个行为，可以使用圆括号。

其他的元字符还包括、*、+、?、()、[]、{}等

2、转义符

正则表达式中，需要反斜杠转义的，一共有12个字符：^、.、[、$、(、)、|、*、+、?、{和。需要特别注意的是，如果使用RegExp方法生成正则对象，转义需要使用两个斜杠，因为字符串内部会先转义一次。

3、特殊字符
- cX 表示Ctrl-[X]，其中的X是A-Z之中任一个英文字母，用来匹配控制字符。
- [] 匹配退格键(U+0008)，不要与混淆。
- 匹配换行键。
- 匹配回车键。
- 匹配制表符 tab（U+0009）。
- v 匹配垂直制表符（U+000B）。
- f 匹配换页符（U+000C）。
- 匹配null字符（U+0000）。
- xhh 匹配一个以两位十六进制数（x00-xFF）表示的字符。
- uhhhh 匹配一个以四位十六进制数（u0000-uFFFF）表示的 Unicode 字符。
4、字符类

字符类（class）表示有一系列字符可供选择，只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内，比如[xyz] 表示x、y、z之中任选一个匹配。

有两个字符在字符类中有特殊含义。

（1）脱字符（^）

如果方括号内的第一个字符是[^]，则表示除了字符类之中的字符，其他字符都可以匹配。比如，[^xyz]表示除了x、y、z之外都可以匹配。

如果方括号内没有其他字符，即只有[^]，就表示匹配一切字符，其中包括换行符。

（2）连字符（-）

某些情况下，对于连续序列的字符，连字符（-）用来提供简写形式，表示字符的连续范围。比如，[abc]可以写成[a-c]，[0123456789]可以写成[0-9]，同理[A-Z]表示26个大写字母。

注意：当连字号（dash）不出现在方括号之中，就不具备简写的作用，只代表字面的含义

字符类[1-31]，不代表1到31，只代表1到3

另外，不要过分使用连字符，设定一个很大的范围，否则很可能选中意料之外的字符。最典型的例子就是[A-z]，表面上它是选中从大写的A到小写的z之间52个字母，但是由于在 ASCII 编码之中，大写字母与小写字母之间还有其他字符，结果就会出现意料之外的结果。

5、预定义模式

预定义模式指的是某些常见模式的简写方式。
- d 匹配0-9之间的任一数字，相当于[0-9]。
- D 匹配所有0-9以外的字符，相当于[^0-9]。
- w 匹配任意的字母、数字和下划线，相当于[A-Za-z0-9_]。
- W 除所有字母、数字和下划线以外的字符，相当于[^A-Za-z0-9_]。
- s 匹配空格（包括换行符、制表符、空格符等），相等于[ vf]。
- S 匹配非空格的字符，相当于[^ vf]。
- 匹配词的边界。
- B 匹配非词边界，即在词的内部。
6、重复类

模式的精确匹配次数，使用大括号（{}）表示。{n}表示恰好重复n次，{n,}表示至少重复n次，{n,m}表示重复不少于n次，不多于m次。

7、量词符

量词符用来设定某个模式出现的次数。
- ? 问号表示某个模式出现0次或1次，等同于{0, 1}。
- * 星号表示某个模式出现0次或多次，等同于{0,}。
- + 加号表示某个模式出现1次或多次，等同于{1,}。
8、贪婪模式

上述的三个量词符，默认情况下都是最大可能匹配，即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。

如果想将贪婪模式改为非贪婪模式，可以在量词符后面加一个问号。
- +?：表示某个模式出现1次或多次，匹配时采用非贪婪模式。
- *?：表示某个模式出现0次或多次，匹配时采用非贪婪模式。
- ??：表格某个模式出现0次或1次，匹配时采用非贪婪模式。
9、修饰符

修饰符（modifier）表示模式的附加规则，放在正则模式的最尾部。

g 修饰符

默认情况下，第一次匹配成功后，正则对象就停止向下匹配了。g修饰符表示全局匹配（global），加上它以后，正则对象将匹配全部符合条件的结果，主要用于搜索和替换。

i 修饰符

默认情况下，正则对象区分字母的大小写，加上i修饰符以后表示忽略大小写（ignoreCase）。

m修饰符

m修饰符表示多行模式（multiline），会修改^和$的行为。默认情况下（即不加m修饰符时），^和$匹配字符串的开始处和结尾处，加上m修饰符以后，^和$还会匹配行首和行尾，即^和$会识别换行符（）。

注意：加上m修饰符以后，换行符也会被认为是一行的开始。
/^b/m.test('a b') // true
10、组匹配

正则表达式的括号表示分组匹配，括号中的模式可以用来匹配分组的内容。

参考资料：

https://wangdoc.com/javascript/stdlib/regexp.html

https://www.liaoxuefeng.com/wiki/897692888725344/923056128128864
查看全文

相关阅读:
BZOJ1930 [Shoi2003]pacman 吃豆豆
 hdu5322 Hope
hdu5390 tree
hdu4609 3-idiots
hdu5354 Bipartite Graph
hdu4918 Query on the subtree
hdu5314 Happy King
[题解] PowerOJ 1741 最长递增子序列问题 (最大流)
[题解] PowerOJ 1740 圆桌问题 (最大流)
[题解] PowerOJ 1739 魔术球问题 (最大流)

原文地址：https://www.cnblogs.com/songsongblue/p/11765559.html

JavaScript-正则表达式

匹配规则

1、元字符

点字符（.)

位置字符

选择符（|）

2、转义符

3、特殊字符

4、字符类

5、预定义模式

6、重复类

7、量词符

8、贪婪模式

9、修饰符

g 修饰符

i 修饰符

m修饰符

10、组匹配

选择符（`|`）