一 javascript正则表达式的基本知识
1 javascript 正则对象创建 和用法
声明javascript 正则表达式
var reCat = new RegExp("cat");
你也可以
var reCat = /cat/; //Perl 风格 (推荐)
2 学习最常用的 test exec match search replace split 6个方法
1) test 检查指定的字符串是否存在
var data = "123123";
var reCat = /123/gi;
alert(reCat.test(data)); //true
//检查字符是否存在 g 继续往下走 i 不区分大小写
2) exec 返回查询值
var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";
var reCat = /cat/i;
alert(reCat.exec(data)); //Cat
3)match 得到查询数组
var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";
var reCat = /cat/gi;
var arrMactches = data.match(reCat)
for (var i=0;i < arrMactches.length ; i++)
{
alert(arrMactches[i]); //Cat cat
}
4) search 返回搜索位置 类似于indexof
var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";
var reCat = /cat/gi;
alert(data.search(reCat)); //23
5) replace 替换字符 利用正则替换
var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";
var reCat = /cat/gi;
alert(data.replace(reCat,"libinqq"));
6)split 利用正则分割数组
var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";
var reCat = /\,/;
var arrdata = data.split(reCat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]);
}
3 学习下 简单类 负向类 范围类 组合类
//简单类
var data = "1libinqq,2libinqq,3libinqq,4libinqq";
var reCat = /[123]libinqq/gi;
var arrdata = data.match(reCat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // 1libinqq 2libinqq 3libinqq
}
//负向类
var data = "alibinqq,1libinqq,2libinqq,3libinqq,4libinqq"; //u0062cf
var reCat = /[^a123]libinqq/gi;
var arrdata = data.match(reCat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); //4libinqq
}
//范围类
var data = "libinqq1,libinqq2,libinqq3,libinqq4,libinqq5"; //u0062cf
var reCat = /libinqq[2-3]/gi;
var arrdata = data.match(reCat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // libinqq2 libinqq3
}
//组合类
var data = "a,b,c,w,1,2,3,5"; //u0062cf
var reCat = /[a-q1-4 ]/gi;
var arrdata = data.match(reCat);
for (var i = 0; i < arrdata.length; i++)
{
alert(arrdata[i]); // a b c 1 2 3
}
二 javascript 正则表达式是分组知识
1 简单分组
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 简单的分组 4 举例 我们要查找字符串 MouseMouse 5 6 var reCat = /MouseMouse/gi; 7 8 尽管这是可以的,但是有点浪费。如果不知道Mouse 在字符串中到底出现几次时该怎么办,如果重复多次呢。 9 var reCat = /(mouse){2}/gi; 括号的意思列Mouse 将在一行连续出现2次。 10 11 */ 12 13 var data = "Ah-mousemouse"; 14 var reCat = /(mouse){2}/gi; 15 var arrdata = data.match(reCat); 16 17 for (var i = 0; i < arrdata.length; i++) 18 { 19 alert(arrdata[i]); 20 } 21 22 23 //--> 24 </script>
2 复杂分组
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 复杂的分组 4 ? 零次 或 一次 5 * 零次 或 多次 6 + 最少一次 或 多次 7 */ 8 9 var data = "bb ba da bad dad aa "; 10 var reCat = /([bd]ad?)/gi; // 匹配出 ba da bad dad 11 var arrdata = data.match(reCat); 12 13 for (var i = 0; i < arrdata.length; i++) 14 { 15 alert(arrdata[i]); 16 } 17 18 19 // 同时 也不介意将分组放在分组中间 20 // var re = /(mom( and dad)?)/; 匹配出 mom 或 mon and daa 21 //--> 22 </script>
3 反向引用
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 反向引用*/ 4 5 var sToMatch = "#123456789"; 6 var reNumbers = /#(d+)/; 7 reNumbers.test(sToMatch); 8 alert(RegExp.$1); 9 10 /* 11 这个例子尝试匹配后面跟着几个或多个数字的镑符合,并对数字进行分组 12 以存储他们。在调用 test 方法后,所有的反向引用都保存到了 RegExp 构造函数中 13 从 RegExp.$1(它保存了第一个反向引用)开始,如果还有第二个反向引用,就是 14 RegExp.$2,如果还有第三个反向引用存在,就是 RegExp.$3.依此类推。因为该组 15 匹配了 “123456780”,所以 RegExp.$1 中就存储了这个字符串。 16 17 */ 18 19 20 var sToChange = "1234 5678"; 21 var reMatch = /(d{4}) (d{4})/; 22 var sNew = sToChange.replace(reMatch,"$2 $1"); 23 alert(sNew); 24 25 /* 26 在这个例子中,正则表达式有两个分组,每一个分组有四个数字。在 replace() 方法的第二个参数 27 中,$2 等同于 “5678” ,而 $1 等同于 “1234”,对应于它们在表达式中的出现顺序。 28 */ 29 30 //--> 31 </script>
4 候选
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 候选 */ 4 var sToMatch1 = "red"; 5 var sToMatch2 = "black"; 6 var reRed = /red/; 7 var reBlack = /black/; 8 9 alert(reRed.test(sToMatch1) || reBlack.test(sToMatch1)); 10 alert(reRed.test(sToMatch2) || reBlack.test(sToMatch2)); 11 12 /* 13 这虽然能完成任务,但是十分沉长,还有另一种方式就是正则表达式的候选操作符。 14 */ 15 16 var sToMatch1 = "red"; 17 var sToMatch2 = "black"; 18 var reRedOrBlack = /(red|black)/; 19 alert(reRedOrBlack.test(sToMatch1)); 20 alert(reRedOrBlack.test(sToMatch2)); 21 22 //--> 23 </script>
5 非捕获性分组
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 非捕获性分组 4 5 如果要创建一个非捕获性分组,只要在左括号的后面加上一个问号和一个紧跟的冒号: 6 */ 7 8 var sToMatch = "#123456789"; 9 var reNumbers = /#(?:d+)/; 10 reNumbers.test(sToMatch); 11 alert(RegExp.$1); 12 13 /* 14 这个例子的最后一行代码输出一个空字符串,因为该组是非捕获性的, 15 */ 16 17 var sToMatch = "#123456789"; 18 var reNumbers = /#(?:d+)/; 19 alert(sToMatch.replace(reNumbers,"abcd$1")); 20 21 /* 22 正因如此,replace()方法就不能通过 RegExp.$x 变量来使用任何反向引用,这段代码 23 输出的“abcd$1”而不是abcd123456789, 因为$1 在这里并不被看成是一个反向引用。 24 */ 25 //--> 26 </script>
6 前瞻
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 前瞻 4 前瞻 就和它名字一样,它告诉正则表达式运算器向前看一些字符而不是移动位置 5 */ 6 7 8 var sToMatch1 = "bedroom"; 9 var sToMatch2 = "bedding"; 10 var reBed = /bed(?=room)/; 11 alert(reBed.test(sToMatch1)); //true 12 alert(reBed.test(sToMatch2)); //false 13 14 //负向前瞻 15 16 var sToMatch1 = "bedroom"; 17 var sToMatch2 = "bedding"; 18 var reBed = /bed(?!room)/; 19 alert(reBed.test(sToMatch1)); //false 20 alert(reBed.test(sToMatch2)); //true 21 //--> 22 </script>
7 边界
1 <script language="JavaScript"> 2 <!-- 3 /*正则表达式 边界 4 ^ 行开头 5 $ 行结尾 6 单词的边界 7 B 非单词的边界 8 */ 9 10 var sToMatch = "Important word is the last one."; 11 var reLastWord = /(w+).$/; 12 reLastWord.test(sToMatch); 13 alert(RegExp.$1); //one 14 15 /* 16 假如想查找一个单词,但要它只出现在行尾,则可以使用美元符号 ($)来表示它: 17 */ 18 19 20 21 var sToMatch = "Important word is the last one."; 22 var reLastWord = /^(w+)/; 23 reLastWord.test(sToMatch); 24 alert(RegExp.$1); //Important 25 26 /* 27 在这个例子中,正则表达式查找行起始位置后的一个或多个单词字符。如果遇到非单词字符 28 匹配停止,返回 Important。 这个例子也可以用单词边界实现。 29 */ 30 31 var sToMatch = "Important word is the last one."; 32 var reLastWord = /^(.+?)/; 33 reLastWord.test(sToMatch); 34 alert(RegExp.$1); //Important 35 36 /* 37 这里,正则表达式用惰性量词来制定在单词边界之前可以出现任何字符,且可以出现一次或 38 多次(如果使用贪婪性量词,表达式就匹配整个字符串)。 39 */ 40 41 var data = " First second thind fourth fifth sixth "; 42 var reCat = /(S+?)/g; 43 var arrdata = data.match(reCat); 44 45 for (var i = 0; i < arrdata.length; i++) 46 { 47 alert(arrdata[i]); 48 } 49 50 /* 51 使用单词边界可以方便地从字符串中抽取单词。 52 */ 53 //--> 54 </script>
8 多行模式
<script language="JavaScript"> <!-- /*正则表达式 多行模式 要制定多行模式,只要在正则表达式想要匹配的行末的一个单词 */ var data = " First second thind fourth fifth sixth"; var reCat = /(w+)$/g; var arrdata = data.match(reCat); for (var i = 0; i < arrdata.length; i++) { alert(arrdata[i]); } /* 上面只返回一个单词 sixth,因为换行符阻挡了匹配,只能匹配行末的一个单词, 当然也可以使用 split() 方法将字符串分割成数组,但就得对每一行进行单独匹配。 以前不好好看书经常半吊子,看一半就仍了,导致用了好多 split, 其实很简单如下面 例子 只需要 m 参数进行多行匹配。 */ var data = " First second thind fourth fifth sixth"; var reCat = /(w+)$/gm; var arrdata = data.match(reCat); for (var i = 0; i < arrdata.length; i++) { alert(arrdata[i]); } //--> </script>