摘要:这篇博客不推荐看。。。
--正则表达式
元字符:
1、. :匹配换行符之外的任意单个字符
2、[ ] :匹配括号中的任何一个字符
3、 | :将两个匹配条件进行逻辑“或运算”
4、$ :匹配行结束符
5、 d :代表一个数字,等同于 [0-9]
6、 D :代表非数字 ,等同于 [^0-9]
7、 s :代表换行符、Tab制表符等空白字符
8、 S :代表非空白字符
9、 w :匹配字母或数字或下划线或汉字,不能匹配特殊符号
10、W : 非w
限定符:限定元字符出现的次数
1、 * :匹配0个至多个在它之前的子表达式 {0,}
2、 + :匹配前面的子表达式一次或多次 和*对比-->至少一次 {1,}
3、 ? :匹配前面的子表达式零次或一次 {0,1}
4、 {n} :匹配确定的 n次
5、 {n,} :至少匹配n次
6、 {n,m}:最少匹配n次且最多匹配m次
//运用 //获取网页中的内容 WebClient web = new WebClient(); byte[] buffer = web.DownloadData("网页.html"); //将保留下的内容装换为字符串 string content = Encoding.UTF8.GetString(buffer); //读取成功 string regex = @"[a-zA-Z0-9_]+@[0-9a-zA-Z]+(.[a-zA-Z]+){1,3}"; //匹配邮箱的正则表达式 642525840@qq.con 或者 642525840@qq.com.cn //匹配成功的集合 MatchCollection mc = Regex.Matches(content, regex); //matches集合 match 单个 foreach (Match item in mc) { if (item.Success) { Console.WriteLine(item.Value); } }