1.简介
正则表达式是对字符串进行匹配的语法,像name like '%张%'一样,定义了一些特殊的“元字符”,用来判断一个字符串是否满足某个规则。正则表达式非常深,编译器都是基于正则表达式,掌握基本使用即可。
2.基本元字符:
- .表示除了 以外的任意的单个字符
- [0-9]表示的是0到9之间任何一个整数数字;[a-z]任意一个小写字母,[A-Z]任意一个大写字母
- d数字,D非数字,s空白,S非空白,w小写字母和数字和汉字,W特殊符号。正则表达式中的是真的。
- 表示对于.等特殊字符转义
- ()提升优先级别和提取组
- []代表一个区间中的任意一个[abcd]就代表abc或者数字中的任意一个字符
- | 或者
- +是出现1次到无限次
- *是出现0次到无限次
- ?是出现0次到1次
- {5}出现5次,{1,2}一次或两次,{5,8}为5至8次,{1,}最少一次,{3,}最少3次
- ^以…开始,$以…结束
3.使用Regex.IsMatch(被匹配字符串, 正则表达式)判断是否匹配。C#中表示正则表达式最好前面加上@,可以避免转义带来的困扰。
4.常用
- 这样写是有缺陷的Regex.IsMatch("18911111234", @"d{11}")、Regex.IsMatch("3333333333333333", @"d{11}"),应该使用^$改成Regex.IsMatch("18911111234333", @"^d{11}$")
- 手机号:@"^1d{10}$"
- @"^d{5,10}$"匹配QQ号
- ipv4地址:@"^d{1,3}.d{1,3}.d{1,3}.d{1,3}$" 正则表达式很难“一步到位”。192.168.1.15
- @"^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$" 匹配邮箱
- [u4e00-u9fa5] 单个汉字 @"^[u4e00-u9fa5]{2,4}$" 长度为2-4的汉字姓名
- 身份证号(15位、18位数字):@"^(d{15})$|^(d{18})$"
- 身份证号(18位,最后一位可能是x) @"^(d{17})[dxX]$"
- 日期格式:^d{4}-d{1,2}-d{1,2}$
5.正则表达式:提取
Match match = Regex.Match("2016-5-15", @"^(d{4})-(d{1,2})-(d{1,2})$"); //使用()获取“分组” if(match.Success) { string year = match.Groups[1].Value;//序号从1开始 string month = match.Groups[2].Value; string day = match.Groups[3].Value; Console.WriteLine(year+","+month+","+day); } else { Console.WriteLine("不匹配"); }