正则表达式在日常开发中会经常的接触到,学会了正则可以更有效的对字符进行验证、拆分、替换、判断字符串是否合法等操作。。。
常用语法:
字符的取值范围
1.[abc] : 表示可能是a,可能是b,也可能是c。
2.[^abc]: 表示不是a,b,c中的任意一个
3.[a-zA-Z]: 表示是英文字母
4.[0-9]:表示是数字
简洁的字符表示
.:匹配任意的字符
d:表示数字
D:表示非数字
s:表示由空字符组成,[
xf]
S:表示由非空字符组成,[^s]
w:表示字母、数字、下划线,[a-zA-Z0-9_]
W:表示不是由字母、数字、下划线组成
数量表达式
1.?: 表示出现0次或1次
2.+: 表示出现1次或多次
3.*: 表示出现0次、1次或多次
4.{n}:表示出现n次
5.{n,m}:表示出现n~m次
6.{n,}:表示出现n次或n次以上
逻辑表达式
1.XY: 表示X后面跟着Y,这里X和Y分别是正则表达式的一部分
2.X|Y:表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f
3.(X):子表达式,将X看做是一个整体
java中提供了两个类来支持正则表达式的操作
分别是java.util.regex下的Pattern类和Matcher类
在实际的开发中,为了方便我们很少直接使用Pattern类或Matcher类,而是使用String类下的方法
验证:boolean matches(String regex)
拆分: String[] split(String regex)
替换: String replaceAll(String regex, String replacement)
例:
验证:
String str = "1234567abc";
String regex = "\d+"; //判断是否为存数字
System.out.println(str.matches(regex));//false
String str = "1234567abc";
String regex = "\w+"; //判断是否为字母、数字、下划线
System.out.println(str.matches(regex));//true
替换:
String str = "12Y34h56dAd7";
String regex = "[a-zA-Z]+";//匹配所有字母
System.out.println(str.replaceAll(regex,"-"));//12-34-56-7
拆分:
String str = "Tom:30|Jerry:20|Bob:25";
String regex = "\|"; //匹配所有|
String[] arr = str.split(regex);
System.out.println(Arrays.toString(arr));//[Tom:30, Jerry:20, Bob:25]