在对字符串进行处理时一方面可以利用String对象的一些处理方法另一方面可以利用正则表达式,但是一般情况下用String对象方法进行处理起来会相对麻烦一些而正则表达式可以很方便的解决问题。为了更好的学习正则表达式,本文将讲述正则表达式的相关应用。
正则表达式
概念:用于专门操作字符串
好处:可以简化对字符串的复杂操作
特点:用于一些特定的符号来表示一些代码操作,这样就简化书写
弊端:符合定义越多,正则越长,阅读性越差
注意:
1.用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false
2.正则表达式中反斜线成对出现
字符类
[abc] a、b 或 c(简单类) 只能是abc中的一个
[^abc] 任何字符,除了 a、b 或 c(否定)
[a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集)
[a-z&&[def]] d、e 或 f(交集)
[a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去)
[a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去)
预定义字符类
. 任何字符(与行结束符可能匹配也可能不匹配)
d 数字:[0-9]
D 非数字: [^0-9]
s 空白字符:[ x0Bf ]
S 非空白字符:[^s]
w 单词字符:[a-zA-Z_0-9]
W 非单词字符:[^w]
数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
边界匹配器
^ 行的开头
$ 行的结尾
单词边界
B 非单词边界
A 输入的开头
G 上一个匹配的结尾
输入的结尾,仅用于最后的结束符(如果有的话)
z 输入的结尾
\d? 表示一个数字或者没有数字
组
为了可以让规则的结果被重用,可以将规则封装成一个组。用()完成,组的出现都有编号,从1开始,想要使用一样的组可以通过 (n就是组的编号)的形式来获取 有几个组括号就有几组。
正则中的方法
1,匹配:String matches方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false。
matches(String regex)
告知此字符串是否匹配给定的正则表达式。
2,切割:String split();
split(String regex, int limit)
根据匹配给定的正则表达式来拆分此字符串。
3,替换:String replaceAll(regex,str);如果regex中有定义组,可以在第二参数中通过$符号获取正则表达式中的已有的组
replaceAll(String regex, String replacement)
使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
4,获取:将字符串中的符合规则的子串取出
方法
1,将正则表达式封装成对象。
Pattern p = Pattern.compile(reg);
compile(String regex)
将给定的正则表达式编译到模式中。
2,让正则对象和要操作的字符串相关联。
Matcher m = p.matcher(str);
matcher(CharSequence input)
创建匹配给定输入与此模式的匹配器。
3,关联后,获取正则匹配引擎。
4,通过引擎对符合规则的子串进行操作,比如取出
while(m.find())
{
System. out.println(m.group());
System. out.println(m.start()+"...." +m.end());
}