1.正则表达式(regular expression)
正则表达式(regular expression)是根据字符串集合内每个字符串共享的共同特性来描述字符串集合的一种途径。正则表达式可以用于搜索、编辑或者处理文本和数据。必须了解创建正则表达式的特定语法——这超出了Java编程语言的一般语法。正则表达式的复杂性各不相同。但是了解了如何构造正则表达式的基础之后,就能够解释(或者创建)任何正则表达式。
java.util.regex API支持的正则表达式语法,在正则表达式的领域中,有很多形式可供选择,比如grep、Perl、Tcl、Python、PHP和awk。java.util.regex API中的正则表达式语法和Perl最为类似。
2.java.util.regex这个包的介绍
java.util.regex包主要由三部分构成:
- Pattern
- Matcher
- PatternSyntax- Exception。
Pattern:
l Pattern对象是正则表达式编译后的表达形式。Pattern类没有提供公共构造器。为了创建模式,首先必须调用它的一个public static compile方法,这样会返回一个Pattern对象。这些方法接受正则表达式作为第一个实参。
Matcher:
Matcher对象解释模式和对输入字符串执行匹配操作的引擎。和Pattern类一样,Matcher没有定义公共构造器。通过调用Pattern对象的matcher方法获得Matcher对象。
PatternSyntaxException:
l PatternSyntaxException对象不可控异常,它指出正则表达式模式中的语法错误。