zoukankan      html  css  js  c++  java
  • Matcher类:(转)

    Matcher类:
        使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的.
    下面我们看看一个小例子,来说明这个问题

    w(dd)(w+)
    这个正则表达式有三个组: 整个w(dd)(w+) 是第0组 group(0) (dd)是第1组 group(1) (w+)是第2组 group(2)
       我们看看和正则表达式匹配的一个字符串x99SuperJava,
    group(0)是匹配整个表达式的字符串的那部分x99SuperJava group(1)是第1组(dd)匹配的部分:99
    group(2)是第二组(w+)匹配的那部分SuperJava

       下面我们写一个程序来验证一下:

    package edu.jlu.fuliang;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    public class RegexTest {
    	public static void main(String[] args) {
    		String regex = "\w(\d\d)(\w+)";
    		String candidate = "x99SuperJava";
    		
    		Pattern p = Pattern.compile(regex);
    		Matcher matcher = p.matcher(candidate);
    		if(matcher.find()){
    			int gc = matcher.groupCount();
    			for(int i = 0; i <= gc; i++)
    				System.out.println("group " + i + " :" + matcher.group(i));
    		}
    	}
    }
                      

    输出结果:

    引用
    group 099SuperJava group 1 :99 group 2 :SuperJava

    下面我们看看Matcher类提供的方法: public Pattern pattern() 这个方法返回了,创建Matcher的那个pattern对象。
    下面我们看看一个小例子来说明这个结果

    import java.util.regex.*;
    public class MatcherPatternExample{
      public static void main(String args[]){
          test();
      }
      public static void test(){
         Pattern p = Pattern.compile("\d");
         Matcher m1 = p.matcher("55");
         Matcher m2 = p.matcher("fdshfdgdfh");
         System.out.println(m1.pattern() == m2.pattern());
         //return true
      }
    }
       

    public Matcher reset() 这个方法将Matcher的状态重新设置为最初的状态。
    public Matcher reset(CharSequence input)
    重新设置Matcher的状态,并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样,只是这样可以重用以前的对象。
    public int start()
    这个方法返回了,Matcher所匹配的字符串在整个字符串的的开始下标: 下面我们看看一个小例子

    public class MatcherStartExample{
      public static void main(String args[]){
          test();
      }
      public static void test(){
         //create a Matcher and use the Matcher.start() method
         String candidateString = "My name is Bond. James Bond.";
         String matchHelper[] =
          {"          ^","                      ^"};
         Pattern p = Pattern.compile("Bond");
         Matcher matcher = p.matcher(candidateString);
         //Find the starting point of the first 'Bond'
          matcher.find();
          int startIndex = matcher.start();
          System.out.println(candidateString);
          System.out.println(matchHelper[0] + startIndex);
         //Find the starting point of the second 'Bond'
          matcher.find();
          int nextIndex = matcher.start();
          System.out.println(candidateString);
          System.out.println(matchHelper[1] + nextIndex);
    }
                      

    输出结果: My name is Bond. James Bond.           ^11 My name is Bond. James Bond.                       ^23
    public int start(int group) 这个方法可以指定你感兴趣的sub group,然后返回sup group匹配的开始位置。
    public int end()
    这个和start()对应,返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。
    其实start和end经常是一起配合使用来返回匹配的子字符串。
    public int end(int group) 和public int start(int group)对应,返回在sup group匹配的子字符串最后一个字符在整个字符串下标加一
    public String group()
    返回由以前匹配操作所匹配的输入子序列。
    这个方法提供了强大而方便的工具,他可以等同使用start和end,然后对字符串作substring(start,end)操作。
    看看下面一个小例子:

    import java.util.regex.*;
    public class MatcherGroupExample{
      public static void main(String args[]){
          test();
      }
      public static void test(){
          //create a Pattern
          Pattern p = Pattern.compile("Bond");
          //create a Matcher and use the Matcher.group() method
          String candidateString = "My name is Bond. James Bond.";
          Matcher matcher = p.matcher(candidateString);
          //extract the group
          matcher.find();
          System.out.println(matcher.group());
      }
    }
    

    public String group(int group)
    这个方法提供了强大而方便的工具,可以得到指定的group所匹配的输入字符串 因为这两个方法经常使用,同样我们看一个小例子:

    import java.util.regex.*;
    public class MatcherGroupParamExample{
      public static void main(String args[]){
          test();
      }
      public static void test(){
         //create a Pattern
          Pattern p = Pattern.compile("B(ond)");
         //create a Matcher and use the Matcher.group(int) method
         String candidateString = "My name is Bond. James Bond.";
         //create a helpful index for the sake of output
         Matcher matcher = p.matcher(candidateString);
         //Find group number 0 of the first find
          matcher.find();
          String group_0 = matcher.group(0);
          String group_1 = matcher.group(1);
          System.out.println("Group 0 " + group_0);
          System.out.println("Group 1 " + group_1);
          System.out.println(candidateString);
         //Find group number 1 of the second find
          matcher.find();
          group_0 = matcher.group(0);
          group_1 = matcher.group(1);
          System.out.println("Group 0 " + group_0);
          System.out.println("Group 1 " + group_1);
          System.out.println(candidateString);
      }
    } 
     public int groupCount()  
    这个方法返回了,正则表达式的匹配的组数。  
     
    public boolean matches()  
    尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。  
    和find不同, find是会在整个输入字符串查找匹配的子字符串。  
    public boolean find()  
    find会在整个输入中寻找是否有匹配的子字符串,一般我们使用find的流程: 
    
     while(matcher.find()){
        //在匹配的区域,使用group,replace等进行查看和替换操作
     }
    

    public boolean find(int start) 从输入字符串指定的start位置开始查找。
    public boolean lookingAt()
    基本上是matches更松约束的一个方法,尝试将从区域开头开始的输入序列与该模式匹配
    public Matcher appendReplacement (StringBuffer sb, String replacement) 你想把My name is Bond. James Bond. I would like a martini中的Bond换成Smith

    StringBuffer sb = new StringBuffer();
    String replacement = "Smith";
    Pattern pattern = Pattern.compile("Bond");
    Matcher matcher =pattern.matcher("My name is Bond. James Bond. I would like a martini.");
    while(matcher.find()){
      matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith
    }
    

    Matcher对象会维护追加的位置,所以我们才能不断地使用appendReplacement来替换所有的匹配。
    public StringBuffer appendTail(StringBuffer sb)
    这个方法简单的把为匹配的结尾追加到StringBuffer中。在上一个例子的最后再加上一句: matcher.appendTail(sb);
    结果就会成为My name is Smith. James Smith. I would like a martini.
    public String replaceAll(String replacement)
    这个是一个更方便的方法,如果我们想替换所有的匹配的话,我们可以简单的使用replaceAll就ok了。 是:

    while(matcher.find()){
      matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith
    }
    matcher.appendTail(sb);
    

    的更便捷的方法。

    public String replaceFirst(String replacement)

    这个与replaceAll想对应很容易理解,就是只替换第一个匹配的。

  • 相关阅读:
    Web项目java.lang.OutOfMemoryError: PermGen space异常解决
    上传预览,图片展示大小的控制
    Eclipse常用插件安装_PropertiesEditor
    JDK的安装配置
    Eclipse与Tomcat的集成(无插件)
    Jsp&Servlet实现读取本地图片并展示
    DB2日期及时间的使用
    图片的另一种展现—将后台图片编码直接展现为图片
    Eclipse Task的使用
    Eclipse引入BASE64Encoder的问题
  • 原文地址:https://www.cnblogs.com/huxdiy/p/3275150.html
Copyright © 2011-2022 走看看