Java中的 split 函数是用于按指定字符(串)或正则去分割某个字符串,结果以字符串数组形式返回;
例如:
- String str="1234@abc";
- String[] a = str.split("@");
- System.out.println("处理结果: "+a[0]+","+a[1]); //输出的是: 处理结果: 1234,abc
对于分割的字符(串),通常是常见,普通的,没什么问题;
但是对某些特殊字符,如果字符(串)正好是正则的一部分,则需要转义才能使用,
这些字符有 | , + , * , ^ , $ , / , | , [ , ] , ( , ) , - , . , 等, 因它们是正则表达式中的一部分, 所以如果想用该字符本身, 这些字符需要进行转义才能表示它本身;
例如:
想用 | 竖线去分割某字符,因 | 本身是正则表达式中的一部分,所以需要 去转义,因转义使用 \, 而这个 正好也是正则表达式的字符,所以还得用一个 , 所以需要两个 \。
- String str="5678|XYZ";
- String[] b = str.split("\|"); //注意这里用两个 \,而不是一个
- System.out.println("处理结果: "+b[0]+","+b[1]); //输出的是: 处理结果: 5678,XYZ
再来看看:
- String str="5678|XYZ";
- String[] b = str.split("|"); //注意直接使用|,该字符是正则表达式的一部分,
- String x="处理结果: ";
- for(int i=0;i<b.length;i++){
- x=x+b[i]+",";
- }
- System.out.println(x); //输出的是: 处理结果: 5,6,7,8,|,X,Y,Z,
可能我们人为主观感觉是用 | 来分割希望得到 5678 和 XYZ,因用特殊字符,实际结果是得到意外的结果;
所以指定分割的字符(串)时,最好不要包含用于正则表达式本身的字符,如上面的红色字符;