zoukankan      html  css  js  c++  java
  • 转:Java中字符串split() 的使用方法.

    原文地址:https://blog.csdn.net/qq_27093465/article/details/54910323

    挺有意思的一个问题

    先看下面的方法,事先预测一下,经过split方法,按逗号进行分割为数组之后,生成的数组的长度是多少,目测很多人都觉得是8,但是结果却出乎意料。是5而不是8.

    1     private static void testSplit() {
    2         String ss = ",aa,bb,cc,dd,,,";
    3         String[] array = ss.split(",");
    4  
    5         System.out.println(array.length);//结果是5,而不是预想中的8
    6         for (int i = 0; i < array.length; i++) {
    7             System.out.println(array[i]);
    8         }
    9     }

    然后就是正儿八经的运行结果图:

    可以看到,结果真的是5而不是我们猜的8,这是为什么呢?

    原因解析:

    点进去看源码,debug一下,如下图:

    可以看到,刚刚开始的时候,确实是有0-7,8个分割出来的东西存在,有三个是空字符串,""。不是null。不用担心空指针异常。

    然后 看到下面的继续走,if语句,就看到,他把这个list从尾部开始判断,如果这个list的后面的字符串的长度是0,那么这个resultSize就 减减,然后一直while循环,

    直到不符合条件,那么list的下标是5、6、7的值就被抛弃了,然后新生的结果字符串数组,的大小就变成加工过后的长度,那么就变成了长度 5的数组。

    list.subList(0, resultSize).toArray(result)

    就是这句话啦。

    他只是处理后面尾部的空字符串,不处理中间的空字符串和 开头的空字符串。

    知道这个原理之后,那么这个 问题以后怎么变,你都了然于胸啦。

    下面是又更新的

    (2017/07/13更新)

    现在要求字符串

    "aa12sas32sasa223sas12as12wqe"//去掉数字,然后弄成数组
    "aa,,sas,,sasa,,,,sasas,,,"//去掉逗号,不管几个逗号,都去掉
    "aa  sas sa sa     sas  as  "//去掉空格,也不管几个,
    把他们给分解成数组,同时刨除掉不用的多余信息。

    具体实现代码如下:

     1     private static void testSplitPlus() {
     2         String ss = "aa12sas32sasa223sas12as12wqe";
     3         String[] array = ss.split("[\d]+");
     4         System.out.println(Arrays.toString(array));
     5         ss = "aa,,sas,,sasa,,,,sasas,,,";
     6         array = ss.split("[,]+");
     7         System.out.println(Arrays.toString(array));
     8         ss = "aa  sas sa sa     sas  as  ";
     9         array = ss.split("[\s]+");
    10         System.out.println(Arrays.toString(array));
    11     }

    下面再看看这个split的源码。

     1 public String[] split(String regex) { 2 return split(regex, 0); 3 }

    不知道你看到没,那个regex,不就是正则表达式的意思嘛?

    那就明白了,这个方法是支持正则表达式操作的。那上面的代码就好解释啦。

    第一个[\d]+这个解释就是\是转义符,d表示数字,括起来后面的加号表示一个或者多个,那么就可以解释运行结果啦。

    第二个[,]解释类似,就是逗号出现一次或多次,

    第三个,\s,就是匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ f v]。

    然后下面,看运行结果。

    详细内容见 原文博客~

  • 相关阅读:
    加州大学Santa Barbara量化课程
    专利分析与申请(2):SILK 专利的特点
    两种可分级语音编码器的量化器
    芬兰赫尔辛基工业大学DirAC工程:Directional audio coding
    SILK 的 Delay Decision 和 Dither
    Fraunhofer 研究院
    ICASSP 论文发表相关问题
    SILK 学习总结之位分配与低码率编码
    今天测试VOIP软件结果
    国内部分音频语音相关研究企业(实时更新)
  • 原文地址:https://www.cnblogs.com/mumu122GIS/p/9709832.html
Copyright © 2011-2022 走看看