建议64:多种最值算法,适时选择.
对一批数据进行排序,然后找出其中的最大值或最小值,这是基本的数据结构知识。在Java中我们可以通过编写算法的方式,也可以通过数组先排序再取值的方式来实现。下面以求最大值为例,解释一下多种算法。
(1) 自行实现,快速査找最大值
先来看用快速査找法取最大值的算法,其代码如下:
1 public static int max(Integer[] datas){ 2 int max=datas[0]; 3 for(int i:datas){ 4 max=max>i?max:i; 5 } 6 return max; 7 }
这是我们经常使用的最大值算法,也是速度最快的算法。它不要求排序,只要遍历一遍数组即可找出最大值。
(2) 先排序,后取值
对于求最大值,也可以采用先排序后取值的方式,同样比较简单,代码如下:
1 public static int max(int[] data){ 2 //先排序 3 Arrays.sort(data.clone()); 4 //然后取值 5 return data[data.length-1]; 6 }
从效率上来讲,当然是自己写快速査找法更快一些了,只用遍历一遍就可以计算出最大值。但在实际测试中我们发现,如果数组数量少于1万,两者基本上没有差别,在同一个毫 秒级别里,此时就可以不用自己写算法了,直接使用数组先排序后取值的方式。
如果数组元素超过1万,就需要依据实际情况来考虑:自己实现,可以提升性能;先排序后取值,简单,通俗易懂。排除性能上的差异,两者都可以选择,甚至后者更方便一些, 也更容易想到。
现在问题来了,在代码中为什么要先使用data.clone拷贝再排序呢?那是因为数组也是一个对象,不拷贝不就改变了原有数组元素的顺序吗?除非数组元素的顺序无关紧要.
接着往下思考,如果要査找仅次于最大值的元素(也就是老二),该如何处理呢?要注 意,数组的元素是可以重复的,最大值可能是多个,所以单单一个排序然后取倒数第二个元素是解决不了问题的。
此时,就需要一个特殊的排序算法了,先要剔除重复数据,然后再排序。当然,'自己写算法也可以实现,但是集合类已经提供了非常好的方法,要是再使用数组自己写算法就显得 有点过时了。数组不能剔除重复数据,但Set集合却是可以的,而且Set的子类TreeSet还能 自动排序。代码如下:
1 public static int getSecond(Integer[] data){ 2 List<Integer> list=Arrays.asList(data); 3 System.out.println(list.size()); 4 TreeSet<Integer> set=new TreeSet<Integer>(list); 5 return set.lower(set.last()); 6 }
剔除重复元素并升序排列,这都由TreeSet类实现的,然后可再使用lower方法寻找小 干最大值的值。大家看,上面的程序非常简单吧?那如果是我们自己编写代码会怎么样?那至少要遍历数组两遍才能计算出老二的值,代码的复杂度将大大提升。
也许你会说,这个要求有点变态,怎么会有这样的需求?不,有这样的需求很正常,比如在学校按成绩排名时,如果一个年级有1200人,只要找出最高的三个分数(可不一定就 是3个人,也可能是多人),是不是就是这种情况呢?因此在实际应用中求最值,包括最大值、最小值、第二大值、倒数第二小值等,使用集合是最简单的方式,当然若从性能方面来 考虑,数组是最好的选择。
注意最值计算时使用集合最简单,使用数组性能最优。