zoukankan      html  css  js  c++  java
  • Java--如何高效向List中存放不重复的数据(附带时间测试)

    set不允许出现重复的值(key)

    List是不能存储重复数据的,而我们想利用List存储不重复的元素,一般都使用List自带的contains方法对元素进行判断,如果不包含再进行添加,但是这样太耗时了。

    含再进行添加,但是这样太耗时了。

        if (!list.contains("/home/" + i)) {
            list.add("/home/" + i);
        }
    

    其实我们可以利用set集合存储元素的去重特性来进行list的去重存储,如果set能添加,list就进行添加。

        if (set.add("/home/" + i)) {
            list.add("/home/" + i);
        }
    


    下面我们就来测试几种向List存放不重复数据方法的耗时情况:

        public class Test {
         
            public static List<String> list = new ArrayList<String>();
            public static Set<String> set = new HashSet<>();
            public static Set<String> sortset = new LinkedHashSet<>();
         
            public static void main(String[] args) {
                // 利用Hashset去重的特性
                long s1 = System.currentTimeMillis();
                for (int i = 0; i < 100000; i++) {
                    if (set.add("/home/" + i)) {
                        list.add("/home/" + i);
                    }
                }
                System.out.println("使用Hashset进行list去重速度:" + (System.currentTimeMillis() - s1));
         
                // 利用linkedHashSet去重且存放有序的特性
                long s4 = System.currentTimeMillis();
                for (int i = 0; i < 100000; i++) {
                    if (sortset.add("/home/" + i)) {
                        list.add("/home/" + i);
                    }
                }
                System.out.println("使用LinkedHashset进行list去重速度:" + (System.currentTimeMillis() - s4));
         
                // 利用list自带contains方法做判断
                long s2 = System.currentTimeMillis();
                for (int i = 0; i < 100000; i++) {
                    if (!list.contains("/home/" + i)) {
                        list.add("/home/" + i);
                    }
                }
         
                System.out.println("使用lists的contain方法去重速度:" + (System.currentTimeMillis() - s2));
         
                // 先存到HashSet,再将全部元素添加到list中
                long s3 = System.currentTimeMillis();
                for (int i = 0; i < 100000; i++) {
                    set.add("/home/" + i);
                }
                list.addAll(set);
                System.out.println("使用set去重,然后添加到list中速度:" + (System.currentTimeMillis() - s3));
         
            }
         
        }
    


    测试结果如下图:



    经过观察我们可以发现,这其中先使用set进行去重,然后再将set所有元素添加到list中是最快的。但是需要注意的是,List的addAll()方法默认是会将要添加集合的元素添加到list的尾部,如果你的这个list中本身包含了其他数据,添加时对顺序有要求的话要谨慎使用。最好是使用第一种方式,使用set是否可以添加作为判断条件,这样在这个过程中还可以附带其他条件。比较灵活。
    而使用List的contains方法则耗时最久,与其他方式速度相差几十倍。所以大家以后还是尽量不要使用contains来进行去重的判断了。

    Set集合是没有重复数据的特性,那么对于元素为对象 的情况是否也同样奏效?

    参看:https://www.cnblogs.com/interdrp/p/12324738.html

    判断插入的key是否存在,要判断两点①hash值是否相同;②对应的值是否相同,前者要看hashCode()方法,后者要看equal()方法。

    1)只要重写equals,就必须重写hashCode;

    2)因为Set存储的是不重复的对象,依据hashCode和equals进行判断,所以Set存储的对象必须重写这两个方法。

    3)如果自定义对象做为Map的键,那么必须重写hashCode和equals。

  • 相关阅读:
    android 21 隐式意图启动系统预定义activity
    android 20 Intnet类重要的成员变量
    android 19 activity纵横屏切换的数据保存与恢复
    android 18 Bundle类
    android 17 activity生命周期
    Centos6.4建立本地yum源
    eclipse实现批量修改文件的编码方式
    [系统资源]/proc/meminfo和free输出解释
    监控WebLogic 8.x的解决方案(监控应用服务器系列文章)
    linux网络监控脚本
  • 原文地址:https://www.cnblogs.com/interdrp/p/12324702.html
Copyright © 2011-2022 走看看