前言:
removeAll方法是取差集的,数据量很大的时候效率很低。
本文的最终方案是方法3
正文:
原集合:List<T> source
目标集合:List<T> destination
要求:取原集合中,不与目标集合重复的元素
1,资料表明,给List中add()数据的速度要比从List中remove()数据的快。效果不明显
public List<T> removeAll_01(List<T> source, List<T> destination) { List<T> result = new LinkedList<T>(); for(T t : source) { if (!destination.contains(t)) { result.add(t); } } return result; }
2,运用Set可以去重这一特性。效率有明显提升
public List<T> removeAll_02(List<T> source, List<T> destination) { List<T> result = new LinkedList<T>(); Map<T, Integer> sourceMap = new HashMap<T, Integer>(); for (T t : source) { if (sourceMap.containsKey(t)) { //原集合中的重复值 sourceMap.put(t, sourceMap.get(t) + 1); } else { sourceMap.put(t, 1); } } Set<T> all = new HashSet<T>(destination); for (Map.Entry<T, Integer> entry : sourceMap.entrySet()) { T key = entry.getKey(); Integer value = entry.getValue(); if (all.add(key)) { for (int i = 0; i < value; i++) { result.add(key); } } } return result; }
3,用Set.contains()再优化
public List<T> removeAll_03(List<T> source, List<T> destination) { List<T> result = new LinkedList<T>(); Set<T> destinationSet = new HashSet<T>(destination); for(T t : source) { if (!destinationSet.contains(t)) { result.add(t); } } return result; }
参考博客:
List 的 removeAll 方法的效率 - kangxingang的专栏 - CSDN博客
https://blog.csdn.net/kangxingang/article/details/9033491