慎用ArrayList的contains方法，使用HashSet的contains方法代替

zoukankan html css js c++ java

慎用ArrayList的contains方法，使用HashSet的contains方法代替
在启动一个应用的时候，发现其中有一处数据加载要数分钟，刚开始以为是需要load的数据比较多的缘故，查了一下数据库有6条左右，但是单独写了一个数据读取的方法，将这6万多条全部读过来，却只需要不到10秒钟，就觉得这里面肯定有问题，于是仔细看其中的逻辑，其中有一段数据去重的逻辑，就是记录中存在某几个字段相同的，就认为是重复数据，就需要将重复数据给过滤掉。这里就用到了一个List来存放这几个字段所组成的主键，如果发现相同的就不处理，代码无非就是下面这样：

List uniqueKeyList = new ArrayList(); //...... if (uniqueKeyList.contains(uniqueKey)) { continue; }

根据键去查找是不是已经存在了，来判断是否重复数据。经过分析，这一块耗费了非常多的时候，于是就去查看ArrayList的contains方法的源码，发现其最终会调用他本身的indexOf方法：
public int indexOf(Object elem) { if (elem == null) { for (int i = 0; i < size; i++) if (elementData[i]==null) return i; } else { for (int i = 0; i < size; i++) if (elem.equals(elementData[i])) return i; } return -1; }
原来在这里他做的是遍历整个list进行查找，最多可能对一个键的查找会达到6万多次，也就是会扫描整个List，验怪会这么慢了。

于是将原来的List替换为Set：

Set<string> uniqueKeySet = new HashSet<string>(); //...... if (uniqueKeySet.contains(uniqueKey)) { continue; }

速度一下就上去了，在去重这一块最多花费了一秒钟，为什么HashSet的速度一下就上去了，那是因为其内部使用的是Hashtable，这是HashSet的contains的源码：
public boolean contains(Object o) { return map.containsKey(o); }

如果不知道为什么使用Hash就变快了，可以看一下我的另外一篇文章：Java中hashCode的作用
再分享一下我老师大神的人工智能教程吧。零基础！通俗易懂！风趣幽默！还带黄段子！希望你也加入到我们人工智能的队伍中来！https://blog.csdn.net/jiangjunshow
查看全文

相关阅读:
System.Data.RealonlyException:列Column1被设置为realonly
学习java过程中
 在windows server 2008下安装vs2005.打开vs2005的时候老提示要“运行vs2005sp1 建议使用管理员权限”
windows Server 2008下面运行vs2005的问题
 大飞机MIS系统360把我的Transformer.Service服务杀掉了
 开通博客
 C#中怎样让控件显示在其他控件的上面
 vs2010发布问题
 vs在IE8无法调试的解决方法
 将身份证号粘贴到WPS表格后变成了“科学计数法”的解决方案

原文地址：https://www.cnblogs.com/skiwdhwhssh/p/10295582.html