1.有1千万条有城府的短信,以文本文件的形式保存,一行一条,也有重复,请用5分钟时间找出重复出现最多的前10条。
(1)使用哈希表方法
将1千万条短信分成若干组,进行边扫描边建立散列表的方法。
第一次扫描:取首字节+尾字节+中间任意两字节作为HashCode,插入到hashtable中;并记录其地址、信息长度和重复次数。