方法出自:http://www.cnblogs.com/flyoung2008/p/3268085.html
面试题:http://blog.csdn.net/dazhong159/article/details/7907174
1. hash(hash统计)
http://blog.csdn.net/zxycode007/article/details/6999984
2. bit-map
http://blog.csdn.net/hguisu/article/details/7880288
3. 外部排序
http://see.xidian.edu.cn/cpp/html/1045.html
4. 倒排索引
http://www.cnblogs.com/fly1988happy/archive/2012/04/01/2429000.html
5. 字典树
http://www.cnblogs.com/dolphin0520/archive/2011/10/11/2207886.html
6. 优化数据库
http://blog.csdn.net/lzw190/article/details/6221143
7. 布隆过滤器
http://blog.csdn.net/v_july_v/article/details/6685894/
8. 堆
最大堆 求前n小
最小堆 求前n大
9. 双层桶法
http://blog.sina.com.cn/s/blog_94d959420100z5j9.html
10. MapReduce法