题目:一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL。
第1种方法
首先使用包含500个url的文件创建一个hash_set。然后遍历50M的url记录,如果url在hash_set中,则输出此url并从hash_set中删除这个url。所有输出的url就是两个记录里相同的url。
第2种方法
AC自动机