福哥答案2020-07-19:
1.内置map。单条数据量不大时,可以用内置map,一条一条插入2000万数据,耗费至少5秒时间。单条数据量过大,这种方法用不了。2.内存数据库,比如redis。单条数据量不大时,比如一条数据1k,总共20g,单个redis就行。单条数据量大,用分布式。3.布隆过滤器。如果只是查是否存在,并且容忍一定的误判率,可以考虑下。
综上所述,大概率选方法2。