1.由很多的随机映射函数,和一个二进制向量(由0和1组成)构成
2.先存储:
1)通过散列函数通过计算将之放进二进制向量(将指定位置的0变成1)中
3.查找:
2)通过散列函数通过计算其位置看是否都是1来判断是否在数据集合中
4.优势:
1)不保存数据的内容,
2)只通过随机映射函数来保存信息(指纹)
3)信息安全性高,获取到了二进制向量和散列函数也无法推断出数据内容
5.缺点:
1)存在误判
2)数据删除困难
6.应用场景:用来判断访问数据是否在大量现有数据中
7.现有框架:guava,1.9以上实现了
1)put方法
使用哈希算法将之放进二进制向量中
2)mightContain
判断是否在里面
3)create
创建布隆过滤器