zoukankan      html  css  js  c++  java
  • 布隆过滤器简易版本实现

    可以看c++实现: https://github.com/mavam/libbf

    python实现:https://github.com/jaybaird/python-bloomfilter

    转自:http://www.cnblogs.com/dolphin0520/archive/2012/11/10/2755089.html

    /*布隆过滤器简易版本 2012.11.10*/
    
    #include<iostream>
    #include<bitset>
    #include<string>
    #define MAX 2<<24
    using namespace std;
    
    bitset<MAX> bloomSet;           //简化了由n和p生成m的过程 
    
    int seeds[7]={3, 7, 11, 13, 31, 37, 61};     //使用7个hash函数 
    
    
    
    int getHashValue(string str,int n)           //计算Hash值 
    {
        int result=0;
        int i;
        for(i=0;i<str.size();i++)
        {
            result=seeds[n]*result+(int)str[i];
            if(result > 2<<24)
                result%=2<<24;
        }
        return result;
    }
    
    
    bool isInBloomSet(string str)                //判断是否在布隆过滤器中 
    {
        int i;
        for(i=0;i<7;i++)
        {
            int hash=getHashValue(str,i);
            if(bloomSet[hash]==0)
                return false;
        }
        return true;
    }
    
    void addToBloomSet(string str)               //添加元素到布隆过滤器 
    {
        int i;
        for(i=0;i<7;i++)
        {
            int hash=getHashValue(str,i);
            bloomSet.set(hash,1);
        }
    }
    
    
    void initBloomSet()                         //初始化布隆过滤器 
    {
        addToBloomSet("http://www.baidu.com");
        addToBloomSet("http://www.cnblogs.com");
        addToBloomSet("http://www.google.com");
    }
    
    
    int main(int argc, char *argv[])
    {
        
        int n;
        initBloomSet();
        while(scanf("%d",&n)==1)
        {
            string str;
            while(n--)
            {
                cin>>str;
                if(isInBloomSet(str))
                    cout<<"yes"<<endl;
                else
                    cout<<"no"<<endl;
            }
            
        }
        return 0;
    }
  • 相关阅读:
    Lucene
    coreseek
    Sphinx学习之sphinx的安装篇
    在Hive中使用Avro
    Hive中实现group concat功能(不用udf)
    Fresnel Reflection
    安装Windows更新程序遇到错误:0x80070422
    float4与half4数据类型
    Dijkstra算法(三)之 Java详解
    地图四叉树一般用在GIS中,在游戏寻路中2D游戏中一般用2维数组就够了
  • 原文地址:https://www.cnblogs.com/bonelee/p/6215386.html
Copyright © 2011-2022 走看看