zoukankan      html  css  js  c++  java
  • 字符串HASH 学习总结 && 模板

    一、字符串HASH模板  取自挑战程序设计竞赛(第2版)

    </pre><pre code_snippet_id="446698" snippet_file_name="blog_20140809_1_9461278" name="code" class="cpp">/*===================================================*
        从b串中寻找和a串长度同样的子串,返回開始位置
        不保证绝对正确,发生冲突概率为O(sqrt(n)),
        n为哈希函数的最大值
    *===================================================*/
    
    #define ull unsigned long long
    const ull B = 1e8+7;    /*according to the book*/
    const int MAXN = 1001;
    char a[MAXN],b[MAXN];
    
    int HashFind()/*返回匹配位置的開始处的下标,-1表示没有匹配*/
    {
        int al=strlen(a),bl=strlen(b);
        if(al>bl)return -1;
        ull t=1,ah=0,bh=0;
        for(int i=0;i<al;i++)
        {
            t*=B;
            ah=ah*B+a[i];
            bh=bh*B+b[i];
        }
        for(int i=0;i+al<=bl;i++)
        {
            if(ah == bh)return i;
            if(i+al < bl)bh=bh*B+b[i+al]-b[i]*t;
        }
        return -1;
    }
    
    /*===================================================*
        滚动哈希--滚动通过ull的溢出实现,相当于mod 2^64
    
    *===================================================*/
    
    #define ull unsigned long long
    const int MAXN = 1001;
    const ull B = 1e8+7;    /*according to the book*/
    char a[MAXN],b[MAXN];
    
    int OverLap()/*a的后缀和b的前缀相等的最大长度*/
    {
        int al=strlen(a),bl=strlen(b),ans=0;
        int minlen=min(al,bl);
        ull t=1,ah=0,bh=0;
        for(int i=1;i<minlen;i++)
        {
            ah=ah+a[al-i]*t;
            bh=bh*B+b[i-1];
            if(ah == bh)ans=i;
            t*=B;
        }
        return ans;
    }
    


    二、字符串HASH的求法:(注意我不同颜色标记的地方,假设WA,一定看看那里是不是写对了)
    1、直接ah[i]=ah[i-1]*base+a[i],那么长度为len的哈希值就是ah[i]-ah[i-len]*base[len]  此处ah[i]表示长为i字符串的哈希值

    北京邀请赛的题,为了能做到在O(1)时间内算出hash值---比方算从l到r这段字符串的hash值,能够直接ah[r]-ah[l-1](当然须要推断l>=1,或者直接字符串从下标为1開始)。便于进行二分,就是这么写的

    http://blog.csdn.net/u011026968/article/details/38473707

    2、逐步递推:hash[i]=hash[i-1]*base+a[i]-a[i-len]*base[len]  再写字符矩阵匹配的时候两种写法我弄混了...o(╯□╰)o

    三、HASH的其它构造方法:
    1、假设限定了字符数目,能够映射为对应进制的数,如http://blog.csdn.net/u011026968/article/details/38490653


  • 相关阅读:
    听豆瓣架构变迁分享会总结
    业界对生成图片缩略图的做法归纳
    58和百姓网的技术学习
    减少存储过程封装业务逻辑-web开发与传统软件开发的思维模式不同
    网站速度问题排查与定位经验
    调度思想-现实中的事物与技术里面其实存在类似道理
    关于图片或者文件在数据库的存储方式归纳
    mysql单表体积和一个库设计多少张表为妥
    php的变量引用与销毁机制
    选择技术方案权衡时,考虑对其可控性很重要
  • 原文地址:https://www.cnblogs.com/mfmdaoyou/p/6702352.html
Copyright © 2011-2022 走看看