zoukankan      html  css  js  c++  java
  • 《算法竞赛进阶指南》0x10 基本数据结构 Hash

    Hash的基本知识

    字符串hash算法
    将字符串看成p进制数字,再将结果mod q
    例如:abcabcdefg 将字母转换位数字
    (1231234567)=(1*p9+2*p8+3*p7+1*p6+2*p5+3*p4+4*p3+5*p2+6*p1+7*p0)%q
    =0~q-1
    经验值 p=131,1331时,冲突最小
    q取2^64(unsigned long long)

    例如abd
    =(124)131
    =(1*131^2+2*131^1+4*131^0)
    =hash("abd")溢出不用管

    先预处理出字符串前缀的hash
    例如 已知hash("abc"),求hash("abcd")
    hash("abcd")=hash("abc")*131+4

    h[]数组存放字符串的前缀字串
    可用h[r] - h[l - 1] * p[r - l + 1]求出【l,r】区间内的任意字串
    p[]存放q的次方
    137. 雪花雪花雪花(https://www.acwing.com/problem/content/139/)

    有N片雪花,每片雪花由六个角组成,每个角都有长度。

    第i片雪花六个角的长度从某个角开始顺时针依次记为ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6。

    因为雪花的形状是封闭的环形,所以从任何一个角开始顺时针或逆时针往后记录长度,得到的六元组都代表形状相同的雪花。

    例如ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6和ai,2,ai,3,,ai,6ai,1ai,2,ai,3,…,ai,6,ai,1就是形状相同的雪花。

    ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6和ai,6,ai,5,,ai,1ai,6,ai,5,…,ai,1也是形状相同的雪花。

    我们称两片雪花形状相同,当且仅当它们各自从某一角开始顺时针或逆时针记录长度,能得到两个相同的六元组。

    求这N片雪花中是否存在两片形状相同的雪花。

    输入格式

    第一行输入一个整数N,代表雪花的数量。

    接下来N行,每行描述一片雪花。

    每行包含6个整数,分别代表雪花的六个角的长度(这六个数即为从雪花的随机一个角顺时针或逆时针记录长度得到)。

    同行数值之间,用空格隔开。

    输出格式

    如果不存在两片形状相同的雪花,则输出:

    No two snowflakes are alike.

    如果存在两片形状相同的雪花,则输出:

    Twin snowflakes found.

    数据范围

    1n1000001≤n≤100000,
    0ai,j<100000000≤ai,j<10000000

    输入样例:

    2
    1 2 3 4 5 6
    4 3 2 1 6 5
    

    输出样例:

    Twin snowflakes found.


    #include <iostream>
    #include<algorithm>
    #include<cstring>
    using namespace std;
    const int maxn = 100000+2;
    int snows[maxn][6];
    int snow[6],isnow[6],indx[maxn];
    void get_min(int a[])//字符串的最小表示
    {
        static int b[12];
        for(int i=0;i<12;i++)
        {
            b[i] = a[i%6];
        }
        int i=0,j=1,k;
    
        while(i<6&&j<6)
        {
            for(k=0;k<6&&b[i+k]==b[j+k];k++);
                if(k==6)
                    break;
                if(b[i+k]>b[j+k])
                {
                    i+=k+1;
                    if(i==j)
                        i++;
                }
                else
                {
                    j+=k+1;
                    if(i==j)
                        j++;
                }
        }
        k=min(i,j);
        for(int i=0;i<6;i++)
            a[i]=b[i+k];
    }
    bool cmp1(int a[],int b[])
    {
        for(int i=0;i<6;i++)
        {
            if(a[i]>b[i])
                return false;
            else if(a[i]<b[i])
                return true;
        }
        return false;
    }
    bool cmp2(int a,int b)
    {
        for(int i=0;i<6;i++)
        {
            if(snows[a][i]<snows[b][i])
                return true;
            else if(snows[a][i]>snows[b][i])
                return false;
        }
        return false;
    }
    int main()
    {
        int n;
        cin >> n;
        for(int i=0;i<n;i++)
        {
            for(int j=0,k=5;j<6;j++,k--)
            {
                scanf("%d",&snow[j]);
                isnow[k]=snow[j];
            }
          //  cout << 1 << endl;
            get_min(snow);
            get_min(isnow);
            if(cmp1(snow,isnow)) memcpy(snows[i],snow,sizeof snow);
            else
                memcpy(snows[i],isnow,sizeof isnow);
           indx[i]=i;
        }
        sort(indx,indx+n,cmp2);
        int flag=0;
        for(int i=1;i<n;i++)
        {
            if(!cmp2(indx[i],indx[i-1])&&!cmp2(indx[i-1],indx[i]))
            {
                cout << "Twin snowflakes found." << endl;
                flag=1;
                break;
            }
        }
        if(!flag)
        {
            cout << "No two snowflakes are alike." << endl;
        }
        return 0;
    }
     
    138. 兔子与兔子(https://www.acwing.com/problem/content/140/)

    很久很久以前,森林里住着一群兔子。

    有一天,兔子们想要研究自己的 DNA 序列。

    我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

    然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

    注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

    输入格式

    第一行输入一个 DNA 字符串 S。

    第二行一个数字 m,表示 m 次询问。

    接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

    输出格式

    对于每次询问,输出一行表示结果。

    如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

    数据范围

    1length(S),m10000001≤length(S),m≤1000000

    输入样例:

    aabbaabb
    3
    1 3 5 7
    1 3 6 8
    1 2 1 2
    

    输出样例:

    Yes
    No
    Yes
    #include<iostream>
    #include<string.h>
    #include<cstdio>
    using namespace std;
    const int MAXN = 1000000 + 2;
    const int base = 131;
    char str[MAXN];
    int p[MAXN];//p[i]存放base的次方
    int h[MAXN];
    int  get1(int x,int y)
    {
        return h[y] - h[x - 1] * p[y - x + 1];
    }
    int main()
    {
        scanf("%s", str + 1);
        int num = strlen(str + 1);
        int m;
        cin >> m;
        p[0] = 1;
        for (int i = 1; i <= num; i++)
        {
            h[i] = h[i - 1] * base + str[i] - 'a' + 1;
            p[i] = p[i - 1] * base;
        }
        while (m--)
        {
            int l1, l2, r1, r2;
            cin >> l1 >> r1 >> l2 >> r2;
            if (get1(l1, r1) == get1(l2, r2)) 
                cout << "Yes" << endl;
            else 
                cout << "No" << endl;
        }
        return 0;
    }
     
     
    139. 回文子串的最大长度(https://www.acwing.com/problem/content/141/)

    如果一个字符串正着读和倒着读是一样的,则称它是回文的。

    给定一个长度为N的字符串S,求他的最长回文子串的长度是多少。

    输入格式

    输入将包含最多30个测试用例,每个测试用例占一行,以最多1000000个小写字符的形式给出。

    输入以一个以字符串“END”(不包括引号)开头的行表示输入终止。

    输出格式

    对于输入中的每个测试用例,输出测试用例编号和最大回文子串的长度(参考样例格式)。

    每个输出占一行。

    输入样例:

    abcbabcbabcba
    abacacbaaaab
    END
    

    输出样例:

    Case 1: 13
    Case 2: 6

    #include <iostream>
    #include<string.h>
    #include<cmath>
    #include<cstdio>
    #define ull unsigned long long
    using namespace std;
    const int maxn = 2000005;
    const int base = 131;
    ull p[maxn];
    char str[maxn];
    ull h1[maxn],h2[maxn];
    ull get(ull h[],int l,int r)
    {
        return h[r]-h[l-1]*p[r-l+1];
    }
    int main()
    {
        int t=1;
        while(scanf("%s",str+1),strcmp(str+1,"END"))
        {
            int n = strlen(str+1);
            for(int i= n *2 ;i;i-=2)
            {
                str[i]=str[i/2];
                str[i-1]= 'z' + 1;
            }
            n*=2;
            p[0]=1;
            for(int i=1,j=n;i<=n;i++,j--)
            {
                h1[i] = h1[i-1]*base+str[i]-'a'+1;
                h2[i] = h2[i-1]*base+str[j]-'a'+1;
                p[i]=p[i-1]*base;
            }
             int res = 0;
            for(int i=1;i<=n;i++)
            {
                int l=0,r=min(i-1,n-i);
                while(l<r)
                {
                    int mid=l+r+1>>1;
                    if(get(h1,i-mid,i-1)!=get(h2,n-(i+mid)+1,n-(i+1)+1))
                    {
                        r=mid-1;
                    }
                    else
                    {
                        l=mid;
                    }
                }
                if(str[i-l]<='z') res=max(res,l+1);
                else res=max(res,l);
            }
            printf("Case %d: %d
    ",t++,res);
        }
        return 0;
    }
  • 相关阅读:
    磁共振中的T1, T2 和 T2*的原理和区别
    Revolver Maps-3D地球仪网站定制
    4种常见网络
    De Moivre–Laplace theorem
    The Complex Inversion Formula. Bromwich contour.
    理解全概率公式与贝叶斯公式(转)
    滴滴数据
    ccs 分类
    dialog problem overview
    recommendation baselines
  • 原文地址:https://www.cnblogs.com/wjc2021/p/10747484.html
Copyright © 2011-2022 走看看