zoukankan      html  css  js  c++  java
  • [日常摸鱼]字符串相关

    最近开始学字符串…之前暑假听JOHNKROM大爷讲这个的时候就很懵(当时根本没碰过这个东西…)

    这里大概会有一些相关的算法和自己做的题,还有存一些模板啥的。

    由于我太弱了所以可能不会写有关原理的东西(或者等我哪天会了有空再补)如果是刚学的话还是去网上找教程吧…我就存个题还有模板啥的orz


    Trie
    字典树(Trie),根节点为空节点,其他节点(或边上)放字母,然后节点上还能储存一些其他信息。

    1.一个类似模板题的东西:luogu2580

    建一颗Trie,把所有名字插进去,结束的地方打个标记,具体见代码

    #include<cstdio>
    #include<cstring>
    const int N=500005;
    int n,m,cnt;
    int tr[N][30],s[N];
    char temp[55];
    
    inline void insert(char *c)
    {
        int now=0,len=strlen(c+1);
        for(register int i=1;i<=len;i++)
        {
            int k=c[i]-'a';
            if(tr[now][k]==0)tr[now][k]=++cnt;
            now=tr[now][k];
        }s[now]=1;
    }
    inline int access(char *c)
    {
        int now=0,len=strlen(c+1);
        for(register int i=1;i<=len;i++)
        {
            int k=c[i]-'a';
            if(tr[now][k]==0)return -1;
            now=tr[now][k];
        }
        if(s[now]==1)
        {
            s[now]++;
            return 1;
        }else if(s[now]>1)
            return 0;
        return -1;
    }
    int main()
    {
        scanf("%d",&n);
        for(register int i=1;i<=n;i++)
        {
            scanf("%s",temp+1);
            insert(temp); 
        }
        scanf("%d",&m);
        for(register int i=1;i<=m;i++)
        {
            scanf("%s",temp+1);
            int res=access(temp);
            if(res==-1)printf("WRONG
    ");
            else if(res==0)printf("REPEAT
    ");
            else printf("OK
    ");
        }
        return 0;
    }
    View Code

    KMP

    用来在线性时间完成单个文本和模式串匹配的算法,通过一个$next$数组来优化朴素算法

    (一篇看到感觉比较好的blog:http://blog.csdn.net/joylnwang/article/details/6778316/

    1.模板题:luogu3375

    #include<cstdio>
    #include<cstring>
    const int N=1000005;
    char s[N],t[N];
    int n,m,nxt[N];
    int main()
    {
        scanf("%s%s",s+1,t+1);
        n=strlen(s+1);m=strlen(t+1);
        nxt[1]=0;
        for(register int i=2,j=0;i<=m;i++)
        {
            while(j&&t[i]!=t[j+1])j=nxt[j];
            if(t[i]==t[j+1])j++;
            nxt[i]=j;
        }
        for(register int i=1,j=0;i<=n;i++)
        {
            while(j&&t[j+1]!=s[i])j=nxt[j];
            if(s[i]==t[j+1])j++;
            if(j==m)
            {
                j=nxt[j];
                printf("%d
    ",i-m+1); 
            }
        }
        for(register int i=1;i<=m;i++)printf("%d ",nxt[i]);
    }
    View Code

    2.找最小循环节:poj2406

    题意:求最大的$n$使得给定的$s=a^n$,$a$为某个字符串($a^n$就是$n$个$a$拼在一起)

    要让$n$最大那就要让$|a|$最小,所以就是要找最小循环节的长度,注意到KMP求出来的$next[i]$的意义是从开头到$i$的子串里前缀和后缀相等的最长的长度,那么$n-next[n]$就是要求最小循环节辣!然后如果求出来的长度不能被$|s|$整除那答案就是1

    #include<cstdio>
    #include<cstring>
    const int N=1000005;
    int n,temp,ans,nxt[N];
    char s[N];
    int main()
    {
        while(1)
        {
            memset(nxt,0,sizeof(nxt));
            scanf("%s",s+1);if(s[1]=='.')break;
            n=strlen(s+1);nxt[1]=0;int i,j;ans=0;
            for(i=2,j=0;i<=n;i++)
            {
                while(j&&s[j+1]!=s[i])j=nxt[j];
                if(s[j+1]==s[i])j++;
                nxt[i]=j;
            }
            temp=n-nxt[n];
            if(n%temp==0)ans=n/temp;
            else ans=1;
            printf("%d
    ",ans);
        }
        return 0;
    }
    View Code

    3.HDU1358

    类似上一题

    这两个应该都算kmp相关的经典问题吧x

    #include<cstdio>
    #include<cstring>
    const int N=1000005;
    char s[N];
    int n,k,temp,nxt[N];
    int main()
    {
        while(scanf("%d",&n)==1&&n)
        {
            printf("Test case #%d
    ",++k);
            scanf("%s",s+1);nxt[1]=0;
            for(register int i=2,j=0;i<=n;i++)
            {
                while(j&&s[j+1]!=s[i])j=nxt[j];
                if(s[j+1]==s[i])j++;
                nxt[i]=j;
            }
            for(register int i=2;i<=n;i++)
            {
                temp=i-nxt[i];
                if(i%temp==0&&i>temp)printf("%d %d
    ",i,i/temp);
            }printf("
    ");
        }
        return 0;
    }
    View Code

    Manacher

    求一个字符串的最长回文子串

    1. 模板题:luogu3805

    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    using namespace std;
    const int N=25000005;
    int n,ans,p[N];
    char s[N],str[N];
    inline void manacher()
    {
        int mx=0,pos=0;
        for(register int i=n;str[i]!=0;i++)str[i]=0;
        for(register int i=1;i<n;i++)
        {
            if(mx>i)p[i]=min(p[2*pos-i],p[pos]+pos-i);
            else p[i]=1;
            for(;str[i+p[i]]==str[i-p[i]];++p[i]);
            if(p[i]+i>mx){mx=p[i]+i;pos=i;}
        }
    }
    inline void init()
    {
        str[0]=str[1]='#';
        for(register int i=0;i<n;i++)str[(i<<1)+2]=s[i],str[(i<<1)+3]='#';
        n=(n<<1)+2;str[n]=0;
    }
    int main()
    {
        scanf("%s",s);
        n=strlen(s);init();manacher();
        for(register int i=0;i<n;i++)ans=max(ans,p[i]);
        printf("%d",ans-1); 
    }
    View Code

    AC自动机

    Aho-Corasick自动机,一个文本串和多个模式串进行匹配

    1.模板题:luogu3808

    #include<cstdio>
    #include<cstring>
    #include<queue>
    using namespace std;
    const int N=1000005;
    const int S=26;
    char s[N];
    int n;
    queue<int>q;
    struct ac_automation
    {
        int cnt;
        int tr[N][S+3],fail[N],val[N];
        inline void insert(char *c)
        {
            int len=strlen(c+1),k=0;
            for(register int i=1;i<=len;i++)
            {
                int t=c[i]-'a';
                if(!tr[k][t])tr[k][t]=++cnt;
                k=tr[k][t];
            }val[k]++;
        }
        inline void build()
        {
            for(register int i=0;i<S;i++)if(tr[0][i])fail[tr[0][i]]=0,q.push(tr[0][i]);
            while(!q.empty())
            {
                int k=q.front();q.pop();
                for(register int i=0;i<S;i++)
                {
                    if(tr[k][i])q.push(tr[k][i]),fail[tr[k][i]]=tr[fail[k]][i];
                    else tr[k][i]=tr[fail[k]][i];
                }
            }
        }
        inline int solve(char *c)
        {
            int len=strlen(c+1),k=0,ans=0;
            for(register int i=1;i<=len;i++)
            {
                k=tr[k][c[i]-'a'];
                for(register int j=k;j&&~val[j];j=fail[j])ans+=val[j],val[j]=-1;
            }return ans;
        }
    }ac;
    int main()
    {
        scanf("%d",&n);
        for(register int i=1;i<=n;i++)scanf("%s",s+1),ac.insert(s);
        ac.build();scanf("%s",s+1);printf("%d",ac.solve(s));
        return 0;
    }
    View Code

    我好像也只会模板了orz

    2.需要统计次数的luogu3796 / uvalive4670

    T_T我好像只会写而已…

    #include<cstdio>
    #include<cstring>
    #include<queue>
    using namespace std;
    const int N=1000005;
    const int S=26;
    char s[N],str[155][75];
    int n,mark[N];
    queue<int>q;
    struct ac_automation
    {
        int cnt;
        int tr[N][S+3],fail[N],val[N],last[N];
        inline void init()
        {
            for(register int i=0;i<=cnt;i++)
            {
                memset(tr[i],0,sizeof(tr[i]));
                fail[i]=val[i]=last[i]=mark[i]=0;
            }
            for(register int i=1;i<=n;i++)memset(str[i],0,sizeof(str[i]));
            cnt=n=0;
        }
        inline void insert(char *c,int p)
        {
            int len=strlen(c+1),k=0;
            for(register int i=1;i<=len;i++)
            {
                int t=c[i]-'a';
                if(!tr[k][t])tr[k][t]=++cnt;
                k=tr[k][t];
            }
            val[k]=p;
        }
        inline void build()
        {
            while(!q.empty())q.pop();
            for(register int i=0;i<S;i++)if(tr[0][i])q.push(tr[0][i]);
            while(!q.empty())
            {
                int k=q.front();q.pop();
                for(register int i=0;i<S;i++)
                {
                    if(tr[k][i])
                    {
                        int v=tr[k][i];
                        fail[tr[k][i]]=tr[fail[k]][i];
                        last[v]=(val[fail[v]]?fail[v]:last[fail[v]]);
                        q.push(tr[k][i]);
                    }
                    else tr[k][i]=tr[fail[k]][i];
                }
            }
        }
        inline void solve(char *c)
        {
            int len=strlen(c+1),mx=0,k=0;
            for(register int i=1;i<=len;i++)
            {
                k=tr[k][c[i]-'a'];
                if(val[k])mark[val[k]]++;
                int t=last[k];
                while(t)
                {
                    if(val[t])mark[val[t]]++;
                    t=last[t]; 
                }
            }
            for(register int i=1;i<=n;i++)mx=max(mx,mark[i]);printf("%d
    ",mx); 
            for(register int i=1;i<=n;i++)if(mark[i]==mx)printf("%s
    ",str[i]+1);
        }
    }ac;
    int main()
    {
        while(scanf("%d",&n)==1)
        {
            if(n==0)break;
            for(register int i=1;i<=n;i++)scanf("%s",str[i]+1),ac.insert(str[i],i);
            ac.build();scanf("%s",s+1);ac.solve(s);ac.init();
        }
        return 0;
    }
    View Code

    to be continued

  • 相关阅读:
    【剑指Offer】面试题14- I. 剪绳子
    【剑指Offer】面试题56
    【LeetCode】202. 快乐数
    【LeetCode】1095. 山脉数组中查找目标值
    【LeetCode】260. 只出现一次的数字 III
    【剑指Offer】面试题56
    【LeetCode】33. 搜索旋转排序数组
    【LeetCode】23. 合并K个排序链表
    【LeetCode】46. 全排列
    mysql可视化工具下载地址2017.6.27
  • 原文地址:https://www.cnblogs.com/yoshinow2001/p/8075644.html
Copyright © 2011-2022 走看看