zoukankan      html  css  js  c++  java
  • HDU3065 病毒侵袭持续中 AC自动机

    病毒侵袭持续中

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
    Total Submission(s): 1663    Accepted Submission(s): 611


    Problem Description
    小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
     


    Input
    第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
    接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
    在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
     


    Output
    按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
    病毒特征码: 出现次数
    冒号后有一个空格,按病毒特征码的输入顺序进行输出。
     


    Sample Input
    3 AA BB CC ooxxCC%dAAAoen....END
     


    Sample Output
    AA: 2 CC: 1
    Hint
    Hit: 题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。
     
      其实该题没有想象中的那么复杂,仔细一想就知道,AC自动机自身不是有一个重置操作吗,即找的的子串曾经被我们删除过,该题只要不进行删除操作就行了,这都多亏了在该算法中,本身的fail指针是不停的回溯的,例如AAA匹配AA时,前面的AA计算一次,到达第三个A时,由于后面的AA只有两个字符,算法将自动跳到AA的第二个A来匹配AAA中的第三个A,就是这样。
      代码如下:
    #include <cstdio>
    #include <cstring>
    #include <cstdlib>
    #include <queue>
    using namespace std;
    
    char ss[1005][55], T[2000005];
    
    int cnt[1005];
    
    struct Node
    {
    	int flag;
    	Node *ch[26], *fail;
    };
    
    void getstr( char *s )
    {
    	int p = 0;
    	char c;
    	while( c = getchar(), c == '\n' ) ;
    	s[p++] = c;
    	while( c = getchar(), c != '\n' )
    		s[p++] = c;
    	s[p] = '\0';
    }
    
    Node *init(  )
    {
    	Node *p = new Node;
    	p->flag = -1;
    	p->fail = NULL;
    	memset( p->ch, 0, sizeof( p->ch ) );
    	return p;
    }
    
    void BuildTree( Node *p, char *in, int No )
    {
    	int dx = *in - 'A';
    	if( *in )
    	{
    		if( !p->ch[dx] )
    			p->ch[dx] = init();
    		BuildTree( p->ch[dx], in + 1, No );
    	}
    	else
    		p->flag = No;
    }
    
    void BuildFailPoint( Node *r )
    {
    	queue<Node *>q;
    	q.push( r );
    	while( !q.empty() )
    	{
    		Node *pos = q.front();
    		q.pop();
    		for( int i = 0; i <26; ++i )
    		{
    			Node *f = pos->fail;
    			if( pos->ch[i] )
    			{
    				while( f ) // f已经退了步,所以后面不许要让步
    				{
    					if( f->ch[i] )
    					{
    						pos->ch[i]->fail = f->ch[i];
    						break;
    					}
    					f = f->fail;
    				}
    				if( !f )
    				{
    					pos->ch[i]->fail = r;
    				}
    				q.push( pos->ch[i] );
    			}
    		}
    	}
    }
    
    void AcAuto( Node *r, char *text )
    {
    	int len = strlen( text );
    	Node *f = r;
    	for( int i = 0; i < len; ++i )
    	{
    		int dx = text[i] - 'A';
    		if( dx < 0 || dx >= 26 )
    		{
    			f = r;
    			continue;
    		}
    		while( f )
    		{
    			if( f->ch[dx] )
    			{
    				f = f->ch[dx]; // 匹配成功,向后移一位
    				break;
    			}
    			f = f->fail;
    		}
    		if( !f )
    			f = r;
    		else
    		{
    			Node *t = f;
    			while( t )
    			{
    				if( t->flag!= -1 )
    				{
    					cnt[t->flag]++;
    				}
    				t = t->fail;
    			}
    		}
    	}
    }
    
    void _free( Node *p )
    {
        for( int i = 0; i < 26; ++i )
        {
            if( p->ch[i] )
                _free( p->ch[i] );
        }
        free( p );
    }
    
    int main()
    {
    	int N;
    	while( scanf( "%d", &N ) != EOF )
    	{
    	    Node *r = init();
    		memset( cnt, 0, sizeof( cnt ) );
    	    for( int i = 0; i < N; ++i )
    	    {
    		    getstr( ss[i] );
    		    BuildTree( r, ss[i], i );
    	    }
    	    BuildFailPoint( r );
    	    getstr( T );
    	    AcAuto( r, T );
    	    for( int i = 0; i < N; ++i )
    	    {
    		    if( cnt[i] )
    			    printf( "%s: %d\n", ss[i], cnt[i] );
    	    }
    	    _free( r );
        }
        return 0;
    }
    

      

  • 相关阅读:
    HUST 1372 marshmallow
    HUST 1371 Emergency relief
    CodeForces 629D Babaei and Birthday Cake
    CodeForces 629C Famil Door and Brackets
    ZOJ 3872 Beauty of Array
    ZOJ 3870 Team Formation
    HDU 5631 Rikka with Graph
    HDU 5630 Rikka with Chess
    CodeForces 626D Jerry's Protest
    【POJ 1964】 City Game
  • 原文地址:https://www.cnblogs.com/Lyush/p/2169478.html
Copyright © 2011-2022 走看看