最近学习了回文树,这个比较新颖的数据结构,相应的写了12道关于回文树的题目。所以总结一下。
网络上关于回文树的学习的博客有很多质量很好的,这里就不具体分析回文树的构成了,但是我想把自己对回文树的理解写一下。
首先回文树是两个树,每个节点都是一个回文串。先说节点吧,节点是一个回文子串,但是不记录整个回文子串,而是记录回文串的长度,和两个指针
next指针,和fail指针。这是最基础的,当然我们可以在节点上再增加别的信息。
next指针一个二维数组,next [ i ] [ j ] ,指向的是第i个节点在两端加上 j 对应的字符形成的回文串节点。next指针也是回文树主要支架,回文树是两棵树。每棵树节点之间都是next指针连接起来,这个和字典树相似。那么fail指针,是一个数组,指向的是该节点回文串中的最长后缀回文串的节点,fail指针式连接两棵树的边,相当于两棵树之间有很多边相互连接,同一棵树上也是有fail将两个节点连接起来的。
下图实线就是next指针,虚线是fail指针
一直说回文树是两棵树,两棵树的区别是,一棵树的节点是长度为偶数的回文串,另一棵树是长度为奇数的回文串。一开始会建立长度是0的节点和长度是-1的节点。长度为0就表示是偶回文串的树的根节点,而长度为-1就表示奇回文树的根节。
这是字符串aaba形成的回文树,aaba中包含四种回文串,a,b,aba,是长度为奇数的回文串,aa,是长度为偶数的回文串,a是aa的最长后缀回文子串,也是aba的最长后缀回文子串。实线是形成两棵树的基础,而虚线则是穿插在两棵树之间的桥梁
下面给出回文树的模板,再具体分析:
struct Tree { int next[MAX+5][26];//next指针 int num[MAX+5];//当前节点表示回文串中的后缀子回文串的数目 int cnt[MAX+5];//当前节点表示回文串的个数 int fail[MAX+5];//fail指针 int len[MAX+5];//当前节点表示回文串的长度 int s[MAX+5];//储存字符串 int p;//节点个数 int last;//最后一个节点 int n;//字符串长度 int new_node(int x) { memset(next[p],0,sizeof(next[p])); cnt[p]=0; num[p]=0; len[p]=x; return p++; } void init() { p=0; new_node(0); new_node(-1); last=0; n=0; s[0]=-1; fail[0]=1; } int get_fail(int x) { while(s[n-len[x]-1]!=s[n]) x=fail[x]; return x; } int add(int x) { x-='a'; s[++n]=x; int cur=get_fail(last); if(!(last=next[cur][x])) { int now=new_node(len[cur]+2); fail[now]=next[get_fail(fail[cur])][x]; next[cur][x]=now; num[now]=num[fail[now]]+1; last=now; return 1; } cnt[last]++; return 0; } void count() { for(int i=p-1;i>=0;p++) cnt[fail[i]]+=cnt[i]; } }tree;
如何构造回文树就不赘述了。这里我们分析这种网络上大量普及的模板可以做到哪些功能?
1,字符串中本质不同的回文串的种数。
这里p就是节点个数,也代表不同回文串的种数,每个节点代表的回文串都是独一无二的。
2,字符串中每个本质不同的回文串的个数 即cnt数组。
3,字符串中以某个点为结束或者开始形成的回文串的个数。
4,字符串中回文串总数。
第三个功能,某个点为结束,是通过num数组实现的,每次插入一个字符的时候,要么形成新的回文串要么形成旧的回文串,总之,在插入的时候返回num[last]就可以了。如果以某个点为开始,把字符串倒着输入就可以了
第四个功能就是第一个和第二个结合起来,当然也可以通过第三个稍加计算也可以得出来。
这些是基本的功能,了解这些就可以做一些比较基础的回文串的题目。但是作为ACMer,我们不能止步于这么简单的内容!
下面给出一些比较难的情况:
1,字符串不是从左往右依次给你的,它是一个可以在两头加的不断延长的字符,可以在前面加,也可有在后面加。这个时候应该怎么处理?
首先s数组应该是可以从两边加的,所以s数组设成字符串长度的2倍,那么一开始我们是在中间的,由于要在两边加入字符串,所以我们应该设置两个last指针
表示左边最后一个节点,和右边最后一个节点。那么也要设置两个边界,字符串的边界,表示从中间,左边的字符串长度,右边的字符串长度。这样的话就可以在两边加上字符串。但是你会发现一个问题,当在左边加入一个字符的时候,有可能连着右边的最后一个字符形成一个整的的回文串,那么对于右边而言last就要变了,就要变成整的回文串,所以要进行特判!
2,如果可以删除字符串怎么办?字符串可以加入,也可以删除字符串,当然从结尾开始删
如果加入字符形成了一个新的节点,那么要把该节点删除,即p- -。同时这个字符也形成了指向自己的next指针要把next指针删掉。
如果没有形成新的节点,只需要n- - 就好了,
3,如果现在回文树不是对一个字符串操作,而是要你对两个字符串操作,应该怎么办?
建立两棵回文树?,但是如果要你比较两个字符串有多少公共的回文串子串,两棵树的节点一一比较吗?显然超时。所以在一棵树上进行操作。在插入第一个字符串的时候,我们不用担心,可是插入第二个字符串,肯定会被前面的字符干扰啊。这个时候我们有两种解决办法:
1,可以在两个字符串之间插入2个两个字符串都没有出现过的字符,这样插入第二个字符串的时候肯定不会和第一个字符串形成回文串。
2,插入完第二个字符串的时候,把
last=0; s[0]=-1; fail[0]=1; n=0;
建立新的数组num,cnt 表示第二个字符串的相关信息。