#include <iostream> #include <cstdio> #include <cstring> using namespace std; char s1[1000002],s2[1000003]; int kmp[1000002]; int len1,len2,j; int main(){ cin>>s1+1; cin>>s2+1; len1=strlen(s1+1); len2=strlen(s2+1); for(int i=2;i<=len2;i++){ while(j>0&&s2[i]!=s2[j+1]) j=kmp[j]; if(s2[i]==s2[j+1]) j++; kmp[i]=j; } j=0; for(int i=1;i<=len1;i++){ while(j>0&&s1[i]!=s2[j+1]) j=kmp[j]; if(s2[j+1]==s1[i]) j++; if(j==len2){ printf("%d ",i-len2+1); j=kmp[j]; } } for(int i=1;i<=len2;i++){ printf("%d ",kmp[i]); } return 0; }
这个,真的是啊,emmmmm,可能是我太笨了吧,看了半天勉强懂了一点点。
大体的(具体的)思想小姐姐的博客里有讲的很详细啦,这里就不再写了(其实是偷懒
但是有一个地方就是子串的自我匹配我一直都不懂,找了好久发现很多人都是一笔带过没有仔细说(或许是因为太简单了
j==0时是指的已经出边界了,因为kmp数组有为0的所以要提一下,
j其实相当于一个分界线
如aabaabc
i=2,j=0 while跳过,if成立,j->1,kmp【2】=1;
i=3,j=1 while成立 {j->0} if不成立,kmp【3】=0;
i=4,j=0 while跳过,if成立,j->1,kmp【4】=1;
i=5,j=1 while跳过,if成立,j->2,kmp【5】=2;
i=6,j=2 while跳过,if成立,j->3,kmp【6】=3;
i=7,j=3 while成立{j=kmp【3】=0},if不成立,kmp【7】=0;
可以看出,j为前缀,i为以i为结束的子串。如果kmp【i-1】!=0,说明从i-1往前的kmp【i-1】个已经与从头往后的j个合上了(因为j一直记录最新一个i从头往后的最大可匹配数),那么,第i个只需要与j+1个看看能不能合上,如果可以就愉快的继续下一个i了(如i=5时就是从i=4时继承过来的),
不可以的话,这个例子不好,我们再举一个例子
ABCDABCDABCE
现在我们来求 E 的kmp值
ABCDABCDABCE q1
ABCDABCDABCE q2
求 E 时,j=6了已经,但j+1与i为E不匹配,这时肉眼可见我们应该从ABC开始找
ABCDABCDABCE q3
ABCDABCDABCE q4
kmp【12】<7,此时往前找最大可能(此时还未将此可能证实是否可行,即未实现j+1与i的if匹配)
求从i-1往前和从1往后的最大前后缀重合,别忘了此时q1与q2已经重合并且=7-1,那不就是求kmp【j】么。
接下来相似,一轮一轮往前翻就好了。
另:这个做法的确不好理解,建议换一种写法
给个好理解的dalao的博客