P3375 【模板】KMP字符串匹配

zoukankan html css js c++ java

P3375 【模板】KMP字符串匹配
题目描述

如题，给出两个字符串s1和s2，其中s2为s1的子串，求出s2在s1中所有出现的位置。

为了减少骗分的情况，接下来还要输出子串的前缀数组next。

（如果你不知道这是什么意思也不要问，去百度搜[kmp算法]学习一下就知道了。）

输入输出格式

输入格式：

第一行为一个字符串，即为s1

第二行为一个字符串，即为s2

输出格式：

若干行，每行包含一个整数，表示s2在s1中出现的位置

接下来1行，包括length(s2)个整数，表示前缀数组next[i]的值。

输入输出样例
输入样例#1：

ABABABC ABA
输出样例#1：

1 3 0 0 1
说明

时空限制：1000ms,128M

数据规模

设s1长度为N，s2长度为M

对于30%的数据：N<=15，M<=5

对于70%的数据：N<=10000，M<=100

对于100%的数据：N<=1000000，M<=1000000

样例说明：

所以两个匹配位置为1和3，输出1、3

解析：

本来还想用暴力算法去做这道题，结果看到这个玄学的防骗分方式后，果断选择花两个小时学习KMP，顺便orz%%%了SRY大佬~~~

KMP基本思想：
比如，在简单的一次匹配失败后，我们会想将模式串尽量的右移和主串进行匹配。右移的距离在KMP算法中是如此计算的：在已经匹配的模式串子串中，找出最长的相同的前缀和后缀，然后移动使它们重叠。（摘自百度百科）

之后我们就可以开心的开始敲代码辣~~~首先我们要考虑的是如何找到最长的相同前缀后缀，最朴素的算法是O(n²)(n为模式串长度（等待匹配的串A为文本串，进行匹配的串B为模式串）)

我们来想一想如何优化：首先，在算P[i]之前(p[i]代表模式串前i位字符最长相同前缀后缀)，我们已知的是p[0...i-1]；我们可以用递推的方法去求解。

和一般的递推方法不同的是，这个递推并没有固定的递推式，网上有许多人说是“自己匹配自己”，而我并不这么认为。。。蒟蒻和大佬的思维果然不一样，再次orz%%%

举一个简单的栗子~：abaa，p[1]=0,p[2]=0,p[3]=1,下面我们重点看一下如何算p[4]；由于前边第一个a和第三个a已经匹配成功，如果2个字符和当前字符可以匹配的话，那么直接加上1就好了；

重点在于不能匹配的情况，这也是本蒟蒻学习KMP最大的障碍。匹配失败，证明当前的前缀后缀位数太多了，匹配不上，所以我们要减小前缀的数目，所以我们要在这个前缀里再找前后缀，看到p[1]=0,所以我们直接看第1个和当前字符能不能匹配即可。发现匹配成功，于是乎p[4]=1；推广到一般情况：设正在计算第i号字符对应的p[i]值，先去找前i-1个字符的最长相同前后缀（p[i-1]），设p[i-1]=j,然后如果b[j+1]==b[i],则p[i]=j+1;否则顺着失配边走，走到可以匹配或者确定无法匹配位置，对应着下面这段代码：
1 for(int i=2;i<=m;i++) 2 { 3 while(j>0&&b[i]!=b[j+1])j=p[j];//好好体会这个while循环，失配的精髓。 4 if(b[i]==b[j+1])j++; 5 p[i]=j; 6 }

View Code
预处理完p数组后，我们就可以开始正式匹配了，结合百度百科的基本思想可以体会到，KMP之所以会省时间，是因为它实际上是一个动态选取最优值的过程，它很好地利用了前缀的性质，没有无用功。

当不可以匹配的时候，朴素算法是右移一位，而KMP能移多少移多少，也就是所谓的自我匹配。

最后上AC代码：
1 #include<iostream> 2 #include<cstring> 3 using namespace std; 4 char a[1000010],b[1000010]; 5 int n,m,p[1000010],j; 6 int main() 7 { 8 cin>>a+1; 9 cin>>b+1; 10 n=strlen(a+1); 11 m=strlen(b+1); 12 for(int i=2;i<=m;i++) 13 { 14 while(j>0&&b[i]!=b[j+1])j=p[j]; 15 if(b[i]==b[j+1])j++; 16 p[i]=j; 17 } 18 j=0; 19 for(int i=1;i<=n;i++) 20 { 21 while(j>0&&a[i]!=b[j+1])j=p[j];//失配 22 if(a[i]==b[j+1])j++; 23 if(j==m) 24 { 25 cout<<i-m+1<<endl; 26 j=p[j];//继续匹配 27 } 28 } 29 for(int i=1;i<=m;i++) 30 { 31 cout<<p[i]<<" "; 32 } 33 return 0; 34 }

View Code
　　
查看全文

相关阅读:
javascript箭头函数把函数给简写了[0403]
BootStrap实现左侧或右侧竖式tab选项卡
 对回调函数的理解
 全屏滚动插件之 fullpage.js
网页的缩放，适配以及移动的适配！
Vue组件通信（传值）
深入理解ES6之迭代器与生成器
 用css完成根据子元素不同书写样式
 简书上写博客感觉更爽点
 自定义View系列教程03--onLayout源码详尽分析

原文地址：https://www.cnblogs.com/szmssf/p/10840741.html

P3375 【模板】KMP字符串匹配

题目描述

输入输出格式

输入输出样例

数据规模

解析：

最后上AC代码：