P3375 【模板】KMP字符串匹配
题目描述
如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
输入输出格式
输入格式:第一行为一个字符串,即为s1(仅包含大写字母)
第二行为一个字符串,即为s2(仅包含大写字母)
输出格式:若干行,每行包含一个整数,表示s2在s1中出现的位置
接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。
输入输出样例
输入样例#1:
ABABABC ABA
输出样例#1:
1 3 0 0 1
说明
时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000
样例说明:
所以两个匹配位置为1和3,输出1、3
Solution
从matrix67的blog上学习了一下,
设要在A中找B,朴素的匹配方法就是从1 to len(A)每次copy一段len(B)长的和B比较
但是KMP定义了一个next数组
表示对于某个字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]
那么我们在朴素匹配失败时可以相当于把模式串往右移动next[i]可以了
具体见KMP算法详解-Matrix67: The Aha Moments
Codes
1 program wonder; 2 var 3 a,b:ansistring;//!!! 4 i,j,la,lb,tot:longint; 5 next:array[1..1000] of longint; 6 7 procedure iii(i:longint);//找到了 8 begin 9 writeln(i-lb+1); 10 j:=next[j]; 11 end; 12 13 begin 14 readln(a); 15 readln(b); 16 la:=length(a); 17 lb:=length(b); 18 19 next[1]:=0; 20 j:=0; 21 for i:= 2 to lb do 22 begin 23 while (j>0) and (b[i]<>b[j+1]) do j:=next[j]; 24 if b[i]=b[j+1] then j:=j+1; 25 next[i]:=j; 26 end; 27 28 j:=0; 29 for i:= 1 to la do 30 begin 31 while (j>0) and (a[i]<>b[j+1]) do j:=next[j]; 32 if a[i]=b[j+1] then inc(j); 33 if j=lb then iii(i); 34 end; 35 36 for i:= 1 to lb do write(next[i],' '); 37 end.