首先我们看一下简单的字符串匹配.
关于kmp算法,讲的最好的当属阮一峰的<字符串匹配的KMP算法>.一路读下来,豁然开朗.
事实上就是,对模式串p进行预处理,得到前后缀的部分匹配表,使得我们能够借助已知信息,算出能够右移多少位.即 kmp = 朴素匹配 + 移动多位.
很多其它细节请看阮一峰的文章,这里就不展开了.
以下给出python的代码实现.
你可以把文本字符串s固定,模式字符串p从s对齐的左边缘,作为承担部分完全一致,匹配成功,失败将是模式字符串p整体向右1地点,继续检查对齐部分,重复.
#朴素匹配 def naive_match(s, p): m = len(s); n = len(p) for i in range(m-n+1):#起始指针i if s[i:i+n] == p: return True return False
关于kmp算法,讲的最好的当属阮一峰的<字符串匹配的KMP算法>.一路读下来,豁然开朗.
事实上就是,对模式串p进行预处理,得到前后缀的部分匹配表,使得我们能够借助已知信息,算出能够右移多少位.即 kmp = 朴素匹配 + 移动多位.
很多其它细节请看阮一峰的文章,这里就不展开了.
以下给出python的代码实现.
#KMP def kmp_match(s, p): m = len(s); n = len(p) cur = 0#起始指针cur table = partial_table(p) while cur<=m-n: for i in range(n): if s[i+cur]!=p[i]: cur += max(i - table[i-1], 1)#有了部分匹配表,我们不仅仅是单纯的1位1位往右移,能够一次移动多位 break else: return True return False #部分匹配表 def partial_table(p): '''partial_table("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]''' prefix = set() postfix = set() ret = [0] for i in range(1,len(p)): prefix.add(p[:i]) postfix = {p[j:i+1] for j in range(1,i+1)} ret.append(len((prefix&postfix or {''}).pop())) return ret print naive_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD") print partial_table("ABCDABD") print kmp_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD")
版权声明:本文博客原创文章,博客,未经同意,不得转载。