Bzoj3942 Censoring(KMP)

zoukankan html css js c++ java

Bzoj3942 Censoring(KMP)
$KMP$问题的核心在于数组$next$(或者$pre$/$fail$，各种叫法)，几乎所有的此类型题都是需要计算$next$的。

这里解释一波$next$:即满足字符子串$s[1...k]=s[j-k+1...j]$的最大$k$。比如说：

字符串$abaca$的$next[5]$就是$1$，因为只有$s[1]=s[5]$。

而字符串$abcab$的$next[5]$就是2，同理，$s[1...2]=s[4...5]$。

弄清楚了这一点，来看题目，显然，这道题的难点在于删除字符后有可能对前面已经匹配完了的字符产生新一次的匹配，因为后面新加入的字符可能对前面的字符有贡献。

既然这样，我们不妨设一下四个变量:$i,j,k,l$（所有字符串从$0$开始）。

其中$i,l$表示当前需要将$S_i$加入到$U_l$中，$j$表示当前匹配到了$T_j$，$k$表示当前已经匹配到$U_k$。
- 如果当$k==l$时，代表前$k-1$个字符已经匹配完，添加新字符。
- 接下来就是调整$next$和判断是否匹配，同普通$KMP$算法。
- ！！重点：当$j==lenT$即已经匹配完了，则将$j$归零，将$l$减去$lenT$示删去了$lenT$个字符，因为$l$就是新串的长度，接下来，我们直接将$k$减去$lenT imes 2$因为前面最多会有$lenT-1$个字符与$T$匹配，特判一下当$k<0$时将$k$置为$0$就可以了。
```
#include <cstdio>
#include <cstring>

const int Len = 1e6 + 10;
char S[Len], T[Len], U[Len];
int lenS, lenT, nxt[Len];

void init () {
	for (int i = 1, j = 0; i < lenT; ++i) {
		while (j && T[i] != T[j]) j = nxt[j];
		j += (T[i] == T[j]), nxt[i + 1] = j;
	}
} 

int main () {
	scanf ("%s%s", S, T);
	lenS = strlen (S), lenT = strlen(T);
	init ();
	int l = 0, k = 0, i = 0, j = 0;
	while (i < lenS) {
		if (k == l)	U[l++] = S[i++];
		while (j && U[k] != T[j]) j = nxt[j];
		j += (U[k] == T[j]);
		if (j == lenT) {
			j = 0, l -= lenT;
			k -= lenT << 1;
		}
		if (k < 0) k = 0;
		else ++k;
	}
	for (int i = 0; i < l; ++i)
		putchar (U[i]);
	return 0;
} 
```
查看全文

相关阅读:
无锁队列的实现 | 酷壳 CoolShell.cn
简明 Vim 练级攻略 | 酷壳 CoolShell.cn
分享：lucene 的评分机制
 JS实现面向对象的设计
 EF架构~性能高效的批量操作(Update篇）
将不确定变为确定~transactionscope何时提升为分布式事务？
将不确定变为确定~Linq to SQL不能随机排序吗？
vs2012~ 开发人员的福音
 白领职场必懂的22条潜规则（转载）
经典面试题（转载）

原文地址：https://www.cnblogs.com/water-mi/p/9690874.html