- 作者:zifeiy
- 标签:状压DP,子集划分DP
题目链接:https://codeforces.com/contest/1238/problem/E
题目大意:
给你一个长度为 (n(n le 10^5)) 的字符串s和 (m(m le 20)) ,这个字符串由前 (m) 个小写字母组成。
现在你要找一个前 (m) 个字符的一个排列p,在这个排列p的基础上生成字符串s,并计算总代价。
代价的计算过程是:
比如我现在已经生成了字符串s的前i个字符 (s_{1..i}) ,现在我要生成第i+1个字符 (s_{i+1}) ,并且我假设 (s_i) 对应的字符是x,(s_{i+1}) 对应的字符是y,并且字符x在排列p中的位置是 (pos_x) ,字符y在排列p中的位置是 (pos_y) ,那么生成了字符 (s_{i+1}) 之后,总代价增加了 (| pos_x - pos_y |) 。
你需要找到所有排列方案中总代价最小的那个方案所对应的最小总代价。
题目分析:
首先可以看一下 官方题解:
官网的解释当中涉及到了一个“subset dynamic programming”,我粗略地将它翻译为“子集动态规划”,其实可以发现这道题目的1真的跟子集有一些练习。
同时它跟状态压缩也有一些关系。
我们用i来表示每一个状态((0 le i lt 2^m)),这个i其实对应成一个二进制数就是一个 m 位的二进制数,如果i的第j位为1就说明这个状态中已经放了第j个字符,否则就说明没有放第j个字符,那么我们就可以放第j个字符,也就是说:
通过状态 i
和字符 j
能够扩展出一个新的状态 i | (1<<j)
。
而且 j
放的位置也是确定的——我们可以用函数 __builtin_popcount(i)
来获取 i 的二进制表示种存在多少位为1。
然后我们这里我觉得最重要的一个点也是困扰了我很久的一个点是—— “如何消除位置的影响” 。
其实对于每一个状态 i
和字符 j
,如果想要从状态 i
转移到状态 i | (1<<j)
,并且我们假设 i
的二进制表示中有 c 位为1,那么我们其实可以发现,j所处的排列的位置是确定的,那就是 c (也可以是c+1,这个视你的初始坐标决定,我们这里就假设为c了)。
但是到目前为止我们还不能消除距离的影响。
我们可以枚举状态i里面的第k位:
- 如果状态i的第k位为1,那么也就是说字符k之前已经放在了状态i的某一个位置(我们假设是 (c_k)),
那么现在我们要在第c个位置放j(为了清晰起见,我们令 (c_j) 表示 c),
那么k和j的代价应该是 (cnt[j][k] imes (c_j - c_k)) ;(因为 (c_k lt c_j)) - 如果状态i的第k位为0,那么也就是说字符k还没有状态i的某一个位置(我们假设是 (c_k)),
那么现在我们要在第c个位置放j(为了清晰起见,我们令 (c_j) 表示 c),
那么k和j的代价应该是 (cnt[j][k] imes (c_k - c_j)) 。(因为 (c_j lt c_k))
所以,我们可以发现,如果我令 (f[i]) 表示i这个状态的最小总代价,
那么,当我们当前判断状态i和字符j的时候(并且我们假设i的第j位为0,因为此时我们可以将状态 i
加上字符 j
变到一个新的状态 i | (1<<j)
)。
我们一开始开一个变量 (tmp = f[i]) ,然后从 0 到 m-1 去遍历字符k:
- 如果k已经存在在状态i中,则 (tmp -= cnt[k][j] imes c) ;
- 如果k还没有存在在状态i中,则 (tmp += cnt[k][j] imes c) 。(这里的c就是之前所说的字符j放到状态i中的位置)
那么这样为什么消除了位置的影响呢?
我们假设现在放j的时候还没有放k,则我们的tmp变量减去了 (cnt[k][j] imes c_j) ,那么到之后去放k时候,我们的tmp变量还会加上 (cnt[k][j] imes c_k) ,而 (c_k - c_j) 其实就是它们的距离,这么一加一减就间接地处理了距离(这个点困惑了我好长时间,直到豁然开朗!)。
然后对于每一个状态i和字符j(要求状态i中的第j位为0),以及计算得到的tmp:
f[ i | (1<<j) ] = max(f[ i | (1<<j) ] , tmp);
实现代码如下:
#include <bits/stdc++.h>
using namespace std;
int n, m, f[(1<<20)], cnt[20][20];
string s;
int main() {
cin >> n >> m >> s;
for (int i = 1; i < n; i ++) {
int a = s[i-1] - 'a', b = s[i] - 'a';
if (a != b) {
cnt[a][b] ++;
cnt[b][a] ++;
}
}
fill(f+1, f+(1<<m), INT_MAX);
for (int i = 0; i < (1<<m)-1; i ++) {
int c = __builtin_popcount(i);
for (int j = 0; j < m; j ++) {
if ( !( i & (1<<j) ) ) {
int tmp = f[i];
for (int k = 0; k < m; k ++) {
if (i & (1<<k)) {
tmp += cnt[j][k] * c;
}
else { // 因为预处理cnt的时候保证cnt[x][x]==0
tmp -= cnt[j][k] * c;
}
}
f[ i | (1<<j) ] = min(f[i | (1<<j)], tmp);
}
}
}
cout << f[ (1<<m)-1 ] << endl;
return 0;
}