[算法模版]子序列DP

zoukankan html css js c++ java

[算法模版]子序列DP
[算法模版]子序列DP

如何求本质不同子序列个数？

朴素DP

复杂度为(O(nq))。其中(q)为字符集大小。

(dp[i])代表以第(i)个数结尾的本质不同子序列个数。注意，这里对于每一个字符，只计算上一个相同字符带来的贡献。如果全部计算的话会算重复。

最后统计答案的时候也只统计每个字符最后一次出现的位置的答案。

例题：【线上训练13】子序列中的50分部分分
```
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
const int maxn=2e6+100,mod=998244353;
typedef long long ll;
char s[2][maxn],ori[maxn];
int n,len=1;
int last[30];
ll dp[maxn];
void init() {
    scanf("%s",ori+1);
    s[1][1]=ori[1];
    for(int i=2;i<=n;i++) {
        int md=i&1;
        for(int j=1;j<=len;j++) {
            s[md][2*j-1]=ori[i];
            s[md][2*j]=s[md^1][j];
        }
        s[md][2*len+1]=ori[i];
        len=2*len+1;
    }
}
int main() {
    scanf("%d",&n);
    init();
    scanf("%s",s[n&1]+1);len=strlen(s[n&1]+1);
    for(int i=1;i<=len;i++) {
        int ty=s[n&1][i]-'a';
        dp[i]=1;
        for(int j=0;j<26;j++) {
            if(last[j]){
                dp[i]+=dp[last[j]];
            }
        }
        dp[i]%=mod;
        last[ty]=i;
    }
    ll ans=0;
    for(int i=0;i<26;i++) {
        if(last[i])ans+=dp[last[i]];
        ans%=mod;
    }
    ans%=mod;
    printf("%lld",ans);
}
```
优化DP

我们令(f[i]=sum_{j=1}^q dp[last[c[j]]])。其中(q)为字符集大小，(c)字符集。

转移的时候有两种情况：
1. 当前字符未出现过（第一个）。那么令(dp[i]=f[i-1]+1)，则(f[i]=2 imes f[i-1]+1)。
2. 当前字符在原来出现过。那么令(dp[i]=f[i-1]+1)。因为只记录最后一次，所以在给(f)加上这一次的(dp)值之后还要删去上一次的(dp)值。(f[i]=2 imes f[i-1]-dp[last[i]]+1)。因为(dp[last[i]]=f[last[i]-1]+1)，所以(f[i]=2 imes f[i-1]-f[last[i]-1])
其实本质就是利用子序列DP每次增加的都是(sum dp[每一个字符])这个特性，每次转移将(sum dp[每一个字符])用(O(1))复杂度起来，做到(O(1))的转移。

算法复杂度(O(n))

例题：FZU-2129
```
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
using namespace std;
int n,a[1000500],f[1000500],last[1000500],ans=0;
const int mod=1e9+7;
int main() {
    ios::sync_with_stdio(0);
    while(cin>>n) {
        for(int i=1;i<=n;i++)cin>>a[i];ans=0;
        memset(f,0,sizeof(f));memset(last,0,sizeof(last));
        for(int i=1;i<=n;i++) {
            if(!last[a[i]])f[i]=(2ll*f[i-1]+1)%mod;
            else f[i]=(2ll*f[i-1]-f[last[a[i]]-1])%mod;
            last[a[i]]=i;
        }
        ans=(f[n]%mod+mod)%mod;
        cout<<ans<<endl;
    }
    return 0;
}
```
矩阵优化

我们可以发现，朴素DP的DP状态可以写成矩阵形式：

[egin{bmatrix}dp[i][a] \ dp[i][b] \ dp[i][c] \ ... \ ... \ ... \ dp[i][z] \1 end{bmatrix} ]
这里我们为了方便的进行矩阵转移添加了一维，(dp[i][c])指对于前(i)个字符，最后一个字符是(c)的子序列个数。

那么字符串第(i)位的字符(s[i])的状态可以这样转移：(dp[i][s[i]]=sum dp[i-1][任意字符]+1)。

其他情况这样转移：(dp[i][c]=dp[i-1][c])

我们发现这样的转移是可以构造出转移矩阵的。那么对于字符"c"的转移矩阵应该是这样的：

[egin{bmatrix} 1&0 &0 &0 &0 &0 &0 &0\ 0&1 &0 &0 &0 &0 &0 &0\ 1&1 &1 &1 &1 &1 &1 &1\ 0&0 &0 &1 &0 &0 &0 &0\ 0&0 &0 &0 &1 &0 &0 &0\ 0&0 &0 &0 &0 &1 &0 &0\ &&&...\ 0&0 &0 &0 &0 &0 &0 &1 end{bmatrix} ]
就是在单位矩阵上，将字符"c"对应的那一行（第三行）全部设置为1。

转移矩阵的最后一列比较特殊，我们使用最后一列来达到“+1”的效果。

构造出每个字符对应的转移矩阵后。我们每次只需要把状态矩阵乘上第(i)个字符(s[i])的转移矩阵，就能得到新的转移矩阵。

普通情况下的合并子序列状态

上面这个矩阵最主要的作用就是拿来合并两个字符串的子序列状态。因为一个子序列状态是一个状态矩阵乘上所有转移矩阵的乘积。所以如果我们分别知道字符串(s)和(t)的转移矩阵乘积，我们就能轻松的得出(st)的转移矩阵乘积，从而得到字符串(st)的本质不同子序列个数。

但是这样显然是亏本的。一次合并的复杂度为(O(len imes q^3))。其中(q)为字符集大小。直接(O(n))DP一次不知道比它高到哪里去了。

特殊情况下的合并子序列状态

但是这种矩阵合并还是有一些用处的。当新的序列出现某种规律时（例如新串=旧串*2），我们就可以“重复使用”这个矩阵。显然是赚了的。
查看全文

相关阅读:
用SQL语句实现：当A列大于B列时选择A列否则选择B列，当B列大于C列时选择B列否则选择C列。
用一条SQL语句显示所有可能的比赛组合
 查询表A中存在ID重复三次以上的记录
 统计numpy数组中最频繁出现的值
 有两个表A和B，均有key和value两个字段，如果B的key在A中也有，就把B的value替换为A中对应的value
距离和相似度
 NumPy 中的集合运算
 模式识别、机器学习傻傻分不清？给我三分钟！
NTP服务器方案介绍
 NTP网络时钟原理及应用

原文地址：https://www.cnblogs.com/GavinZheng/p/11777231.html

[算法模版]子序列DP

[算法模版]子序列DP

朴素DP

优化DP

矩阵优化

普通情况下的合并子序列状态

特殊情况下的合并子序列状态