题目链接:戳我
我们设(dp[i][j])表示第1次-第i-1次取的宝物的集合为j的时候,第i次到第k次的最大期望得分。
然后我们可以逆着递推。
如果当前取到的宝物集合包括了要取的宝物的前提集合,那么我们有两种选择方式——一种取,一种不取。
状态转移方程是(dp[i][j]=max(dp[i+1][j],dp[i+1][j|(1<<k-1)]))
如果没有包括,那么只能不选了。
为什么不能设(dp[i][j])为第1-i次取的宝物集合为j,第1次到第i次的最大期望得分?
原因大家可以考虑一下,因为我们不能保证第(i)次一定能取到(j),所以转移的时候,我们不能保证从一个合法的状态转移过来QAQ
代码如下:
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
int K,n;
int w[110],pre[110];
double dp[110][40000];
int main()
{
#ifndef ONLINE_JUDGE
freopen("ce.in","r",stdin);
#endif
scanf("%d%d",&K,&n);
for(int i=1;i<=n;i++)
{
int x;
scanf("%d",&w[i]);
while(scanf("%d",&x)!=0&&x)
pre[i]|=(1<<(x-1));
}
for(int i=K;i>=1;i--)
for(int j=0;j<(1<<n);j++)
{
for(int k=1;k<=n;k++)
{
if((j&pre[k])==pre[k])
dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<k-1)]+w[k]);
else dp[i][j]+=dp[i+1][j];
}
dp[i][j]/=n;
}
printf("%.6lf
",dp[1][0]);
return 0;
}
还有一点,很早的时候就听大佬们说期望DP是逆推的,概率DP是顺推的。。。之后感觉也不完全如此,所以就很懵了。。。但是这个题也算是有一些启发吧。