(\)
Description
桌面上有 (R) 张红牌和 (B) 张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌。
翻到红牌得到 (1$),黑牌则付出(1$)。可以随时停止翻牌,在最优策略下平均能得到多少钱。
- (R,Ble 5000)
(\)
Solution
期望水题。
所谓最优策略也就是不会使得得到的钱为负数,转移的时候和 (0) 取 (max) 就是了。
注意,由于是牌序随机,所以最后答案必须是全部牌的得分期望。
设 (f[i][j]) 表示拿了 (i) 张红牌, (j) 张黑牌的期望得钱数。
[f[i][j]=maxigg(0,frac i{(i+j)} imes(f[i-1][j]+1)+frac{j}{(i+j)} imes (f[i][j-1]-1))igg)
]
(\)
Code
#include<cmath>
#include<cstdio>
#include<cctype>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
#define N 5010
#define R register
#define gc getchar
using namespace std;
typedef long long ll;
int n,m;
double f[2][N];
int main(){
scanf("%d%d",&n,&m);
for(R int i=0,now=0;i<=n;++i,now^=1,f[now][0]=(double)i){
for(R int j=1;j<=m;++j)
f[now][j]=max(0.0,(double)i/(double)(i+j)*(f[now^1][j]+1)+(double)j/(double)(i+j)*(f[now][j-1]-1));
}
ll ans=f[n&1][m]*1000000;
printf("%lf",(double)ans/1000000);
return 0;
}