题目链接:
题目分析:
期望dp
对于这类期望dp,正着推过去总觉得有点别扭,很多时候我们采用反推的做法,设(f[i][j])表示当前抽到了(i)张红,(j)张黑之后最优策略得到的钱的期望,则容易有转移方程:
$ f[i][j] =(f[i - 1][j] + 1) * frac{i}{i + j} + (f[i][j - 1] - 1) * frac{j}{i + j} $
即分别计算这次抽到红还是黑的期望并加在一起,注意如果期望已经为负则直接结束游戏,期望置为0。
最后输出是直接去掉后面位而非四舍五入,可以乘上一个(1e6)并(floor)即可。
注意空间限制,使用滚动数组滚一维来优化。
代码:
#include<bits/stdc++.h>
using namespace std;
inline int read() {
int cnt = 0, f = 1; char c = getchar();
while (!isdigit(c)) {if (c == '-') f = -f; c = getchar();}
while (isdigit(c)) {cnt = (cnt << 3) + (cnt << 1) + c - '0'; c = getchar();}
return cnt * f;
}
int R, B;
double f[10][5005];
signed main(){
R = read(); B = read();
f[0][0] = 0, f[1][0] = 1, f[0][1] = 0, f[1][1] = 0;
for (register int i = 1; i <= R; i++) {
f[i % 2][0] = i;
for (register int j = 1; j <= B; j++) {
f[i % 2][j] = (f[(i - 1) % 2][j] + 1) * i / (i + j) + (f[i % 2][j - 1] - 1) * j / (i + j);
if (f[i % 2][j] - 0 < -0.000001) f[i % 2][j] = 0;
}
}
printf("%.6lf", floor(f[R % 2][B] * 1000000) / 1000000);
return 0;
}