zoukankan      html  css  js  c++  java
  • 简单题[期望DP]

    也许更好的阅读体验
    (mathcal{Description})
    桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
    (mathcal{Solution})

    (f[i][j])表示有(i)张红牌,(j)张黑牌的期望收益
    考虑翻一张牌,有两种情况

    1. (frac{i}{i+j})的概率翻到红牌,此后就只有(i-1)张红牌,(j)张黑牌
    2. (frac{j}{i+j})的概率翻到黑牌,此后就只有(i)张红牌,(j-1)张黑牌

    需要注意的是,不要忘了翻开的牌的贡献
    翻开一张牌后,该颜色牌数目就少了一张

    所以有
    (f[i][j]=frac{i}{i+j}(f[i-1][j]+1)+frac{j}{i+j}(f[i][j-1]-1))
    由于是最优策略,所以咱是不可能赔钱的
    (f[i][j]=max(0,frac{i}{i+j}(f[i-1][j]+1)+frac{j}{i+j}(f[i][j-1]-1)))

    初值(f[0][1]=0,f[1][0]=1),答案为(f[R][B])
    应正向循环

    本篇博客亦被收进期望总结

    如有哪里讲得不是很明白或是有错误,欢迎指正
    如您喜欢的话不妨点个赞收藏一下吧

  • 相关阅读:
    nyoj58 最少步数
    oj2787 算24
    一位ACMer过来人的心得
    hdu递推公式水题
    nyoj20 吝啬的国度
    hdu1421 搬寝室
    全排列生成算法:next_permutation
    hdu2544 最短路
    poj1691 Painting A Board
    hdu1274 展开字符串
  • 原文地址:https://www.cnblogs.com/Morning-Glory/p/11226477.html
Copyright © 2011-2022 走看看