zoukankan      html  css  js  c++  java
  • 洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王 题解【期望】【DP】

    ???看不懂的期望DP

    题目描述

    小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。

    他决定,在脱坑之前,最后再来打一盘亚瑟王。既然是最后一战,就一定要打得漂亮。众所周知,亚瑟王是一个看脸的游戏,技能的发动都是看概率的。作为一个非洲人,同时作为一个前 OIer,小 K 自然是希望最大化造成伤害的期望值。但他已经多年没写过代码,连 Spaly 都敲不对了,因此,希望你能帮帮小 K,让他感受一下当欧洲人是怎样的体验。

    本题中我们将考虑游戏的一个简化版模型。

    玩家有一套卡牌,共 (n) 张。游戏时,玩家将 (n) 张卡牌排列成某种顺序,排列后将卡牌按从前往后依次编号为 (1sim n)。本题中,顺序已经确定,即为输入的顺序。

    每张卡牌都有一个技能。第 (i) 张卡牌的技能发动概率为 (p_i),如果成功发动,则会对敌方造成 (d_i) 点伤害。也只有通过发动技能,卡牌才能对敌方造成伤害。基于现实因素以及小 K 非洲血统的考虑,(p_i) 不会为 0,也不会为 1,即 (0<p_i<1)

    一局游戏一共有 (r) 轮。在每一轮中,系统将从第一张卡牌开始,按照顺序依次考虑每张卡牌。在一轮中,对于依次考虑的每一张卡牌:

    1. 如果这张卡牌在这一局游戏中已经发动过技能,则
      1.1 如果这张卡牌不是最后一张,则跳过之(考虑下一张卡牌); 否则(是最后一张),结束这一轮游戏。
    2. 否则(这张卡牌在这一局游戏中没有发动过技能),设这张卡牌为第 (i) 张。
      2.1 将其以 (p_i) 的概率发动技能。
      2.2 如果技能发动,则对敌方造成 (d_i) 点伤害,并结束这一轮。
      2.3 如果这张卡牌已经是最后一张(即 (i) 等于 (n)),则结束这一轮;否则,考虑下一张卡牌。

    请帮助小 K 求出这一套卡牌在一局游戏中能造成的伤害的期望值。

    输入格式

    输入文件的第一行包含一个整数 (T),代表测试数据组数。

    接下来一共 (T) 组数据。

    每组数据的第一行包含两个用空格分开的整数 (n)(r),分别代表卡牌的张数和游戏的轮数。

    接下来 (n) 行,每行包含一个实数和一个整数,由空格隔开,描述一张卡牌。第 (i) 行的两个数为 (p_i)​ 和 (d_i)​,分别代表第 (i) 张卡牌技能发动的概率(实数)和技能发动造成的伤害(整数)。保证 (p_i)​ 最多包含四位小数,且为一个合法的概率。

    输出格式

    对于每组数据,输出一行,包含一个实数,为这套卡牌在这一局游戏中造成的伤害的期望值。

    对于每一行输出,只有当你的输出和标准答案的相对误差不超过 (10^{-8}​) 时——即 (frac{|a-o|}{a}le 10^{-8}​) 时 (其中 (a​) 是标准答案,(o​) 是输出),你的输出才会被判为正确。建议输出十位小数。

    输入输出样例

    输入样例:

    1 
    3 2 
    0.5000 2 
    0.3000 3 
    0.9000 1
    

    输出样例:

    3.2660250000
    

    样例解释:

    一共有 (13) 种可能的情况:

    1. 第一轮中,第 (1) 张卡牌发动技能;第二轮中,第 (2) 张卡牌发动技能;概率为 ​(0.15),伤害为 (5)
    2. 第一轮中,第 (1) 张卡牌发动技能;第二轮中,第 (3) 张卡牌发动技能;概率为 (0.315),伤害为 (3)
    3. 第一轮中,第 (1) 张卡牌发动技能;第二轮不发动技能;概率为 (0.035),伤害为 (2)
    4. 第一轮中,第 (2) 张卡牌发动技能;第二轮中,第 (1) 张卡牌发动技能;概率为 (0.075),伤害为 (5)
    5. 第一轮中,第 (2) 张卡牌发动技能;第二轮中,第 (3) 张卡牌发动技能;概率为 (0.0675),伤害为 (4)
    6. 第一轮中,第 (2) 张卡牌发动技能;第二轮不发动技能; 概率为 (0.0075),伤害为 (3)
    7. 第一轮中,第 (3) 张卡牌发动技能;第二轮中,第 (1) 张卡牌发动技能;概率为 (0.1575),伤害为 (3)
    8. 第一轮中,第 (3) 张卡牌发动技能;第二轮中,第 (2) 张卡牌发动技能;概率为 (0.04725),伤害为 (4)
    9. 第一轮中,第 (3) 张卡牌发动技能;第二轮不发动技能; 概率为 (0.11025),伤害为 (1)
    10. 第一轮不发动技能;第二轮中,第 (1) 张卡牌发动技能; 概率为 (0.0175),伤害为 (2)
    11. 第一轮不发动技能;第二轮中,第 (2) 张卡牌发动技能; 概率为 (0.00525),伤害为 (3)
    12. 第一轮不发动技能;第二轮中,第 (3) 张卡牌发动技能; 概率为 (0.011025),伤害为 (1)
    13. 第一轮不发动技能;第二轮亦不发动技能; 概率为 (0.001225),伤害为 (0)

    造成伤害的期望值为概率与对应伤害乘积之和,为 (3.266025)

    数据范围与约定

    对于所有测试数据, (1le Tle 444, 1le nle 220, 0le rle 132, 0<p_i<1, 0le d_ile 1000)

    除非备注中有特殊说明,数据中 (p_i)(d_i) 均为随机生成。

    请注意可能存在的实数精度问题,并采取适当措施。

    题解:

    首先,如果直接一轮一轮地进行期望推导,会发现前面有冲突的情况。枚举第 (i) 轮第 (j) 张卡时既要保证(i-1) 轮都没有发动过第 (j) 张卡,又要保证(i) 轮没有发动过前 (j-1) 张卡,再乘 (p_i) 算概率。但是这样怎么算都算不对,其实感觉也是一个“意识”调题的过程吧,反正最终把样例调到 (3.21​) 左右发现概率对不上(样例解释),于是还是放弃了。

    因此考虑建立无后效性的dp方程。因为需要满足 “如果发动了当前的卡”,那么就停止本轮,所以方程需要和前缀有关。令 (f[i][j]) 表示在所有的 (r) 轮里,前 (i) 张卡有 (j) 个发动了的概率。此时对于任意的第 (k) 张卡就可以用 (f[k-1]) 有关的数据推出来了。

    考虑状态转移方程,对于 (f[i][j]),可以从 (f[i-1][j-1])(f[i-1][j]) 推过来。当从 (f[i-1][j]) 推过来时,表示第 (i)整场都没有发动,因此 (f[i-1][j]) 的贡献为 (f[i-1][j] imes (1-p_i)^{r-j})

    其中 ((1-p_i)^{r-j}) 表示在全部 (r) 轮中,由于在前 (i-1) 个中钦定了 (j) 个,占用了 (j),剩下的 (r-j) 轮中每次都没有发动第 (i) 张卡。

    同时,为了便于理解,当我们dp做到 (f[i]) 时,如果认为第 (i) 张卡为此时的第一张卡,剩下的 (r-j) 轮里就只能选择下标为 ([i,n]) 的卡了。此时第 (i) 张卡的发动不受前 (i-1) 张的限制。

    当从 (f[i-1][j-1]) 推过来时(首先要满足 (j>0)),表示第 (i) 张被发动了,正难则反,被发动的概率就是用 (1) 减去没有被发动的概率。而没有被发动的概率在上文中被提到了,是 ((1-p_i)) 的幂。此时由于只钦定了 (j-1) 张卡发动,所以指数为 (r-j+1)。因此 (f[i-1][j-1]) 的贡献为 (f[i-1][j-1] imesleft(1-(1-p_i)^{r-j+1} ight))

    然后可以依次求出所有的 (f),此时我们再根据 (f) 推出每张卡被发动的概率 (P_i)

    仿照上面 (f[i-1][j-1] o f[i][j]) 的过程,我们可以直接算出

    [P_i=sum_{j=0}^{i-1}f[i-1][j] imes left(1-(1-p_i)^{r-j} ight) ]

    答案是对每个 (P_i) 乘上伤害值 (d_i)

    对每个 ((1-p_i)) 预处理幂后,时间复杂度为 (O(nTr))

    Code:

    #include<cstdio>
    #include<cstring>
    #define db double
    db f[233][233],p[233];
    db q[233][233];//q[i][j]表示(1-p[i])^j
    int d[233];
    int main()
    {
        int T;
        scanf("%d",&T);
        while(T--)
        {
            int n,r;
            scanf("%d%d",&n,&r);
            for(int i=1;i<=n;++i)
            {
                scanf("%lf%d",&p[i],&d[i]);
                q[i][0]=1;
                for(int j=1;j<=233;++j)
                    q[i][j]=q[i][j-1]*(1-p[i]);
            }
            f[0][0]=1;
            for(int i=1;i<=n;++i)
                for(int j=0;j<=i&&j<=r;++j)
                {
                    f[i][j]=j?f[i-1][j-1]*(1-q[i][r-j+1]):0;
                    f[i][j]+=f[i-1][j]*q[i][r-j];
                }
            db ans=0;
            for(int i=1;i<=n;++i)
                for(int j=0;j<i&&j<r;++j)
                    ans+=d[i]*(f[i-1][j]*(1-q[i][r-j]));
            printf("%.10lf
    ",ans);
        }
        return 0;
    }
    
  • 相关阅读:
    图论4-floyd
    。。。
    [LOJ10164]数字游戏
    KMP模板
    无向图割点模板
    tarjan有向图模板
    LCA倍增模板
    P2149 [SDOI2009]Elaxia的路线
    树的直径dp模板
    [暑假集训]Day4 T3 平板涂色
  • 原文地址:https://www.cnblogs.com/wjyyy/p/lg3239.html
Copyright © 2011-2022 走看看