洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】

zoukankan html css js c++ java

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】
？？？看不懂的期望DP
题目描述

小 K 不慎被 LL 邪教洗脑了，洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。

他决定，在脱坑之前，最后再来打一盘亚瑟王。既然是最后一战，就一定要打得漂亮。众所周知，亚瑟王是一个看脸的游戏，技能的发动都是看概率的。作为一个非洲人，同时作为一个前 OIer，小 K 自然是希望最大化造成伤害的期望值。但他已经多年没写过代码，连 Spaly 都敲不对了，因此，希望你能帮帮小 K，让他感受一下当欧洲人是怎样的体验。

本题中我们将考虑游戏的一个简化版模型。

玩家有一套卡牌，共 (n) 张。游戏时，玩家将 (n) 张卡牌排列成某种顺序，排列后将卡牌按从前往后依次编号为 (1sim n)。本题中，顺序已经确定，即为输入的顺序。

每张卡牌都有一个技能。第 (i) 张卡牌的技能发动概率为 (p_i)，如果成功发动，则会对敌方造成 (d_i) 点伤害。也只有通过发动技能，卡牌才能对敌方造成伤害。基于现实因素以及小 K 非洲血统的考虑，(p_i) 不会为 0，也不会为 1，即 (0<p_i<1)。

一局游戏一共有 (r) 轮。在每一轮中，系统将从第一张卡牌开始，按照顺序依次考虑每张卡牌。在一轮中，对于依次考虑的每一张卡牌：

如果这张卡牌在这一局游戏中已经发动过技能，则
1.1 如果这张卡牌不是最后一张，则跳过之（考虑下一张卡牌）；否则（是最后一张），结束这一轮游戏。

否则（这张卡牌在这一局游戏中没有发动过技能），设这张卡牌为第 (i) 张。
2.1 将其以 (p_i) 的概率发动技能。
2.2 如果技能发动，则对敌方造成 (d_i) 点伤害，并结束这一轮。
2.3 如果这张卡牌已经是最后一张（即 (i) 等于 (n)），则结束这一轮；否则，考虑下一张卡牌。

请帮助小 K 求出这一套卡牌在一局游戏中能造成的伤害的期望值。

输入格式

输入文件的第一行包含一个整数 (T)，代表测试数据组数。

接下来一共 (T) 组数据。

每组数据的第一行包含两个用空格分开的整数 (n) 和 (r)，分别代表卡牌的张数和游戏的轮数。

接下来 (n) 行，每行包含一个实数和一个整数，由空格隔开，描述一张卡牌。第 (i) 行的两个数为 (p_i) 和 (d_i)，分别代表第 (i) 张卡牌技能发动的概率（实数）和技能发动造成的伤害（整数）。保证 (p_i) 最多包含四位小数，且为一个合法的概率。

输出格式

对于每组数据，输出一行，包含一个实数，为这套卡牌在这一局游戏中造成的伤害的期望值。

对于每一行输出，只有当你的输出和标准答案的相对误差不超过 (10^{-8}) 时——即 (frac{|a-o|}{a}le 10^{-8}) 时 (其中 (a) 是标准答案，(o) 是输出)，你的输出才会被判为正确。建议输出十位小数。

输入输出样例

输入样例：

1 3 2 0.5000 2 0.3000 3 0.9000 1

输出样例：

3.2660250000

样例解释：

一共有 (13) 种可能的情况：

第一轮中，第 (1) 张卡牌发动技能；第二轮中，第 (2) 张卡牌发动技能；概率为 (0.15)，伤害为 (5)。

第一轮中，第 (1) 张卡牌发动技能；第二轮中，第 (3) 张卡牌发动技能；概率为 (0.315)，伤害为 (3)。

第一轮中，第 (1) 张卡牌发动技能；第二轮不发动技能；概率为 (0.035)，伤害为 (2)。

第一轮中，第 (2) 张卡牌发动技能；第二轮中，第 (1) 张卡牌发动技能；概率为 (0.075)，伤害为 (5)。

第一轮中，第 (2) 张卡牌发动技能；第二轮中，第 (3) 张卡牌发动技能；概率为 (0.0675)，伤害为 (4)。

第一轮中，第 (2) 张卡牌发动技能；第二轮不发动技能；概率为 (0.0075)，伤害为 (3)。

第一轮中，第 (3) 张卡牌发动技能；第二轮中，第 (1) 张卡牌发动技能；概率为 (0.1575)，伤害为 (3)。

第一轮中，第 (3) 张卡牌发动技能；第二轮中，第 (2) 张卡牌发动技能；概率为 (0.04725)，伤害为 (4)。

第一轮中，第 (3) 张卡牌发动技能；第二轮不发动技能；概率为 (0.11025)，伤害为 (1)。

第一轮不发动技能；第二轮中，第 (1) 张卡牌发动技能；概率为 (0.0175)，伤害为 (2)。

第一轮不发动技能；第二轮中，第 (2) 张卡牌发动技能；概率为 (0.00525)，伤害为 (3)。

第一轮不发动技能；第二轮中，第 (3) 张卡牌发动技能；概率为 (0.011025)，伤害为 (1)。

第一轮不发动技能；第二轮亦不发动技能；概率为 (0.001225)，伤害为 (0)。

造成伤害的期望值为概率与对应伤害乘积之和，为 (3.266025)。

数据范围与约定

对于所有测试数据， (1le Tle 444, 1le nle 220, 0le rle 132, 0<p_i<1, 0le d_ile 1000)。

除非备注中有特殊说明，数据中 (p_i) 与 (d_i) 均为随机生成。

请注意可能存在的实数精度问题，并采取适当措施。
题解：

首先，如果直接一轮一轮地进行期望推导，会发现前面有冲突的情况。枚举第 (i) 轮第 (j) 张卡时既要保证前 (i-1) 轮都没有发动过第 (j) 张卡，又要保证第 (i) 轮没有发动过前 (j-1) 张卡，再乘 (p_i) 算概率。但是这样怎么算都算不对，其实感觉也是一个“意识”调题的过程吧，反正最终把样例调到 (3.21) 左右发现概率对不上（样例解释），于是还是放弃了。

因此考虑建立无后效性的dp方程。因为需要满足 “如果发动了当前的卡”，那么就停止本轮，所以方程需要和前缀有关。令 (f[i][j]) 表示在所有的 (r) 轮里，前 (i) 张卡有 (j) 个发动了的概率。此时对于任意的第 (k) 张卡就可以用 (f[k-1]) 有关的数据推出来了。

考虑状态转移方程，对于 (f[i][j])，可以从 (f[i-1][j-1]) 或 (f[i-1][j]) 推过来。当从 (f[i-1][j]) 推过来时，表示第 (i) 张整场都没有发动，因此 (f[i-1][j]) 的贡献为 (f[i-1][j] imes (1-p_i)^{r-j})。

其中 ((1-p_i)^{r-j}) 表示在全部 (r) 轮中，由于在前 (i-1) 个中钦定了 (j) 个，占用了 (j) 轮，剩下的 (r-j) 轮中每次都没有发动第 (i) 张卡。

同时，为了便于理解，当我们dp做到 (f[i]) 时，如果认为第 (i) 张卡为此时的第一张卡，剩下的 (r-j) 轮里就只能选择下标为 ([i,n]) 的卡了。此时第 (i) 张卡的发动不受前 (i-1) 张的限制。

当从 (f[i-1][j-1]) 推过来时（首先要满足 (j>0)），表示第 (i) 张被发动了，正难则反，被发动的概率就是用 (1) 减去没有被发动的概率。而没有被发动的概率在上文中被提到了，是 ((1-p_i)) 的幂。此时由于只钦定了 (j-1) 张卡发动，所以指数为 (r-j+1)。因此 (f[i-1][j-1]) 的贡献为 (f[i-1][j-1] imesleft(1-(1-p_i)^{r-j+1} ight))。

然后可以依次求出所有的 (f)，此时我们再根据 (f) 推出每张卡被发动的概率 (P_i)。

仿照上面 (f[i-1][j-1] o f[i][j]) 的过程，我们可以直接算出

[P_i=sum_{j=0}^{i-1}f[i-1][j] imes left(1-(1-p_i)^{r-j} ight) ]
答案是对每个 (P_i) 乘上伤害值 (d_i)。

对每个 ((1-p_i)) 预处理幂后，时间复杂度为 (O(nTr))。

Code：
```
#include<cstdio>
#include<cstring>
#define db double
db f[233][233],p[233];
db q[233][233];//q[i][j]表示(1-p[i])^j
int d[233];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        int n,r;
        scanf("%d%d",&n,&r);
        for(int i=1;i<=n;++i)
        {
            scanf("%lf%d",&p[i],&d[i]);
            q[i][0]=1;
            for(int j=1;j<=233;++j)
                q[i][j]=q[i][j-1]*(1-p[i]);
        }
        f[0][0]=1;
        for(int i=1;i<=n;++i)
            for(int j=0;j<=i&&j<=r;++j)
            {
                f[i][j]=j?f[i-1][j-1]*(1-q[i][r-j+1]):0;
                f[i][j]+=f[i-1][j]*q[i][r-j];
            }
        db ans=0;
        for(int i=1;i<=n;++i)
            for(int j=0;j<i&&j<r;++j)
                ans+=d[i]*(f[i-1][j]*(1-q[i][r-j]));
        printf("%.10lf
",ans);
    }
    return 0;
}
```
查看全文

相关阅读:
测试同学都应该知道的断言知识...
自己如何修改Airtest的源码
 如何选择适合你的图像识别算法
 如何测试基于Unity3D引擎的游戏
 Web前端-按钮点击效果(水波纹)
C# Email 帮助类 EmailHelper
WinForm 加载大数据时不闪烁的ListView
LZZ磁力资源搜索4.2.2，整合多个站点，大部分资源都能搜到
 C#7.0新特性和语法糖详解
 6种css3 transform图片悬停动态效果

原文地址：https://www.cnblogs.com/wjyyy/p/lg3239.html

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王 题解【期望】【DP】

题目描述

输入格式

输出格式

输入输出样例

数据范围与约定

题解：

Code：

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】