zoukankan      html  css  js  c++  java
  • [Codeforces 464D]World of Darkraft(期望DP)

    [Codeforces 464D]World of Darkraft(期望DP)

    题面

    游戏中有k种装备,每种装备初始时都是等级1。zyd每打一只怪,就会随机爆出一件装备。掉落和更新装备方式如下:

    假设这种装备当前等级为t,那么系统会在[1,t+1]中等概率随机出该装备的等级。爆出装备后,会装备上身上的和爆出的装备之间等级更高的那件,并卖掉等级更低的装备。其中等级为i的装备价格为i金币。

    求打了n只怪后获得金币的期望值,精确到(10^{-9})

    (n,kleq 10^5)

    分析

    首先,所有装备没有区别。根据期望的线性性可以计算出买某种装备的期望收益,再乘上(k)

    (dp[i][j])表示某种装备现在(j)级,再打(i)只怪后的期望收益

    考虑从(i-1)推到(i)(注意:这实际上是倒推),分情况讨论:

    1. 爆出的不是这种装备,概率(frac{k-1}{k}),期望(frac{k-1}{k}dp[i-1][j])

    2. 爆出的是这种装备,概率(frac{1}{k})
      2.1 爆出的装备等级为(j+1),概率为(frac{1}{j+1}),此时把当前装备卖掉获得(j)金币。那么倒推期望,从(dp[i-1][j+1])转移过来,期望(frac{j+dp[i-1][j+1]}{j+1})

      2.2爆出的装备等级为([1,j])中的一个,概率(frac{j}{j+1}).卖掉这个装备,由于概率均匀分布,获得金币的期望值为(frac{j+1}{2})。此后手上装备等级还是(j),从(dp[i-1][j])转移,期望(frac{j}{j+1}(dp[i-1][j]+frac{j+1}{2}))

    那么我们可以写出最终的dp方程

    (dp[i][j]=frac{k-1}{k}dp[i-1][j]+frac{1}{k}(frac{j+dp[i-1][j+1]}{j+1}+frac{j}{j+1}(dp[i-1][j]+frac{j+1}{2})))

    这样的转移是(O(n^2))的.想到期望dp的一般套路,j过大的时候期望值小到可以忽略不计。经过测试j枚举到700即可。严谨的证明请参考cf官方题解

    代码

    #include<iostream>
    #include<cstring>
    #include<cmath>
    #include<cstdio>
    #define maxb 700
    using namespace std;
    typedef double db;
    int n;
    db k;
    db dp[2][maxb+5];
    int main(){
    	scanf("%d %lf",&n,&k);
    	int now=0;
    	for(int i=1;i<=n;i++){
    		for(int j=1;j<=maxb;j++){
    			dp[now][j]=dp[now^1][j]*(k-1.0)/db(k)
    					   +((dp[now^1][j+1]+j)/(j+1.0)
    					   +(dp[now^1][j]+(j+1)/2.0)*j/(j+1.0))/db(k);
    		}
    		now^=1;
    	}
    	printf("%.10lf
    ",k*dp[now^1][1]);
    }
    				
    
  • 相关阅读:
    [JLOI2011] 飞行路线
    高精度运算模板
    Dijkstra算法模板
    [SDOI2010] 外星千足虫
    [SDOI2006] 线性方程组
    [CTSC2014] 企鹅QQ
    模板三连击:树状数组+线段树+主席树
    [ZJOI2008] 树的统计
    [国家集训队] 礼物
    [洛谷P4720] [模板] 扩展卢卡斯
  • 原文地址:https://www.cnblogs.com/birchtree/p/12266236.html
Copyright © 2011-2022 走看看