zoukankan      html  css  js  c++  java
  • 概率期望dp入门题---游戏

    题目

    Alice 和 Bob 两个人正在玩一个游戏,游戏有很多种任务,难度为 p 的任务(p是正整数),有 1/(2^p) 的概率完成并得到 2^(p-1) 分,如果完成不了,得 0 分。一开始每人都是 0 分,从 Alice 开始轮流做任务,她可以选择任意一个任务来做;而 Bob 只会做难度为 1 的任务。只要其中有一个人达到 n 分,即算作那个人胜利。求 Alice 采取最优策略的情况下获胜的概率。
    输入格式
    一个正整数 n ,含义如题目所述。
    输出格式
    一个数,表示 Alice 获胜的概率,保留 6 位小数。
    样例数据 1
    输入
    1
    输出
    0.666667
    备注
    【数据范围】
    对于 30% 的数据,n≤10
    对于 100% 的数据,n≤500

    我们选择倒推(感觉好多期望概率dp都要倒推啊)

    用a[i][j]表示Alice有i分Bob有j分时Alice的获胜概率

    那么就有4种可能

    Alice完成,Bob未完成;Alice未完成,Bob完成;两人都完成;两人都未完成;

    可以得到递推式

    a[i][j]=max((a[l][j]/k/4+a[l][j+1]/k/4+a[i][j+1](k21)/k/4)/(1.01.0(k21.0)/k/4)|0<=i<=n10<=j<=n1

    其中

    l=k+i
    k=1;k/2<=n;k<<=1

    k是枚举Alice选择不同任务赢后的分数

    代码

    #include<bits/stdc++.h>
    using namespace std;
    double a[505][505];
    int n;
    int main(){
        cin>>n;
        for(int i=0;i<=n;i++)
        a[n][i]=1;
        for(int i=n-1;i>=0;i--)
        for(int j=n-1;j>=0;j--)
        {
            double maxn=0;
            for(int k=1;k/2<=n;k<<=1)
            {
                int l=k+i;
                if(l>n) l=n;
                double tmp=(a[l][j]/k/4+a[l][j+1]/k/4+a[i][j+1]*(k*2-1)/k/4)/(1.0-1.0*(k*2-1.0)/k/4);
                if(tmp>maxn) maxn=tmp;
            }
            a[i][j]=maxn;
        }
        printf("%lf",a[0][0]);
    }
  • 相关阅读:
    android Logger 一二三
    深挖android low memory killer
    ios CoreBluetooth 警告 is being dealloc'ed while pending connection
    iOS 国际化多语言设置 xcode7
    iOS 控制单个控制器旋转
    ios 开发 收起键盘的小技巧
    xcode ___gxx_personality_v0" 编译错误
    xcode6 AsynchronousTesting 异步任务测试
    xcode6 framework missing submodule xxx 警告
    iOS AVCaptureVideoDataOutputSampleBufferDelegate 录制视频
  • 原文地址:https://www.cnblogs.com/forever-/p/9736079.html
Copyright © 2011-2022 走看看