zoukankan      html  css  js  c++  java
  • $CF24D Broken Robot DP+$高斯消元

    Luogu

    Description

    你收到的礼物是一个非常聪明的机器人,行走在一块长方形的木板上.不幸的是,你知道它是坏的,表现得相当奇怪(随机).该板由n行和m列的单元格组成.机器人最初是在i行和j列的某个单元格上.然后在每一步机器人可以到另一个单元.目的是去底层(n次)行.机器人可以停留在当前单元,向左移动,向右边移动,或者移动到当前下方的单元.如果机器人在最左边的列不能向左移动,如果它是在最右边的列不能向右移动.在每一步中,所有可能的动作都是同样可能的.返回步的预期数量达到下面的行.

    Sol

    这题和传纸条有点类似,不同的是机器人既能向左走又能向右走,而传纸条只能向右传.

    f[i][j]表示从(i,j)走到最后一行所需要的期望步数

    f[i][1]=1/3(f[i][1]+f[i][2]+f[i+1][1])+1

    f[i][m]=1/3(f[i][m]+f[i][m-1]+f[i+1][m])+1

    (j!=1&&j!=m)f[i][j]=1/4(f[i][j]+f[i][j-1]+f[i][j+1]+f[i+1][j])+1

    部分状态之间可以互相转移互相影响,并不能满足DP的无后效性

    所以不能线性递推,要用高斯消元直接求出状态转移方程的解

    需要注意的是m=1的情况要特判

    m=3时,系数矩阵如下:

    -2/3  1/3    0

    1/4    1/4    1/4

    0        1/3    -2/3

    值得一提的是,我们用f[i][j]表示从(i,j)走到最后一步的期望步数,按照行号倒序进行递推,而不是用f[i][j]表示从(x,y)到(i,j)的期望步数并正序递推.原因是,若正序递推,则还须求出(x,y)到最后一行每一个位置的概率p[n][j],计算Σp[n][j]*f[n][j]才能得到答案,较为复杂.

    事实上,很多数学期望DP都会采取倒推的方式执行.

    Code

    关于代码实现其实还有几个值得注意的地方

    1.f[i][j]数组可以滚动优化

    2.因为要多次解方程组,很多人可能会每次都初始化a数组(系数矩阵).其实没有必要,只要初始化一次,并且同时记录一下c[i]=a[i+1][i]/a[i][i]就好了(没写code这句话可能暂时看不懂,看下code就会懂了鸭QwQ)

     1 #include<iostream>
     2 #include<cstdio>
     3 #include<cstring>
     4 #define Rg register
     5 #define il inline
     6 #define db double
     7 #define ll long long
     8 #define mem(a,b) memset(a,b,sizeof(a));
     9 #define go(i,a,b) for(Rg int i=a;i<=b;++i)
    10 #define yes(i,a,b) for(Rg int i=a;i>=b;--i)
    11 using namespace std;
    12 il int read()
    13 {
    14     int x=0,y=1;char c=getchar();
    15     while(c<'0'||c>'9'){if(c=='-')y=-1;c=getchar();}
    16     while(c>='0'&&c<='9'){x=(x<<3)+(x<<1)+c-'0';c=getchar();}
    17     return x*y;
    18 }
    19 const int N=1001;
    20 int n,m,x,y;
    21 db a[N][N],b[N],f[N],c[N];
    22 il void init_a()
    23 {
    24     if(m==1){a[1][1]=(db)-1.0/2;return;}
    25     a[1][1]=(db)-2.0/3;a[1][2]=(db)1.0/3;
    26     a[m][m-1]=(db)1.0/3;a[m][m]=(db)-2.0/3;
    27     go(i,2,m-1)a[i][i-1]=(db)1.0/4,a[i][i]=(db)-3.0/4,a[i][i+1]=(db)1/4;
    28     go(i,1,m)
    29     {
    30         c[i]=a[i+1][i]/a[i][i];
    31         a[i+1][i]-=c[i]*a[i][i];
    32         a[i+1][i+1]-=c[i]*a[i][i+1];
    33     }
    34 }
    35 il void init_b()
    36 {
    37     if(m==1){b[1]=(db)-f[1]/2-1;return;}
    38     b[1]=-(db)f[1]/3-1;b[m]=-(db)f[m]/3-1;
    39     go(i,2,m-1)b[i]=-(db)f[i]/4-1;
    40 }
    41 il void calc()
    42 {
    43     go(i,1,m){db t=c[i];b[i+1]-=t*b[i];}
    44     f[m]=b[m]/a[m][m];
    45     yes(i,m-1,1)f[i]=(b[i]-f[i+1]*a[i][i+1])/a[i][i];
    46 }
    47 int main()
    48 {
    49     n=read(),m=read(),x=read(),y=read();//m==1 special case !
    50     init_a();
    51     yes(i,n-1,x){init_b();calc();}
    52     printf("%.10lf",f[y]);
    53     return 0;
    54 }
    View Code

     

    光伴随的阴影
  • 相关阅读:
    2021.3.16
    2021.3.15
    通过指定的URL获取返回图片的BASE64编码
    Redis系统学习之缓存穿透,缓存击穿,缓存雪崩的概念及其解决方案
    Redis系统学习之其他高可用模型
    Redis系统学习之哨兵模式
    Redis系统学习之主从复制
    Redis系统学习之发布订阅
    Redis系统学习之持久化(AOF)
    Redis系统学习之持久化(RDB)
  • 原文地址:https://www.cnblogs.com/forward777/p/11016856.html
Copyright © 2011-2022 走看看