题意
有 (n) 个怪兽,(k) 种装备。最开始每个装备的等级都是 1 。每打完一个怪兽就会随机掉落一个装备。
随机的方式是,先等概率随机一个装备种类,设当前这个装备的等级为 (t) ,那么再在 ([1,t+1]) 中随机一个装备等级。
我们会在这两个装备中选择等级高的那个获得,另一个卖掉,得到等级数量的金币。
求最后金币的期望值。需要误差在 (10^{-9}) 以内。
(nle 10^5,kle 100) 。
分析
显然 (k) 个装备是等价的,所以直接算一个的情况就行了。
我们要求的是总金币数量的期望,分成每次操作完之后的得到金币期望数量和来计算。
可以发现一个性质:若当前装备的等级为 (x) ,那么一次操作完后期望得到的金币数量为 (frac{x}{x+1}+frac x 2) 。
现在问题就变成计算每次操作前的装备等级 (x) 的期望和 (frac x {x+1}) 的期望。
很容易用一个 (O(n^2)) 的dp来计算进行完前 (i) 次操作后装备等级为 (j) 的概率,然后就可以得到上面两个东西的期望值,即可算出答案。
显然会超时。然后就不会了。
注意到,有一个误差的阈值,那么不如看看能不能减少一些情况。可以发现,当装备等级为 (x) 的时候,升级的概率为 (frac 1 {k(x+1)}) ,所以升级的期望步数为 (k(x+1)) ,因此升级到 (x) 级的期望步数 (f(x)sim kx^2) 。
也就是说,只需要计算大概 (sqrt n) 左右的等级即可!
复杂度为 (O(nsqrt n)) ,空间用滚动数组优化。
代码
#include<bits/stdc++.h>
using namespace std;
typedef double lb;
const int maxn=1e5+1;
const int thel=620,maxl=thel+1;
int n,k,m;
lb ok,mk,h[maxl],d[maxn],o[maxn],ans=0;
lb yp[maxl],y[maxl];
int main() {
#ifndef ONLINE_JUDGE
freopen("test.in","r",stdin);
#endif
cin>>n>>k;
m=min(n,thel);
ok=1.L/k,mk=1.L-ok;
for (int i=1;i<=thel;++i) yp[i]=(lb)i/(i+1),y[i]=1.L/i;
h[1]=1;
d[0]=1,o[0]=0.5;
for (int i=1;i<n;++i) {
for (int j=m;j;--j) (h[j]*=ok*yp[j]+mk)+=h[j-1]*y[j]*ok;
for (int j=1;j<=m;++j) d[i]+=h[j]*j,o[i]+=h[j]*yp[j];
}
for (int i=1;i<=n;++i) ans+=d[i-1]/2+o[i-1];
cout<<fixed<<setprecision(12)<<ans<<endl;
return 0;
}