【莫队算法】【国家集训队2010】小Z的袜子
Description
作为一个生活散漫的人,小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天,小Z再也无法忍受这恼人的找袜子过程,于是他决定听天由命……
具体来说,小Z把这N只袜子从1到N编号,然后从编号L到R(L 尽管小Z并不在意两只袜子是不是完整的一双,甚至不在意两只袜子是否一左一右,他却很在意袜子的颜色,毕竟穿两只不同色的袜子会很尴尬。
你的任务便是告诉小Z,他有多大的概率抽到两只颜色相同的袜子。当然,小Z希望这个概率尽量高,所以他可能会询问多个(L,R)以方便自己选择。
Input
第一行包含两个正整数N和M。N为袜子的数量,M为小Z所提的询问的数量。
接下来一行包含N个正整数Ci,其中Ci表示第i只袜子的颜色,相同的颜色用相同的数字表示。
再接下来M行,每行两个正整数L,R表示一个询问。
Output
包含M行,对于每个询问在一行中输出分数A/B表示从该询问的区间[L,R]中随机抽出两只袜子颜色相同的概率。若该概率为0则输出0/1,否则输出的A/B必须为最简分数。(详见样例)
Sample Input
6 4
1 2 3 3 3 2
2 6
1 3
3 5
1 6
Sample Output
2/5
0/1
1/1
4/15
Hint
样例说明:
询问1:共C(5,2)=10种可能,其中抽出两个2有1种可能,抽出两个3有3种可能,概率为(1+3)/10=4/10=2/5。
询问2:共C(3,2)=3种可能,无法抽到颜色相同的袜子,概率为0/3=0/1。
询问3:共C(3,2)=3种可能,均为抽出两个3,概率为3/3=1/1。
注:上述C(a, b)表示组合数,组合数C(a, b)等价于在a个不同的物品中选取b个的选取方案数。
数据范围:
30%的数据中 N,M ≤ 5000;
60%的数据中 N,M ≤ 25000;
100%的数据中 N,M ≤ 50000,1 ≤ L < R ≤ N,Ci ≤ N。
题解
第一次看到这题,第一想法是用线段树或者树状数组维护一下,但仔细一想,似乎不行,因为本题的区间不满足加和性质。于是就需要用到莫队算法。
莫队算法可以解决已经知道区间[l,r]的答案,然后可以在O(1)(或者O(log N))的时间内求出[l,r+1],[l,r-1],[l-1,r],[l+1,r]的答案的问题。
现在知道,在区间[l,r]中,答案是 (X2+Y2+Z2.......−(r−l+1))/((r−l+1)(r−l))(X,Y,Z分别代表区间中不同颜色袜子的个数)。
显然,这是满足上面的性质的。假如我们按照读入顺序依次求解的话,复杂度为O(n2),不是特别满意。
这时我们就需要用到莫队算法,莫队算法的核心就是改变求解询问的顺序,从而减少运算的次数。那么,怎么样改变顺序来使速度最快呢?可以把每个区间都看做2维平面上的点,这些点的距离为横,纵坐标之差,然后我们可以O(N logN)求出这些平面点的曼哈顿最小生成树,但这样太复杂(而且我也不会)。
所以我们可以用分块来处理,将N 分成N½块,然后我们维护一下左端点所在块的编号。以左端点的编号为第一关键字,右端点的编号为第二关键字排序;然后以排序后的顺序依次求解(所以是离线的),在求解的过程中维护答案的值。这样做的复杂度为 O(N∗N½)。以下是证明过程:
- 时间复杂度就是左右端点移动的次数。
- 对于右端点的移动:因为一共只有N½个块,每个块中右端点最多移动n次,所以复杂度为O(N×N½)。
- 对于左端点的移动:如果在同一块中移动,那么是O(N½)的,如果跨越了块,那么最多跨越O(N),那么复杂度为O(N×N½+N)
- 综上,时间复杂度为O(N×N½)。
Code
#include<cstdio> #include<cstdlib> #include<cstring> #include<iostream> #include<algorithm> #include<cmath> using namespace std; #define ll long long #define REP(i,a,b) for(register int i=(a),_end_=(b);i<=_end_;i++) #define DREP(i,a,b) for(register int i=(a),_end_=(b);i>=_end_;i--) #define EREP(i,a) for(register int i=start[(a)];i;i=e[i].next) inline int read() { int sum=0,p=1;char ch=getchar(); while(!(('0'<=ch && ch<='9') || ch=='-'))ch=getchar(); if(ch=='-')p=-1,ch=getchar(); while('0'<=ch && ch<='9')sum=sum*10+ch-48,ch=getchar(); return sum*p; } const int maxn=5e4+20; int n,m; int w[maxn]; void init() { n=read();m=read(); REP(i,1,n)w[i]=read(); } struct query { int l,r,t,sx; }; struct ans { ll a,b; }; query qu[maxn]; ans Ans[maxn]; int k; bool cmp(const query a,const query b) { if(a.t==b.t)return a.r<b.r; return a.t<b.t; } ll co[maxn]={0}; ll A; void work(int x,int add) { A-=co[w[x]]*co[w[x]]; co[w[x]]+=add; A+=co[w[x]]*co[w[x]]; } void doing() { k=(int)sqrt(n); REP(i,1,m) { qu[i].l=read();qu[i].r=read(); qu[i].t=(qu[i].l-1)/k+1; qu[i].sx=i; } sort(qu+1,qu+m+1,cmp); int l=1,r=0; REP(i,1,m) { while(l>qu[i].l)work(l-1,1),l--; while(l<qu[i].l)work(l,-1),l++; while(r>qu[i].r)work(r,-1),r--; while(r<qu[i].r)work(r+1,1),r++; if(qu[i].l==qu[i].r) { Ans[qu[i].sx]={0,1};continue; } Ans[qu[i].sx]={A-(r-l+1),(ll)(r-l+1)*(r-l)}; } REP(i,1,m) { ll d=__gcd(Ans[i].a,Ans[i].b); if(d>1)cout<<Ans[i].a/d<<"/"<<Ans[i].b/d<<endl; else cout<<Ans[i].a<<"/"<<Ans[i].b<<endl; } } int main() { init(); doing(); return 0; }