题意:
给出一个序列 (a),求 (a) 有多少个子区间 ([l,r]),满足这个区间中出现次数最多的数出现次数 (>dfrac{r-l+1}{2})
(1 leq n leq 5 imes 10^5)
首先肯定要枚举出现次数最多的数是什么,假设为 (x)。
记序列中为 (x) 的数为 (+1),数列中不为 (x) 的数为 (-1),那么 (x) 出现次数 (>dfrac{r-l+1}{2}) 等价于该区间中对应的数的和 (>0)。
考虑对这个 (+1,-1) 的序列做一遍前缀和得到 (s_i),那么满足条件的区间个数即为 (s_i) 的顺序对个数。
对于 (type=1,3) 的情况,做 (8) 次树状数组求顺序对就可以了。
然而对于原题来说这样肯定是不行的,不过发现对于 (x) 取什么值,(1) 的个数加起来只有 (n) 个,这意味着大部分数都是 (-1),那么我们思考能不能拿这个性质做文章呢?
考虑从左到右依次插入一段连续的 (-1),显然这些位置的 (s) 值可以形成一段连续的区间(公差为 (-1) 的等差数列),不妨设其为 ([L,R])。
假设 (cnt_j) 为当前 (s_i=j) 的 (i) 的个数,那么这段区间的贡献就是
把这个式子稍微调整一下就可以得到
是不是感觉有亿点点可维护?
线段树维护 (cnt_j) 的值,支持区间加、求区间 (cnt_i) 的和,以及区间 (i imes cnt_i) 的和,就可以在 (mathcal O(log n)) 的时间内求出上面那个式子的值。
由于 (s_j) 可能 (<0),所以下标要整体加上一个值。
虽然 (-1) 的个数很多,但是连续的 (-1) 段的个数是 (mathcal O(n)) 级别的,而我们恰好利用了这个性质将复杂度降了下来。
#include <bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define fz(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
#define ffe(it,v) for(__typeof(v.begin()) it=v.begin();it!=v.end();it++)
#define fill0(a) memset(a,0,sizeof(a))
#define fill1(a) memset(a,-1,sizeof(a))
#define fillbig(a) memset(a,63,sizeof(a))
#define pb push_back
#define ppb pop_back
#define mp make_pair
typedef pair<int,int> pii;
typedef long long ll;
const int MAXN=5e5+5;
int n,a[MAXN];
vector<int> v[MAXN];
struct node{
int l,r;
ll val,mul,lz,sumi;
} s[MAXN<<4];
void build(int k,int l,int r){
s[k].l=l;s[k].r=r;s[k].val=s[k].lz=s[k].mul=0;if(l==r){s[k].sumi=l-MAXN;return;}
int mid=(l+r)>>1;build(k<<1,l,mid);build(k<<1|1,mid+1,r);
s[k].sumi=s[k<<1].sumi+s[k<<1|1].sumi;
}
void pushdown(int k){
if(s[k].lz){
s[k<<1].val+=(s[k<<1].r-s[k<<1].l+1)*s[k].lz;
s[k<<1].mul+=s[k<<1].sumi*s[k].lz;s[k<<1].lz+=s[k].lz;
s[k<<1|1].val+=(s[k<<1|1].r-s[k<<1|1].l+1)*s[k].lz;
s[k<<1|1].mul+=s[k<<1|1].sumi*s[k].lz;s[k<<1|1].lz+=s[k].lz;
s[k].lz=0;
}
}
void modify(int k,int l,int r,int x){
if(l<=s[k].l&&s[k].r<=r){
s[k].val+=(s[k].r-s[k].l+1)*x;
s[k].mul+=s[k].sumi*x;s[k].lz+=x;
return;
} pushdown(k);
int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) modify(k<<1,l,r,x);
else if(l>mid) modify(k<<1|1,l,r,x);
else modify(k<<1,l,mid,x),modify(k<<1|1,mid+1,r,x);
s[k].val=s[k<<1].val+s[k<<1|1].val;
s[k].mul=s[k<<1].mul+s[k<<1|1].mul;
}
ll query(int k,int l,int r){
// printf("%d %d %d
",k,l,r);
if(l<=s[k].l&&s[k].r<=r) return s[k].val;
pushdown(k);int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) return query(k<<1,l,r);
else if(l>mid) return query(k<<1|1,l,r);
else return query(k<<1,l,mid)+query(k<<1|1,mid+1,r);
}
ll queryi(int k,int l,int r){
if(l<=s[k].l&&s[k].r<=r) return s[k].mul;
pushdown(k);int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) return queryi(k<<1,l,r);
else if(l>mid) return queryi(k<<1|1,l,r);
else return queryi(k<<1,l,mid)+queryi(k<<1|1,mid+1,r);
}
int main(){
int qwq;scanf("%d%d",&n,&qwq);
for(int i=1;i<=n;i++) scanf("%d",&a[i]),v[a[i]].pb(i);
build(1,0,MAXN<<1);ll ret=0;
for(int i=0;i<n;i++){
// printf("%d
",i);
int pre=0,sum=0;modify(1,MAXN,MAXN,1);
for(int j=0;j<v[i].size();j++){
int cur=v[i][j];
if(pre+1!=cur){
int r=sum-1,l=sum-(cur-pre-1);
ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
sum-=(cur-pre-1);
}
sum++;ret+=query(1,0,sum-1+MAXN);modify(1,sum+MAXN,sum+MAXN,1);
pre=cur;
}
if(pre!=n){
int r=sum-1,l=sum-(n-pre);
ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
sum-=(n-pre);
}
pre=0,sum=0;modify(1,MAXN,MAXN,-1);
for(int j=0;j<v[i].size();j++){
int cur=v[i][j];
if(pre+1!=cur){
int r=sum-1,l=sum-(cur-pre-1);
modify(1,l+MAXN,r+MAXN,-1);
sum-=(cur-pre-1);
}
sum++;modify(1,sum+MAXN,sum+MAXN,-1);
pre=cur;
}
if(pre!=n){
int r=sum-1,l=sum-(n-pre);
modify(1,l+MAXN,r+MAXN,-1);
sum-=(n-pre);
}
}
printf("%lld
",ret);
return 0;
}
upd on 2020.12.4:
考场上想的做法竟然过了!incredible!我还以为它过不了呢/xyx
讲一个 (nsqrt{nlog n}) 的做法。
考虑分块,设一个临界值 (B)。
对于每个出现次数 (leq B) 的数,显然它只能对长度 (<2B) 的区间产生贡献,枚举每个长度 (<2B) 的区间。
对于每个出现次数 (>B) 的数,这样的数顶多 (dfrac{n}{B}) 个,对于每一个这样的数搞一遍树状数组求顺序对。
时间复杂度 (2nB+dfrac{n^2log n}{B}),根据均值不等式可以算得复杂度最优为 (nsqrt{nlog n})。
woc 这玩意儿真的 nb (10^9) 左右给我跑过去了。
顺便提一句:考场上我在求 (<2B) 的区间的贡献的时候用了 memset 所以 T 掉了还以为是算法本身的锅。
#include <bits/stdc++.h>
using namespace std;
const int MAXN=5e5+5;
typedef long long ll;
int n,sub,a[MAXN];
const int BLK=800;
int cnt[MAXN],f[MAXN];
int sum[MAXN];
int bit[MAXN<<1];
void add(int x,int v){for(int i=x;i<MAXN+MAXN;i+=(i&(-i))) bit[i]+=v;}
int query(int x){int ret=0;for(int i=x;i;i-=(i&(-i))) ret+=bit[i];return ret;}
int solve(){
for(int i=1;i<=n;i++) f[a[i]]++;
ll ret=0;
for(int i=1;i<=n;i++){
int mx=0,pos=0;
for(int j=i;j<=n&&j<=i+BLK*2;j++){
cnt[a[j]]++;if(cnt[a[j]]>mx) mx=cnt[a[j]],pos=a[j];
if(mx>(j-i+1)/2&&f[pos]<BLK) ret++;
}
for(int j=i;j<=n&&j<=i+BLK*2;j++){
cnt[a[j]]--;
}
}
for(int i=0;i<n;i++){
if(f[i]<BLK) continue;
memset(sum,0,sizeof(sum));
for(int j=1;j<=n;j++){
if(a[j]==i) sum[j]=sum[j-1]+1;
else sum[j]=sum[j-1]-1;
}
memset(bit,0,sizeof(bit));
add(MAXN,1);
for(int j=1;j<=n;j++){
ret+=query(sum[j]-1+MAXN);
add(sum[j]+MAXN,1);
}
}
printf("%lld
",ret);
return 0;
}
int main(){
scanf("%d%d",&n,&sub);
for(int i=1;i<=n;i++) scanf("%d",&a[i]);
return solve();
}
终于把自爆的心头之恨化解掉了,爽