zoukankan html css js c++ java

7.30 NOI模拟赛 B Easy Sum 分块 NTT

LINK:Easy Sum

avatar
avatar

考试的时候一脸懵逼想不通这个(n^2)的还能怎么优化.

事实上暴力(n^2)有30~40 而我脸黑只有30 很气...

把点抽象到杨辉三角上可以发现这是若干个行上的K个点求和如果是对列上求和或者总体求和就好做的多.

另外一种(n^2)是这n个点从((a_i,b_i))这个位置走到((0,k))

实际上在图上进行dp求方案很多神仙使用滚动数组+循环展开(n^2)暴力过了这道题.

正解是这样的：

将坐标分块这样做是方便后续的转移.

考虑隔B分上一块然后我们维护每一列的的dp值从上一块dp到下一块.

每次由上一列dp到下一列需要做一个前缀和的东西(实际上是后缀和.

其实就是乘以多项式(frac{1}{(1-x)})跳B列就乘以(frac{1}{(1-x)^B})

可能会有疑问为什么不直接跳第一列而是一块一块跳.

在跳的过程中存在一个点要对下一列有贡献了所以我们此时暴力加上贡献还是(n^2)的.

不妨考虑加到上一次要跳的那一列这样计算出自己需要res次前缀和那么就是给上次的列的多项式加上一个(x^ycdot (1-x)^{B-res})

这个多项式最长只有B所以就可以接受了.

总复杂度为(ncdot B+frac{n}{B}cdot nlogn) 显然当B取(sqrt{nlogn})时最优.

代码写的很容易理解.

这个思路是真的妙建议一写.

code

//#include<bits/stdc++.h>
#include<iostream>
#include<cstdio>
#include<ctime>
#include<cctype>
#include<queue>
#include<deque>
#include<stack>
#include<iostream>
#include<iomanip>
#include<cstdio>
#include<cstring>
#include<string>
#include<ctime>
#include<cmath>
#include<cctype>
#include<cstdlib>
#include<queue>
#include<deque>
#include<stack>
#include<vector>
#include<algorithm>
#include<utility>
#include<bitset>
#include<set>
#include<map>
#define ll long long
#define db double
#define INF 1000000000
#define inf 1000000000000000ll
#define ldb long double
#define pb push_back
#define put_(x) printf("%d ",x);
#define get(x) x=read()
#define gt(x) scanf("%d",&x)
#define gi(x) scanf("%lf",&x)
#define put(x) printf("%d
",x)
#define putl(x) printf("%lld
",x)
#define rep(p,n,i) for(RE int i=p;i<=n;++i)
#define go(x) for(int i=lin[x];i;i=nex[i])
#define fep(n,p,i) for(RE int i=n;i>=p;--i)
#define vep(p,n,i) for(RE int i=p;i<n;++i)
#define pii pair<int,int>
#define mk make_pair
#define RE register
#define P 13331ll
#define gf(x) scanf("%lf",&x)
#define pf(x) ((x)*(x))
#define uint unsigned long long
#define ui unsigned
#define EPS 1e-5
#define sq sqrt
#define S second
#define F first
#define mod 998244353
#define md 1000000007
#define max(x,y) ((x)<(y)?y:x)
#define a(i) t[i].a
#define b(i) t[i].b
using namespace std;
char buf[1<<15],*fs,*ft;
inline char getc()
{
	return (fs==ft&&(ft=(fs=buf)+fread(buf,1,1<<15,stdin),fs==ft))?0:*fs++;
}
inline int read()
{
	RE int x=0,f=1;RE char ch=getc();
	while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getc();}
	while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getc();}
	return x*f;
}
inline ll Read()
{
	RE ll x=0,f=1;RE char ch=getc();
	while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getc();}
	while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getc();}
	return x*f;
}
const int MAXN=350010,maxn=100010,N=2000,G=3;
int lim=1,n,B,m,INV,IG;
int fac[MAXN],inv[MAXN],h[N][N];
int f[MAXN],g[MAXN],rev[MAXN],O[MAXN];
struct wy{int a,b;}t[maxn];
vector<int>w[N];
inline int ksm(int b,int p)
{
	int cnt=1;
	while(p)
	{
		if(p&1)cnt=(ll)cnt*b%mod;
		b=(ll)b*b%mod;p=p>>1;
	}
	return cnt;
}
inline int C(int a,int b){return (ll)fac[a]*inv[b]%mod*inv[a-b]%mod;}
inline int add(int x,int y){return x+y>=mod?x+y-mod:x+y;}
inline void NTT(int *a,int op)
{
	vep(0,lim,i)if(i<rev[i])swap(a[i],a[rev[i]]);
	for(int len=2;len<=lim;len=len<<1)
	{
		int mid=len>>1;
		int wn=ksm(op==1?G:IG,(mod-1)/len);
		vep(1,mid,j)O[j]=(ll)O[j-1]*wn%mod;
		for(int j=0;j<lim;j+=len)
		{
			vep(0,mid,i)
			{
				int x=(ll)a[i+j+mid]*O[i]%mod;
				a[i+j+mid]=(a[i+j]-x+mod)%mod;
				a[i+j]=add(a[i+j],x);
			}
		}
	}
	if(op==-1)vep(0,lim,i)a[i]=(ll)a[i]*INV%mod;
}
inline bool cmp(wy x,wy y){return x.a<y.a;}
int main()
{
	//freopen("1.in","r",stdin);
	n=read();B=(int)sqrt(n*20*1.0);
	rep(1,n,i)get(a(i)),get(b(i));
	lim=1;while(lim<=2*n)lim=lim<<1;
	vep(0,lim,i)rev[i]=rev[i>>1]>>1|((i&1)?lim>>1:0);
	m=n+B;INV=ksm(lim,mod-2);IG=ksm(G,mod-2);O[0]=1;
	fac[0]=1;rep(1,m,i)fac[i]=(ll)fac[i-1]*i%mod;
	inv[m]=ksm(fac[m],mod-2);fep(m-1,0,i)inv[i]=(ll)inv[i+1]*(i+1)%mod;
	rep(0,n,i)g[i]=C(i+B-1,B-1);
	
	NTT(g,1);//NTT(g,-1);
	
	rep(0,B,i)
	rep(0,i,j)
	h[i][j]=(ll)C(i,j)*((j&1)?mod-1:1)%mod;
	
	sort(t+1,t+1+n,cmp);int BB=n/B+1;
	
	rep(1,n,i)w[a(i)/B+1].pb(i);
	
	fep(BB,1,k)
	{
		
		vep(0,(int)w[k].size(),j)
		{
			
			int id=w[k][j];
			
			int y=n-b(id);

			int res=a(id)%B+1;
			//(1-x)^{B-res}*x^y
			
			rep(0,B-res,i)if(y+i<=n)f[y+i]=add(f[y+i],h[B-res][i]);
		}
		
		NTT(f,1);
		
		vep(0,lim,i)f[i]=(ll)f[i]*g[i]%mod;
		
		NTT(f,-1);
		vep(n+1,lim,i)f[i]=0;
	}
	
	rep(0,n-1,i)printf("%d ",f[n-i]);
	
	return 0;
}

查看全文

相关阅读:
【Kafka】《Kafka权威指南》——从Kafka读取数据
 【Kafka】《Kafka权威指南》——分区partition
【Kafka】《Kafka权威指南》——写数据
 【Kafka】《Kafka权威指南》入门
 六大设计原则
 EXCEPTION_ACCESS_VIOLATION(0xc0000005)
属性文件——Java&Spring
Maven——向Maven本地仓库中手动添加依赖包（ps：ojdbc.jar）
使用Python轻松批量压缩图片
 Nginx常用命令，解决你日常运维的烦恼

原文地址：https://www.cnblogs.com/chdy/p/13414965.html