大致是长剖+( m dsu on tree)的思想
先做一个转化,改为对于(iin[1,n-1])求出有多少个(f(u,v))满足(i|f(u,v)),这样我们最后再做一个反演就好了
既然我们要求有多少对(f(u,v))是(i)或(i)的倍数,我们需要在长剖的时候快速合并两边的信息,这个信息长得非常别致,形如到当前节点距离为(i)或(i)的倍数的节点个数
轻儿子这边还好说,我们直接暴力调和级数处理一下即可,但是这样的信息从中儿子哪里却非常不好继承
考虑一下根号分治
如果这个(i>sqrt{n}),也就是直接暴力从重儿子那里暴力复杂度是(frac{n}{i}<sqrt{n}),这样我们自然可以直接利用长剖时维护的数组得到
但是(ileq sqrt{n})时,考虑维护一个数组可以快速得到这样的信息,但是这样的数组从重儿子那里没办法继承,看起来长剖好像行不太通
这个时候就需要用( m dsu)的思想了
考虑维护一个(g[i][j])表示一个点子树内部点深度对(i)取模余数为(j)的点的个数,这样我们就没有必要考虑如何继承,像重儿子那样不清空直接拿来用就好了
利用这个数组我们很方便查询子树内部到当前节点距离为(i)或(i)的倍数的点的个数,只需要利用当前点的深度搞一搞就可以了
我们暴力轻儿子的时候也可以直接把更新(g),更新一次复杂度是(O(sqrt{n}))的
但一般来说,长剖都是先重儿子再轻儿子,但是( m dsu)却是先轻儿子再重儿子,这里为了保证(g)里维护的信息都来自于子树内部,我们必须得像( m dsu)一样先轻儿子之后处理重儿子
代码
#include<bits/stdc++.h>
#define re register
#define LL long long
#define min(a,b) ((a)<(b)?(a):(b))
inline int read() {
char c=getchar();int x=0;while(c<'0'||c>'9') c=getchar();
while(c>='0'&&c<='9') x=(x<<3)+(x<<1)+c-48,c=getchar();return x;
}
const int maxn=2e5+5;
struct E{int v,nxt;}e[maxn];
int n,num,__,B;
int head[maxn],son[maxn],len[maxn],dep[maxn],f[maxn],mu[maxn],p[maxn>>1];
int h[maxn],top[maxn],dfn[maxn],g[320][320],b[maxn],c[maxn];
LL ans[maxn],Ans[maxn];
inline void add(int x,int y) {
e[++num].v=y;e[num].nxt=head[x];head[x]=num;
}
void dfs1(int x) {
for(re int i=head[x];i;i=e[i].nxt) {
dep[e[i].v]=dep[x]+1;dfs1(e[i].v);
if(len[e[i].v]>len[son[x]]) son[x]=e[i].v;
}
len[x]=len[son[x]]+1;
}
void dfs2(int x,int topf) {
top[x]=topf,dfn[x]=++__;
if(!son[x]) return;
dfs2(son[x],topf);
for(re int i=head[x];i;i=e[i].nxt)
if(son[x]!=e[i].v) dfs2(e[i].v,e[i].v);
}
inline void ins(int x,int v) {
for(re int i=1;i<=B;++i) g[i][x%i]+=v;
}
inline int calc(int x,int k) {
if(k<=B) return g[k][dep[x]%k];
int tot=0;
for(re int i=dfn[x]+k;i<=dfn[x]+len[x]-1;i+=k) tot+=h[i];
return tot;
}
void dfs(int x) {
for(re int i=head[x];i;i=e[i].nxt)
if(son[x]!=e[i].v) dfs(e[i].v);
if(son[x]) dfs(son[x]);
for(re int i=head[x];i;i=e[i].nxt) {
if(son[x]==e[i].v) continue;
int y=e[i].v;
for(re int j=1;j<=len[y];++j)
b[j]=h[dfn[y]+j-1];
for(re int j=1;j<=len[y];++j)
for(re int k=j;k<=len[y];k+=j) c[j]+=b[k];
for(re int j=1;j<=len[y];++j)
ans[j]+=1ll*c[j]*calc(x,j);
for(re int j=1;j<=len[y];++j) c[j]=b[j]=0;
for(re int j=1;j<=len[y];++j)
ins(j+dep[y]-1,h[dfn[y]+j-1]),h[dfn[x]+j]+=h[dfn[y]+j-1];
}
ins(dep[x],1);h[dfn[x]]++;
if(x==top[x]) {
for(re int i=1;i<=B;++i)
for(re int j=dep[x];j<=dep[x]+len[x]-1;++j)
g[i][j%i]=0;
}
}
int main() {
n=read();
for(re int x,i=2;i<=n;++i) x=read(),add(x,i);
dep[1]=1,dfs1(1),dfs2(1,1);f[1]=mu[1]=1;
B=std::ceil(std::sqrt(n));B=min(B,310);dfs(1);
for(re int i=2;i<=n;i++) {
if(!f[i]) p[++p[0]]=i,mu[i]=-1;
for(re int j=1;j<=p[0]&&p[j]*i<=n;++j) {
f[p[j]*i]=1;if(i%p[j]==0) break;
mu[p[j]*i]=-mu[i];
}
}
for(re int i=1;i<=n;i++)
for(re int j=i;j<=n;j+=i)
Ans[i]+=1ll*mu[j/i]*ans[j];
for(re int i=2;i<=n;++i)
c[1]++,c[dep[i]]--;
for(re int i=1;i<=n;i++) c[i]+=c[i-1];
for(re int i=1;i<n;i++) printf("%lld
",Ans[i]+c[i]);
return 0;
}