XXVII.【模板】常系数齐次线性递推
题意:已知\(f_0,\dots,f_{m-1}\),且对于\(k\geq m\),有
\[f_k=\sum\limits_{i=1}^ma_if_{k-i}
\]
其中\(a_1,\dots,a_m\)是给定的系数。
求\(f_n\)。
我们一个naive的思路就是矩阵快速幂。
考虑设\(m\)阶向量
\[\mathbf{V}=\left[\begin{matrix}f_0\\\vdots\\f_{m-1}\end{matrix}\right]
\]
再设矩阵\(\mathrm{A}\)为构造出来的转移矩阵。
则有
\[f_n=(\mathbf{V}\mathrm{A}^n)_0
\]
这个复杂度是\(O(m^3\log n)\),无法承受。
我们假设我们已经通过魔法找到了一组\(c_0,\dots,c_{m-1}\)使得
\[\mathrm{A}^n=\sum\limits_{i=0}^{m-1}c_i\mathrm{A}^i
\]
则两边同时乘上\(\mathbf{V}\),得到
\[\mathbf{V}\mathrm{A}^n=\sum\limits_{i=0}^{m-1}c_i\mathbf{V}\mathrm{A}^i
\]
因为我们只考虑求出\(f_n\)即\((\mathbf{V}\mathrm{A}^n)_0\),所以我们在上式中也只需考虑\(0\)一位即可。
于是
\[(\mathbf{V}\mathrm{A}^n)_0=\sum\limits_{i=0}^{m-1}c_i(\mathbf{V}\mathrm{A}^i)_0
\]
即
\[f_n=\sum\limits_{i=0}^{m-1}c_if_i
\]
则我们现在的目标就变成求出这样一组\(c\)出来。
我们设一个矩阵函数\(C(\mathrm{A})=\sum\limits_{i=0}^{m-1}c_i\mathrm{A}^i=\mathrm{A}^n\)。
显然两边次数不等,不好求出。我们考虑另外找三个多项式\(Q,G,R\),满足
\[\mathrm{A}^n=(QG)(\mathrm{A})+R(\mathrm{A})
\]
即多项式除法的形式。则应有\(R\)的次数小于\(G\)的次数。
如果\(G\)的次数是\(m\)的话,就可以变成如下形式
\[\mathrm{A}^n=(QG)(\mathrm{A})+\sum\limits_{i=0}^{m-1}r_i\mathrm{A}^i
\]
此时,如果我们可以幸运地发现有\(G(\mathrm{A})=\mathrm{0}\)的话,最终就有
\[\mathrm{A}^n=R(\mathrm{A})=C(\mathrm{A})
\]
但真有这种好事吗?
我们考虑,有
\[\mathrm{A}=\begin{bmatrix}0,1,0,0,\dots,0\\0,0,1,0,\dots,0\\0,0,0,1,\dots,0\\\vdots\\0,0,0,0,\dots,1\\a_m,a_{m-1}\dots,a_1\end{bmatrix}
\]
我们发现,假如
\[g_i=-a_{m-i},g_m=1
\]
的话,恰有\(G(\mathrm{A})=0\)。
故我们只需要得到\(G\)后,计算
\[\mathrm{A}^n\bmod{G}
\]
即可得到\(C\)。
多项式取模可以用多项式除法魔改得到。然后套上一个快速幂即可。
时间复杂度\(O(m\log m\log n)\)。
代码:
#include<bits/stdc++.h>
using namespace std;
#include<bits/stdc++.h>
using namespace std;
const int mod=998244353;
const int N=1<<20;
int ksm(int x,int y){
int rt=1;
for(;y;x=(1ll*x*x)%mod,y>>=1)if(y&1)rt=(1ll*rt*x)%mod;
return rt;
}
int n,m,f[N],g[N],invrevg[N],all,res;
namespace Poly{
const int G=3;
int rev[N],lim,invlim;
void NTT(int *a,int tp){
for(int i=0;i<lim;i++)if(i<rev[i])swap(a[i],a[rev[i]]);
for(int md=1;md<lim;md<<=1){
int rt=ksm(G,(mod-1)/(md<<1));
if(tp==-1)rt=ksm(rt,mod-2);
for(int stp=md<<1,pos=0;pos<lim;pos+=stp){
int w=1;
for(int i=0;i<md;i++,w=(1ll*w*rt)%mod){
int x=a[pos+i],y=(1ll*w*a[pos+md+i])%mod;
a[pos+i]=(x+y)%mod;
a[pos+md+i]=(x-y+mod)%mod;
}
}
}
if(tp==-1)for(int i=0;i<lim;i++)a[i]=(1ll*a[i]*invlim)%mod;
}
int A[N],B[N],C[N],D[N],E[N];
void mul(int *a,int *b,int *c,int LG=-1){//using: Array A and B
if(LG!=-1){
lim=(1<<LG),invlim=ksm(lim,mod-2);
for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(LG-1));
}
for(int i=0;i<lim;i++)A[i]=B[i]=0;
for(int i=0;i<(lim>>1);i++)A[i]=a[i],B[i]=b[i];
NTT(A,1),NTT(B,1);
for(int i=0;i<lim;i++)A[i]=1ll*A[i]*B[i]%mod;
NTT(A,-1);
for(int i=0;i<lim;i++)c[i]=A[i];
}
void inv(int *a,int *b,int LG){//using: Array C
b[0]=ksm(a[0],mod-2);
for(int k=1;k<=LG+1;k++){
mul(b,a,C,k);
for(int i=0;i<(1<<k);i++)C[i]=(mod-C[i])%mod;
(C[0]+=2)%=mod;
mul(C,b,b,k);
}
}
void rever(int *a,int *b,int lim){
for(int i=0;i<lim;i++)b[i]=a[i];
reverse(b,b+lim);
}
void modulo(int *a){//using:Array D
rever(a,D,2*m);
for(int i=m;i<lim;i++)D[i]=0;
mul(D,invrevg,E);
reverse(E,E+m);
for(int i=m;i<lim;i++)E[i]=0;
mul(E,g,D);
for(int i=0;i<m;i++)a[i]=(a[i]-D[i]+mod)%mod;
for(int i=m;i<lim;i++)a[i]=0;
}
}
using namespace Poly;
int c[N],d[N];
void KSM(){
c[1]=1,d[0]=1;
for(;n;n>>=1,mul(c,c,c),modulo(c))if(n&1)mul(d,c,d),modulo(d);
}
int main(){
scanf("%d%d",&n,&m);
for(int i=1;i<=m;i++)scanf("%d",&g[m-i]),g[m-i]=-g[m-i];
g[m]=1;
for(int i=0;i<=m;i++)(g[i]+=mod)%=mod;
for(int i=0;i<m;i++)scanf("%d",&f[i]),(f[i]+=mod)%=mod;
while((1<<all)<(m<<1))all++;
reverse(g,g+m+1);
inv(g,invrevg,all);
reverse(g,g+m+1);
for(int i=m+1;i<(1<<all);i++)invrevg[i]=0;
lim=(1<<all),invlim=ksm(lim,mod-2);
for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(all-1));
KSM();
for(int i=0;i<m;i++)(res+=1ll*d[i]*f[i]%mod)%=mod;
printf("%d\n",res);
return 0;
}