首先所有亵渎的张数(k=m+1),我们考虑每一次使用亵渎,都是一堆(i^k)之和减去那几个没有出现过的(j^k),对于没有出现过的我们可以直接快速幂处理并减去,所以现在的问题就是如果求(sum_{i=1}^ni^k)
据attack巨巨说,上面那个东西是一个以(n)为自变量的(k+1)次多项式,因为我们只需要单点求值,所以可以先求出(k+2)个值,然后就可以用拉格朗日插值来每次(O(k))地求出一个值
至于这里是如何优化到(O(k))的,本来拉格朗日插值的形式是这样的$$f(k)=sum_{i=0}^ny_iprod_{j
eq i}frac{k-x_j}{x_i-x_j}$$
然后因为这里我们选的点值为前(k+1)个点,也就是说(x_i=i+1),对于分子,我们可以预处理出关于(k-x_i)的前缀和和后缀和,关于分母预处理出阶乘,那么每一个(y_i)处的后面那一串都可以(O(1))计算了(分母的阶乘要注意符号,因为分母是写成(fac[i] imes fac[n-i]),当(n-i)为奇数的时候原式的值实际上是负数)
不过代码里因为懒就直接每一次改的时候乘上逆元,反正复杂度也就多了一个(log)
//minamoto
#include<bits/stdc++.h>
#define R register
#define ll long long
#define fp(i,a,b) for(R int i=a,I=b+1;i<I;++i)
#define fd(i,a,b) for(R int i=a,I=b-1;i>I;--i)
#define go(u) for(int i=head[u],v=e[i].v;i;i=e[i].nx,v=e[i].v)
using namespace std;
char buf[1<<21],*p1=buf,*p2=buf;
inline char getc(){return p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++;}
ll read(){
R ll res,f=1;R char ch;
while((ch=getc())>'9'||ch<'0')(ch=='-')&&(f=-1);
for(res=ch-'0';(ch=getc())>='0'&&ch<='9';res=res*10+ch-'0');
return res*f;
}
char sr[1<<21],z[20];int C=-1,Z=0;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
void print(R int x){
if(C>1<<20)Ot();if(x<0)sr[++C]='-',x=-x;
while(z[++Z]=x%10+48,x/=10);
while(sr[++C]=z[Z],--Z);sr[++C]='
';
}
const int N=105,P=1e9+7;
inline int add(R int x,R int y){return x+y>=P?x+y-P:x+y;}
inline int dec(R int x,R int y){return x-y<0?x-y+P:x-y;}
inline int mul(R int x,R int y){return 1ll*x*y-1ll*x*y/P*P;}
int ksm(R int x,R int y){
R int res=1;
for(;y;y>>=1,x=mul(x,x))if(y&1)res=mul(res,x);
return res;
}
int f[N],n,m,res;ll a[N],now;
int calc(R int x,R int n){
if(x<=n)return f[x];
int ty=(n&1)?P-1:1,tmp=1,res=0;
fp(i,1,n)tmp=1ll*(x-i)*tmp%P*ksm(i,P-2)%P;
fp(i,0,n){
res=add(res,1ll*ty*f[i]%P*tmp%P),
tmp=1ll*tmp*(x-i)%P*ksm(x-i-1,P-2)%P*(n-i)%P*ksm(i+1,P-2)%P,
ty=P-ty;
}return res;
}
int main(){
// freopen("testdata.in","r",stdin);
int T=read();
while(T--){
n=read(),m=read(),res=0;
fp(i,1,m)a[i]=read();
fp(i,1,m+2)f[i]=add(f[i-1],ksm(i,m+1));
sort(a+1,a+1+m);
fp(i,1,m+1){
now=n-a[i-1];
res=add(res%P,calc(now,m+2));
fp(j,i,m)res=dec(res,ksm(a[j]-a[i-1],m+1));
}printf("%d
",res);
}return 0;
}