即使是一道菜题,也掩盖不了窝生成函数弱的事实。
窝看到题目只想到了DP,还是生成函数不够熟。然后直到神仙WWJ提醒我用生成函数……
首先是排列,那就可以写成指数型生成函数的优美形式。直接表示成exp吧,然后d的倍数就用单位根性质来处理。
所以实际上就是求 ([x^n] (frac{sum_{i=0}^{D - 1} e^{omega_{D}^{i} x}}{D})^K)
显然可以把底下的 (D^K) 提出来,此时求上面那个东西。
怎么求第 (n) 项系数啊?
这时候可以发现 (D) 大的时候 (K) 小了(然后只看了最后一条范围就被坑了)
于是发现可以暴力二项式展开!
枚举 (i) 次单位根的个数,复杂度 (O(K^{D - 1})),
然后剩下的东西根据指数函数的性质可以合并成一项 (e^{Cx}) ,此时系数只是一个快速幂的事情了。
单位根的事情就随便求一个丢上去好了。
#include <bits/stdc++.h>
const int mod = 19491001;
const int MAXN = 500010;
typedef long long LL;
int mul(int a, int b) { return (LL) a * b % mod; }
void reduce(int & x) { x += x >> 31 & mod; }
int fastpow(int a, int b) {
int res = 1;
for (; b; b >>= 1, a = mul(a, a)) if (b & 1) res = mul(res, a);
return res;
}
int n, K, D, fac[MAXN], inv[MAXN];
int C(int a, int b) { return (LL) fac[a] * inv[b] % mod * inv[a - b] % mod; }
int pr[3], ans;
void dfs(int S, int rest, int sum, int way) {
if (S == D - 1) {
reduce(sum += mul(pr[S], rest) - mod);
reduce(ans += mul(fastpow(sum, n), way) - mod);
return ;
}
for (int i = 0; i <= rest; ++i)
dfs(S + 1, rest - i, (sum + (LL) pr[S] * i) % mod, mul(way, C(rest, i)));
}
int main() {
std::cin >> n >> K >> D;
fac[0] = fac[1] = inv[0] = inv[1] = 1;
for (int i = 2; i <= K; ++i) {
fac[i] = mul(fac[i - 1], i);
inv[i] = mul(inv[mod % i], mod - mod / i);
}
for (int i = 2; i <= K; ++i)
inv[i] = mul(inv[i - 1], inv[i]);
pr[0] = 1;
if (D == 2) pr[1] = mod - 1;
if (D == 3) pr[1] = 663067, pr[2] = mul(pr[1], pr[1]);
dfs(0, K, 0, 1);
ans = mul(ans, fastpow(D, mod - 1 - K));
std::cout << ans << std::endl;
return 0;
}