AtCoder Regular Contest 125

zoukankan html css js c++ java

AtCoder Regular Contest 125
题目传送门：AtCoder Regular Contest 125。
目录
A - Dial Up
B - Squares
C - LIS to Original Sequence
D - Unique Subsequence
E - Snack
F - Tree Degree Subset Sum
A - Dial Up
题意简述

给定一个长度为 (n) 的 01 串 (s)，和一个长度为 (m) 的 01 串 (t)。

你有一个 01 串 (b)，初始时为空串。你可以执行两种操作：

向左或者向右对 (s) 循环移位。

把 (s) 的首字符添加到 (b) 的末尾。

问是否可能能把 (b) 变成 (t)，如果可行，求出最少的操作次数。

数据范围：(1 le n, m le 2 imes {10}^5)。
AC 代码

#include <cstdio> #include <algorithm> const int MN = 200005; const int MM = 200005; int N, M; int S[MN], T[MM]; int A, B; int main() { scanf("%d%d", &N, &M); for (int i = 1; i <= N; ++i) scanf("%d", &S[i]), A += S[i]; for (int i = 1; i <= M; ++i) scanf("%d", &T[i]), B += T[i]; if ((A == 0 && B == 0) || (A == N && B == M)) return printf("%d ", M), 0; if (A == 0 || A == N) return puts("-1"), 0; if ((S[1] == 0 && B == 0) || (S[1] == 1 && B == M)) return printf("%d ", M), 0; int Ans = N; for (int i = 2; i <= N; ++i) if (S[i] != S[1]) Ans = std::min({Ans, i - 2, N - i}); T[0] = S[1]; for (int i = 1; i <= M; ++i) Ans += T[i] != T[i - 1]; printf("%d ", Ans + M); return 0; }
无解是容易判断的：如果 (s) 全为一种字符，而 (t) 中含有至少一个另一种字符则无解。

添加字符的操作需要恰好执行 (m) 次，输出答案的时候加上就行了，那么就是要求出最少的循环移位次数。

如果 (t) 全为一种字符，而且恰好就是初始时的 (s) 的首字符，那就不需要循环移位，直接输出 (m)。

否则是需要至少一次循环移位到另一种字符上的，这一定是选取向左或向右碰到的最近的一个不同的字符。

在第一次需要循环移位的时候（也就是 (t) 中第一个不等于 (s) 的首字符的字符）移动到那里，然后接下来的每一次切换字符（即 (t_i e t_{i - 1})）只需要在那个位置周围抖动一下即可。

据此容易写出代码。

时间复杂度为 (mathcal O (n + m))。

B - Squares

题意简述

给定正整数 (n)，求满足 (1 le x, y le n) 且 (x^2 - y) 为完全平方数的数对 ((x, y)) 的数量，对 (998244353) 取模。

数据范围：(1 le n le {10}^{12})。
AC 代码

#include <cstdio> #include <cmath> typedef long long LL; const int Mod = 998244353; LL N; int main() { scanf("%lld", &N); LL S = 0, D = 0, Ans = 0; for (int i = 1; ; ++i) { S += 2 * i - 1; D += 2; if (S > N) break; Ans += (N - S) / D + 1; } printf("%lld ", Ans % Mod); return 0; }
要让 (x^2 - y) 为完全平方数 (z^2)（(z ge 0)），且 (1 le x, y le n)，那么一定有 (0 le z < x le n)，且 (x^2 - z^2 le n)。

可以发现就是对差值 (le n) 的完全平方数数对计数，对 (x le n) 的限制是不必需的，因为如果存在 (x^2 - z^2 le n)（满足 (0 le z < x)）则必然有 (x le frac{n + 1}{2})，而在数据范围下必然有 (frac{n + 1}{2} le n)。

即求出此序列中有多少对不同的数的差 (le n)：([0, 1, 4, 9, 16, 25, 36, 49, ldots ])。

我们考虑做此转换：将序列差分得到 ([1, 3, 5, 7, 9, ldots ])，这是一个等差数列。

然后即是求这个新序列中有多少段非空区间的和 (le n)，然后对区间长度分开考虑：
- 区间长度为 (1)：即是求 ([1, 3, 5, 7, 9, ldots ]) 中有多少个数 (le n)。
- 区间长度为 (2)：即是求 ([4, 8, 12, 16, 20, ldots ]) 中有多少个数 (le n)。
- 区间长度为 (3)：即是求 ([9, 15, 21, 27, 33, ldots ]) 中有多少个数 (le n)。
可以发现每一个都是等差数列，所以每个的答案是很好通过公式计算的，总答案就是每个的答案加起来。

而可以发现每个等差数列的首项都是完全平方数，所以只要枚举 (sqrt{n}) 次这样的等差数列即可。

时间复杂度为 (mathcal O !left( sqrt{n} ight))。

C - LIS to Original Sequence

题意简述

给出一个长度为 (k) 的整数序列 (a_1, a_2, ldots , a_k) 满足此序列严格递增且值域在 ([1, n]) 内。

可以证明一定存在一个 (1 sim n) 的排列 (p_1, p_2, ldots , p_n)，满足序列 (a) 是它的最长上升子序列（LIS）之一。

在所有满足条件的序列 (p) 中，输出字典序最小的那个。

数据范围：(1 le k le n le 2 imes {10}^5)。
AC 代码

#include <cstdio> const int MN = 200005; int N, K; int B[MN]; int main() { scanf("%d%d", &N, &K); int j = 1; for (int i = 1; i < K; ++i) { int x; scanf("%d", &x); printf("%d ", x); B[x] = 1; while (B[j]) ++j; if (j < x) { printf("%d ", j); B[j] = 1; while (B[j]) ++j; } } for (int i = N; i >= j; i--) if (!B[i]) printf("%d%c", i, " "[i == j]); return 0; }
要让字典序最小，我们肯定首先贪心地进行考虑。

显然不能有 (p_1 < a_1)，否则加入 (p_1) 的话就会增加 LIS 的长度。

当 (k = 1) 时显然只能有 (p = [n, n - 1, ldots , 2, 1])，否则 LIS 长度将至少为 (2)。

但是我们可以证明当 (k ge 2) 时，一定可以取 (p_1 = a_1) 而仍然存在满足条件的 (p)。一个证明角度如下：
- 取 (p) 的第 (1) 段为 (a_1, a_1 - 1, ldots , 1)。
- 取 (p) 的第 (2) 段为 (a_2, a_2 - 1, ldots , a_1 + 1)。
- ……
- 取 (p) 的第 (k - 1) 段为 (a_{k - 1}, a_{k - 1} - 1, ldots , a_{k - 2} + 1)。
- 取 (p) 的最后一段为 (n, n - 1, ldots , a_k, a_k - 1, ldots , a_{k - 1} + 1)。
举个例子，如果 (a = [3, 5, 6, 8]) 而 (n = 9)，令 (p = [3, 2, 1, 5, 4, 6, 9, 8, 7])。

按照上述分段方式，每一段内都是递减的，所以 LIS 在每一段中最多取一个，而存在一种取法取得到序列 (a)，所以满足条件。

我们已经让 (p_1) 满足字典序尽量小了。但是我们肯定不满足于当 (a_1 ge 2) 时让 (p_2 = a_1 - 1)。如果此时让 (p_2 = 1) 会如何呢？

我们考虑上文的分段论证法，如果我们仍然可以让整个序列 (p) 分成 (k) 段，每段内都递减，而 (a_1 sim a_k) 依次存在于每一段内，则此时的 (p) 一定是满足条件的。

所以按照此原理，显然当 (a_1 ge 2) 时是可以让 (p_2 = 1) 的。即有：
- 如果 (a_1 = 1)，则 (p_1 = a_1 = 1)。
- 如果 (a_1 ge 2)，则 (p_1 = a_1)，(p_2 = 1)。
但是对于再下一个元素（如果 (a_1 = 1) 那就是 (p_2) 否则就是 (p_3)）呢？

它当然可以为 (a_2)（如果 (k ge 3)），这是由上面的构造保证的，但是它又不能在 ([a_1 + 1, a_2 - 1]) 中，否则会增加 LIS 的长度。

那么我们要减小字典序，就是说要让它小于 (a_1)，对于 (a_1 = 1) 来说这是不可能的，对于 (a_1 ge 2) 来说这也是不合法的，否则 ([p_2 = 1 , p_3, a_2, a_3, ldots , a_k]) 就会成为更长的 LIS。

那么也就是说只能有下一个元素为 (a_2)（如果 (k ge 3)）。如果 (k = 2) 的话后面就只能从 (n) 一路递减下来了。

将这样的过程推广到 (a) 后面的每一项（除了最后一项 (a_k)），就是：
- (p) 的下一个元素为 (a_i)。
- 如果最小的可用元素小于 (a_i)，则 (p) 的下一个元素为这个最小的可用元素。
- 令 (i) 自增 (1)，直到 (i = k) 为止，此时 (p) 的尾部填充从 (n) 递减的可用元素。
这样的构造方法，由于上文的分段论证法，是合法的。而它的字典序最小性由每一步的贪心保证。

找最小可用元素维护一个指针即可。时间复杂度为 (mathcal O (n))。

D - Unique Subsequence

题意简述

给定一个长度为 (n) 的序列 (a_1, a_2, ldots , a_n)，且 (1 le a_i le n)，但可以有重复元素。

求出在它之中作为子序列只出现过恰好一次的非空序列个数，对 (998244353) 取模。

注：只出现过恰好一次指的是仅存在唯一下标序列满足 (a) 对应下标的子序列为此序列。

数据范围：(1 le n le 2 imes {10}^5)。
AC 代码

#include <cstdio> const int Mod = 998244353; const int MN = 200005; int N; int l[MN], v[MN], b[MN]; inline void Add(int i, int x) { for (; i <= N; i += i & -i) b[i] = (b[i] + x) % Mod; } inline int Qur(int i) { int s = 0; for (; i; i -= i & -i) s = (s + b[i]) % Mod; return s; } int main() { scanf("%d", &N); int s = 0; for (int i = 1; i <= N; ++i) { int x; scanf("%d", &x); int f; if (l[x]) { f = (s - Qur(l[x] - 1) + Mod) % Mod; Add(l[x], Mod - v[x]); s = (s - v[x] + Mod) % Mod; } else f = s + 1; Add(i, f); s = (s + f) % Mod; l[x] = i; v[x] = f; } printf("%d ", s); return 0; }
我们肯定首先考虑子序列自动机的结构。

可以发现这基本上就是要求“正着走子序列自动机得到的下标字典序最小的子序列位置”，与“反着走得到的下标字典序最大的位置”是一样的。

可以证明这个条件等价于：在子序列自动机上走每一步的时候，例如 (p_i o p_{i + 1})，这之中必须满足 (a) 在下标区间 ([p_i + 1, p_{i + 1} - 1]) 中不存在另一个 (a_{p_i})。否则 (p_i) 就可以移动到那个位置上而保证还是相同的子序列，但下标集合不唯一。同时还需要保证它在子序列自动机最终到达的位置 (p_k) 是这个数值 (a_{p_k}) 的最后一次出现。

转换一下角度，这即是说 (p_i) 是 (p_{i + 1}) 的上一次出现 (a_{p_i}) 的位置，这和子序列自动机的“(p_{i + 1}) 是 (p_i) 的下一次出现 (a_{p_{i + 1}}) 的位置”是对称的。

也就是说要做 DAG 转移的话，假设当前位置是 (oldsymbol{i})，上一次出现位置是 (oldsymbol{mathit{last}})，那么只接收来自 (oldsymbol{[mathit{last}, i - 1]}) 中的，是当前最后一次出现的数值的位置的转移。

我们发现这就是限定一段区间内的转移求和，并且会实时更新转移的数组（每计算一个新位置就要把上一次出现位置的转移取消掉）。

这可以通过树状数组实现。时间复杂度为 (mathcal O (n log n))。

E - Snack

题意简述

有 (n) 种小球，第 (i) 种小球的颜色为 (i) 并且总共有 (a_i) 个。

有 (m) 个盒子，第 (i) 个盒子中，每一种颜色的小球都不能超过 (b_i) 个，而总小球数不能超过 (c_i) 个。

求最多能在盒子里装入多少小球。

数据范围：(1 le n, m le 2 imes {10}^5)。
AC 代码

#include <cstdio> #include <algorithm> #include <functional> #include <climits> typedef long long LL; const int MN = 200005; const int MM = 200005; int N, M; LL A[MN], B[MM], C[MM]; int t[MM], per[MM]; int main() { scanf("%d%d", &N, &M); for (int i = 1; i <= N; ++i) scanf("%lld", &A[i]); for (int i = 1; i <= M; ++i) scanf("%lld", &B[i]); for (int i = 1; i <= M; ++i) scanf("%lld", &C[i]); for (int i = 1; i <= M; ++i) { LL tmp = N - C[i] / B[i]; if (tmp < 0) tmp = 0; t[i] = tmp; per[i] = i; } std::sort(per + 1, per + M + 1, [](int i, int j) { return t[i] < t[j]; }); std::sort(A + 1, A + N + 1); LL Ans = LLONG_MAX; LL SumC = 0, SumB = 0, SumA = 0; for (int i = 1; i <= M; ++i) SumC += C[i]; int j = 1; for (int i = 0; i <= N; ++i) { while (j <= M && t[per[j]] == i) { SumC -= C[per[j]]; SumB += B[per[j]]; ++j; } if (i != 0) SumA += A[i]; Ans = std::min(Ans, SumA + SumC + SumB * (N - i)); } printf("%lld ", Ans); return 0; }
显然这是一个网络最大流模型。如图所示：

根据最大流最小割定理，我们转成最小割考虑。

如果左边割掉 (x) 条边，右边割掉 (y) 条边，那么就是左边没割掉的每个点，和右边没割掉的每个点，中间的边都要被割掉。

花费即是：

[egin{aligned} &= sum_{i in X} a_i + sum_{i in Y} c_i + sum_{i in (N setminus X)} sum_{j in (M setminus Y)} b_j \ &= sum_{i in X} a_i + sum_{i in Y} c_i + sum_{i in (M setminus Y)} b_i (n - x) \ &= sum_{i in X} a_i + sum_{i = 1}^{m} egin{cases} c_i & ext{, if } (i, T) ext{ is cut} \ b_i (n - x) & ext{, if } (i, T) ext{ is not cut} end{cases} end{aligned} ]
再注意到，左侧的 (a_i)，只要确定了 (x)，如何选取是不影响右侧的，由于是求最小割，所以一定是按 (a_i) 从小到大排序后取前缀。

再注意到，右侧的每个点可以自由选择与 (T) 之间的边是否被割，也就是可以选取 (min(c_i, b_i (n - x)))。

对于一个固定的 (i)，可以解得当 (displaystyle x ge n - frac{c_i}{b_i}) 时才会有 (b_i (n - x) le c_i)，否则 (c_i < b_i (n - x))。

令 (displaystyle t_i = max !left( leftlceil n - frac{c_i}{b_i} ight ceil! , 0 ight)! = max !left( n - !leftlfloor frac{c_i}{b_i} ight floor! , 0 ight))，即如果 (0 le x < t_i) 则取 (c_i)，否则取 (b_i (n - x))。

则按照 (t_i) 从小到大排序，从小到大枚举 (x)，可以双指针统计答案。

时间复杂度为 (mathcal O (n log n + m log m))。

F - Tree Degree Subset Sum

题意简述

有一棵 (n) 个结点的无根树，令第 (i) 个结点的度数为 (d_i)。

求满足条件的数对 ((x, y)) 的数量：存在一个大小为 (x) 的点集使得其中结点的度数之和为 (y)。

数据范围：(2 le n le 2 imes {10}^5)。
题意简述

#include <cstdio> #include <functional> typedef long long LL; const int Inf = 0x3f3f3f3f; const int MN = 200005; int N, deg[MN], buk[MN]; int main() { scanf("%d", &N); for (int i = 1; i <= 2 * N - 2; ++i) { int x; scanf("%d", &x); ++deg[x]; } for (int i = 1; i <= N; ++i) ++buk[deg[i] - 1]; static int f[MN]; for (int i = 1; i <= N - 2; ++i) f[i] = Inf; for (int i = 1; i <= N - 2; ++i) if (buk[i]) { int len = buk[i] + 1; static int g[MN]; for (int j = 0; j < i; ++j) { static int que[MN]; int head = 1, tail = 0; for (int k = j; k <= N - 2; k += i) { auto v = [&](int x){ return f[x] - x / i; }; while (head <= tail && v(que[tail]) > v(k)) --tail; que[++tail] = k; while (que[head] / i <= k / i - len) ++head; g[k] = v(que[head]) + k / i; } } for (int k = 0; k <= N - 2; ++k) f[k] = g[k]; } LL Ans = 0; for (int i = 0; i <= N - 2; ++i) Ans += std::max((N - f[N - 2 - i]) - f[i] + 1, 0); printf("%lld ", Ans); return 0; }
我们发现树本身并没有什么用，计算出来度数序列后就可以扔了。

这有点像是个背包问题，但是我们不可能存储两维的信息。

看起来 (displaystyle sum_{i = 1}^{n} d_i = 2 n - 2) 的性质应该是个突破口。

对于这类总和固定的正整数序列，我们知道其中不同的数的个数是 (mathcal O !left( sqrt{n} ight)) 的。但是对本题帮助不大。

我们知道一棵大小大于等于 (2) 的树一定有叶子结点。

对应到序列中就是当长度为 (n) 的正整数序列的总和为 (2 n - 2) 时一定有某个 (d_i = 1)。

如果从叶子结点的角度考虑，每加入一个叶子节点，可以让 (x, y) 均增加 (1)，反之均减少 (1)。

也就是 (y - x) 的值是不变的，不过这样比较麻烦，我们令所有 (d_i) 均减少 (1)，这样就变成非负整数序列的总和为 (n - 2)。

这样的话就是 (y) 不变，(x) 自由变化了。要求的东西的数量也不受影响。

关键点来了：我们猜想，对于一个固定的 (y) 值，对应的满足条件的 (x) 值要么不存在，要么形成一段连续区间。证明：
- 令这个 (y) 对应的最小 (x) 为 (m(y))，而最大 (x) 为 (M(y))。
- 我们即是要证明 (M(y) - m(y) le 2 z)，其中 (z) 是 (d_i = 0) 的数目。
- 这是因为在 (x) 取值最小的方案中，权值为 (0) 的元素肯定一个都没取；而在 (x) 取值最大的方案中，权值为 (0) 的元素肯定全部取到了。
- 所以调整最小的方案可以取到 ([m(y), m(y) + z]) 之间的所有 (x)，而调整最大的方案可以取到 ([M(y) - z, M(y)]) 之间的所有 (x)。
- 如果有 (M(y) - m(y) le 2 z) 成立，这两个区间的并即是 ([m(y), M(y)])。接下来证明此式确实成立：
- 我们可以说明任意情况下都有 (-z le y - x le z - 2)，于是当 (y) 固定时所有可能的 (x) 之间最多差 (2 z - 2)。
- 我们考虑 (y - x) 的意义就是每个元素的权值再减去 (1)，即权值 (ge -1) 且总和为 (-2) 的情况，而权值恰好为 (-1) 的元素有 (z) 个。
- 显然，权值非负的数的权值总和恰好为 (z - 2)（因为 (-2 - z cdot (-1) = z - 2)），所以取得再多也不能超过 (z - 2)。
- 所以确实有 (-z le y - x le z - 2)。证毕。
那么我们只需要求出所有的 (M(y)) 和 (m(y)) 即可。这就可以通过背包求了，但是朴素做复杂度是 (mathcal O (n^2)) 的。

不过注意到不同的数的个数是 (mathcal O !left( sqrt{n} ight)) 的，所以相当于做多重背包，用单调队列优化即可。

注意要判对于一个 (y) 区间为空的情况，即不存在合法的 (x)。

一个常数优化手段是注意到如果区间不为空的话，(M(y) = n - m(n - 2 - y))，所以不用做两次背包 DP。

这题中好像二进制分组优化多重背包比直接单调队列跑得快，~~虽然理论上多一个 (log)，我对此并不太确定是什么原理~~。jiangly 指正这里不多 (log)，因为总和为 (s) 的正整数序列 (a) 的 (sum log c_k) 为 (mathcal O !left( sqrt{n} ight))，其中 (c_k) 表示 (a_i = k) 的个数。

时间复杂度：(mathcal O ! left( n sqrt{n} ight))。
来自 PinkRabbit 的博客园(https://www.cnblogs.com/PinkRabbit/)。未经允许，请勿转载。
查看全文

相关阅读:
Linux内核参数之 overcommit_memory
Nodejs安装模块之 mysql-libmysqlclient
Mongo分片维护之平衡器
 Mac下搭建php开发环境【转】
Mongodb 启动参数
 Nodejs npm安装某些包失败
 linux shell 字符串操作（长度，查找，替换）
个人作业——软件工程实践总结&个人技术博客
 个人作业——软件评测
 结对第二次作业——某次疫情统计可视化的实现

原文地址：https://www.cnblogs.com/PinkRabbit/p/ARC125.html

AtCoder Regular Contest 125

A - Dial Up

B - Squares

C - LIS to Original Sequence

D - Unique Subsequence

E - Snack

F - Tree Degree Subset Sum