(k) 短路问题简介
所谓“(k) 短路”问题,即给定一张 (n) 个点,(m) 条边的有向图,给定起点 (s) 和终点 (t),求出所有 (s o t) 的简单路径中第 (k) 短的。而且一般来说 (n, m, k) 的范围在 (10^5) 级别,于是爆搜或者 (k) 次最短路这样的算法我们不做讨论。
本文将介绍求解 (k) 短路问题的两种经典方法:(A^*) 算法 以及 可持久化可并堆做法。
(A^*) 算法
(A^*) 思想简述
很显然地,我们有一个暴力的 Bfs 做法:第 (k) 次搜到点 (t) 的就是所求。然而这样太慢了,我们考虑优化方案。
对于搜索中的一个状态 (x),令 (g(x)) 为当前状态下该点到 (s) 的路径长。
朴素的 Bfs 就是直接暴力地拓展,但我们可以设计一种方案,使得 相对接近终点的状态优先拓展。
具体
A* 算法中,我们会引入一个函数 (f(x)),表示 (x) 的 估值,那么函数 (f) 也被称为 估价函数。函数 (f) 的计算有一个通式:
其中 (g(x)) 代表 状态 (x) 当前的代价,(h(x)) 表示 状态 (x) 到终点状态在最佳状态下的代价。一般而言,(h) 的计算方式由自己决定,但需要根据以下原则:
- 必须不小于真实代价,否则没有意义,即跑出来的答案会错误;
- 尽量向真实代价靠拢,这样使得算法尽可能的快。
在搜索时,我们优先拓展 (f(x)) 值最小的状态。一般会选用 堆(优先队列) 实现。
(A^*) 算法在本题的运用
所幸,(h(x)) 的定义在本题还算比较显然——到终点 (t) 的最短距离。而且可以发现 (h) 已经是最优的了。
于是算法就不难了:
- 用一个小根堆存储状态 ((x, g(x)))。堆顶元素为 (f) 最小的。
- (g) 函数的值不难预处理,只要在 反图 上以 (t) 为原点跑 Dijkstra 算法即可。
- 开始时,很显然有 (g(s) = 0),那把 ((s, g(s))) 存入堆中。
- 每次取出堆顶元素 ((x, g(x)))。如果 (x=t) 那么表示找到一条。
- 向相邻点拓展并放入堆中。
- 如此往复知道找到 (k) 条即可。
代码实现
struct statu { // 定义状态
int pos; double g, f;
bool operator < (const statu& rhs) const {
return f > rhs.f; // 为了方便比较将 f 值也记下来
}
};
int aStar(int k) {
priority_queue<statu> pq;
pq.push(statu{1, 0, dist[s]}); // 初始状态
while (!pq.empty()) {
statu x = pq.top(); pq.pop(); // 抽出当前最优状态
if (x.pos == t) // 到终点
if (--k == 0) return x.g; // 如果这是第 k 条,返回
for (auto e : G[x.pos])
pq.push(statu{ // 拓展状态
e.to, x.g + e.val,
x.g + e.val + dist[e.to]
});
}
return -1; // 没有第 k 条
}
复杂度
随机数据这个算法跑的很快,但如果图是一个 (n) 元环时,复杂度会达到 (O(nklog n)) 级别。
可持久化可并堆做法
最短路树
所谓最短路树,就是从根通过树边到每个点的路径长和原图上的最短路径长相同,那么这样的树就是最短路树。
最短路树可以通过求最短路的算法(Dijkstra/Spfa)求出。
这里我们选定终点 (t) 为根,在反图上求出最短路树 (T)。那么每个点通过树边都是到 (t) 点的路径最短路。
最短路树与一般路径之间的关联
对于一条 (s o t) 的路径 (p),我们选取其中的 非树边,作为一个集合,记为 (side(p))。即 (side(p) = p setminus (p cap T))。
为方便说明,我们引入一些记号:
- (front(e), back(e)):表示边 (e) 的前端点(靠近起点)和后端点(靠近终点)。
- (len(e)):边或路径 (e) 的长度。
- (dist(x)):点 (x) 到终点 (t) 的最短距离。
(side(p)) 有如下性质:
- 设一条边 (e) 的增长量 (delta(e) = dist(front(e)) + len(e) - dist(back(e))),可以理解为把这条边换掉原来的 额外增加的长度 。那么路径 (p) 的长 (len(p) = dist(s) + sumlimits_{ein side(p)} delta(e))。
- 我们将 (side(p)) 中的边按 路径的顺序 排列好,并选取其中相邻的两条边 (e_1, e_2)((e_1) 在前,注意 (e_1, e_2) 在原图中不一定相邻)。那么 (u=back(e_1),v=front(e_2)) 两点要么是同一个点,要么 (v) 是 (u) 的祖先。原因比较显然:两边如果在图上相邻那么就是同一个点,反之就由树边向树根 (t) 的方向相连。
- 对于一个确定的 (side(p)) 只有一个 (s o t) 的路径 (p) 与之对应。因为最短路树上两点只有一条只经过树边的路径,而 (side(p)) 其他连续的路径段也是确定的。
将问题转化
根据性质 1,可以发现答案就是 (dist(s) + sumlimits_{ein side(p)}delta(e)) 的第 (k) 小值。
那么我们只要不断构造出这 (k) 个 (side(p)) 即可。
如何构造 (side(p))
根据第二个性质,我们可以对一个现有的 (side(p)) 推出另一个新的 (side(q)):
(side(p)) 最尾端的边为 (e),令 (u = front(e), v = back(e))。那么有两种构造策略:
- 用与 (x) 相连的一条不短于 (e) 的边 替换 掉 (e)。
- 在 (y) 后面新接上一条 最短路树上祖先方向出去的最小边 (e^prime)。
顺带一提,这两个方法分别对应性质 2 的两种情况。
于是我们实现了通过现有的一条 (s o t) 的路径得出另一条更长的路径。如果我们可以通过某种手段达到在可以承受的时间内完成一次构造,那么只要每次选取一个最小的 (side(p)),重复执行构造,直至选出第 (k) 个即可。这个 (side(p)) 的集合可以用小根堆维护。
快速构造 (side(p)) 需要我们在每个节点维护一个 与之相连的所有非树边和祖先出去的边的最小边;
很自然的想到堆,堆中存储路径的尾边对应的堆节点以及路径长度。
如果建出了每个节点的堆,那么上述的构造策略可以转化为(设当前堆节点为 (x)):(x) 的左右儿子替换掉当前的堆节点,或者 (x) 对应边的尾端点对应堆的根。
那么我们实现了一次 (O(log k)) 的转移(维护 (side(p)) 的小根堆的大小为 (O(k)))。
关于堆
堆的话,可以通过最短路树从祖先向叶子的方向合并构造。
但很显然用一般的二叉堆是很难避免 MLE 的结果的。不过对于可并堆我们可以考虑一下这个问题:可并堆之所以有问题是因为 每次合并都需要保留前两个堆的信息。
于是要解决这个问题,就得让信息保留。而整个堆复制是不现实的,只能 共用一些节点。那么显而易见我们需要——
可持久化可并堆
一般我们用 可持久化左偏树 实现,这样时空复杂度都是线性对数级别的。
其实会左偏树的话这玩意也不难写。可以参考 OI-Wiki 可持久化可并堆 标签页学习。
小结
好像一切都明朗了。来归纳一下算法的步骤吧:
- 在反图上跑 Dijkstra;
- 构造可持久化左偏树:
-
- 对于每个节点都扫一遍邻边(除树边),然后将其 (delta) 值与另一端点编号一并插入当前点的左偏树中;
- 然后向树边祖先方向将堆合并到此。
- 构造前 (k) 个 (side(p)):
-
- 取出堆顶;
- 向左偏树节点儿子拓展;
- 向对应边结束点的左偏树的根拓展。
- 如此在堆中取出的第 (k) 个记为答案。
代码实现
P2483 【模板】k短路 / [SDOI2010]魔法猪学院 代码
#include <algorithm>
#include <cstring>
#include <iostream>
#include <queue>
#include <vector>
using namespace std;
const int N = 5e4 + 5;
const int M = 2e5 + 5;
const double inf = 1e16;
const double eps = 1e-8;
struct Graph {
struct Edge {
int to, nxt;
double len;
} e[M];
int head[N], ecnt = 0;
Graph() { memset(head, -1, sizeof(head)), ecnt = 0; }
inline void insert(int u, int v, double w) {
e[ecnt] = Edge{v, head[u], w}; head[u] = ecnt++;
}
inline int nxt(int i) { return e[i].nxt; }
inline int to(int i) { return e[i].to; }
inline double len(int i) { return e[i].len; }
} G, R;
int n, m;
double E;
int fa[N];
double dist[N];
bool book[N];
struct vtx {
int pos; double dist;
bool operator < (const vtx& rhs) const {
return dist > rhs.dist;
}
};
priority_queue<vtx> pq;
void Dijkstra() {
fill(dist + 1, dist + 1 + n, inf);
pq.push(vtx{n, dist[n] = 0.0});
while (!pq.empty()) {
int x = pq.top().pos; pq.pop();
if (book[x]) continue;
book[x] = true;
for (int i = R.head[x]; ~i; i = R.nxt(i)) {
int y = R.to(i); double l = R.len(i);
if (dist[y] > dist[x] + l) {
dist[y] = dist[x] + l;
fa[y] = i;
pq.push(vtx{y, dist[y]});
}
}
}
}
namespace LefT {
struct lef {
int ch[2], dist;
int end; double delta;
} tr[N << 5];
int total = 0;
inline int create(double d, int e) {
int x = ++total;
tr[x] = lef{{0, 0}, 1, e, d};
return x;
}
inline int copy(int x) {
return tr[++total] = tr[x], total;
}
int merge(int x, int y) {
if (!x || !y) return x | y;
if (tr[x].delta > tr[y].delta) swap(x, y);
int z = copy(x);
tr[z].ch[1] = merge(tr[x].ch[1], y);
if (tr[tr[z].ch[0]].dist < tr[tr[z].ch[1]].dist)
swap(tr[z].ch[0], tr[z].ch[1]);
tr[z].dist = tr[tr[z].ch[1]].dist + 1;
return z;
}
};
int root[N];
void initLefTr() {
using namespace LefT;
for (int i = 1; i <= n; i++)
pq.push(vtx{i, dist[i]});
tr[0].dist = -1;
while (!pq.empty()) {
int x = pq.top().pos; pq.pop();
for (int i = G.head[x]; ~i; i = G.nxt(i)) if (fa[x] != i)
root[x] = merge(root[x], create(G.len(i) + dist[G.to(i)] - dist[x], G.to(i)));
root[x] = merge(root[x], root[G.to(fa[x])]);
}
}
int calc() {
using namespace LefT;
int ret = 0;
if (dist[1] > E) return 0;
E -= dist[1], ++ret;
if (!root[1]) return ret;
pq.push(vtx{root[1], tr[root[1]].delta});
while (!pq.empty()) {
int x = pq.top().pos;
double d = pq.top().dist;
pq.pop();
if (dist[1] + d > E) break;
++ret, E -= dist[1] + d;
for (int* c = tr[x].ch, s = 2; s; --s, ++c) if (*c)
pq.push(vtx{*c, d - tr[x].delta + tr[*c].delta});
if (root[tr[x].end])
pq.push(vtx{root[tr[x].end], d + tr[root[tr[x].end]].delta});
}
return ret;
}
signed main() {
ios::sync_with_stdio(false);
cin >> n >> m >> E;
for (int i = 1; i <= m; i++) {
int u, v; double w;
cin >> u >> v >> w;
if (u == n) continue;
G.insert(u, v, w);
R.insert(v, u, w);
}
Dijkstra(), initLefTr();
cout << calc() << endl;
return 0;
}
复杂度
(O(nlog n+klog k)) 时间,(O(nlog n)) 空间。设 (n, m) 同阶。
总结
两个算法各有优缺点:
- A* 算法在大多数情况下表现优秀,但是可以被刻意构造的数据((n) 元环)卡爆。不过它的编写难度小,因此可能是更适合考场上选择的算法。
- 可持久化可并堆的做法虽然编写比前者复杂的多,但是复杂度却是一定正确的,根本不会担心被卡的情况。
两个都建议读者掌握,以便在不同情况下有更多的选择。