并查集是一个非常优雅简洁的,相对高级的数据结构,常常用于元素分组问题。
对于并查集的介绍和推导这里不细说,推荐看Pecco的算法学习笔记。这里主要记录我使用并查集刷题的模板和技巧。
一、什么时候使用并查集?
个人认为并查集可以用在图中,可以用来求取图中的连通分量。当然题目不一定会直接给出图的数据结构,可能是一个二维数组(200. 岛屿数量),也可能是多个互相连接的结点(1319. 连通网络的操作次数)。可以多做几题,体会一下。
二、模板:
class UnionFind {
private:
vector<int> p, rank;
public:
UnionFind(int n) {
for (int i = 0; i < n; ++i) {
p.push_back(i);
rank.push_back(0);
}
}
int find(int x) {
return x == p[x] ? x : (p[x] = find(p[x]));
}
void unite(int x, int y) {
x = find(x), y = find(y);
if (rank[x] > rank[y]) {
p[y] = x;
} else {
p[x] = y;
}
if (x != y && rank[x] == rank[y]) {
rank[y]++;
}
}
};
- 模板基本类似,只有构造有些许不同。视题目给出的“图”结构的不同而定,这里给出的模板给出的图类似于邻接表,以边为存储单位。如果题目给出的是一个二维数组,那么就类似于邻接矩阵。可以按照下面的模板:
UnionFind(vector<vector<char>>& grid) {
count = 0;
int m = grid.size();
int n = grid[0].size();
for (int i = 0; i < m; ++i) {
for (int j = 0; j < n; ++j) {
if (grid[i][j] == '1') {
p.push_back(i * n + j);
++count;
}
else {
p.push_back(-1);
}
rank.push_back(0);
}
}
}
- 总结一下:并查集的p数组一定存储的是结点的父结点,也就是p数组大小就等于题目中图的结点数。
三、心得:
-
同处于一个连通分量中的结点i的p[i]不一定相等,即使你使用 路径压缩 进行find操作。因为只有find操作可以将i结点从底向上更新p[i],但是之后可能进行union操作,这时就不能保证p[i]仍然是根结点的值,换句话说,此时根结点不一定就是父结点。
因此,如果你想在程序中得到i结点的根结点,不要使用p[i],请使用find(i),对它更新。
-
如上所述,路径压缩较为重要,而按秩合并作用并不是很大,你也可以不使用:
void unite(int x, int y) { x = find(x), y = find(y); p[x] = y; }