并查集

zoukankan html css js c++ java

并查集
并查集&种类并查集&带权并查集

前言：

因为是学习记录，所以知识讲解+例题推荐+练习题解都是放在一起的qvq

目录
- 并查集基础知识
- 并查集基础题目
- 种类并查集知识
- 种类并查集题目
- 并查集&种类并查集部分题解
- 带权并查集知识
- 带权并查集题目
- 带权并查集题解
并查集基础：

普通的并查集+路径压缩相信大家还是会的，就主要是两个操作：
1. 查询某个元素属于哪个集合
2. 合并两个集合成为一个大集合
提出一点，就是求最小生成树的Kruskal算法也是在使用并查集后才是完整的Kruskal

并查集基础题目：
- 洛谷P2330 [SCOI2005]繁忙的都市（Kruskal最小生成树）
- 洛谷P2814 家谱（字符串+并查集）
- 洛谷P3958 奶酪（并查集或搜索）
- 洛谷P2661 信息传递（并查集）
- 洛谷P3144 [USACO16OPEN]Closing the Farm S
- 洛谷P6121 [USACO16OPEN]Closing the Farm G （上一道题的数据加强版，思路挺巧的，好题qvq）
- 洛谷P1955 程序自动分析（离散化+种类并查集，没有离散化数据无情giao崩程序QAQ，算普通并查集中的较难题）
通过“程序自动分析”这道题，我们能够看到，并查集能在一张无向图中维护节点之间的连通性，这是它的基本用途之一

实际上，并查集擅长动态维护许多具有传递性的关系，如这道题中：“等于”就是一种传递关系，但是“不等于”显然不具有传递性

但在某些问题中，“传递关系”不止一种，并且这些“传递关系”能够互相导出，此时可以使用以下的扩展域或者边带权的并查集来解决

种类并查集：
- 写在前面
如果你在洛谷或其他OJ上独立做过了几道并查集的题，那么可以接触升级版的并查集了：带权并查集、种类并查集
- 知识搬运
1. 种类并查集：即在普通并查集“亲戚的亲戚也是亲戚”的基础上再进行一些“分类”，但是这个分类呢并不是根据物品的种类来进行分类，而是类似“敌人的敌人是朋友”的分类（并没有说明“朋友的敌人是我的敌人”！要根据具体题目分析）
2. 种类并查集常规套路：不是开多个或多维并查集数组，而是扩大并查集规模
举个栗子：我们要维护朋友和敌人这两个关系，则将普通并查集的规模扩大两倍，原来的1~n还是存放朋友关系，但是n+1~2n则是存放敌人关系，然后每次操作都分别维护
1. 种类并查集加强版：上面举的例子是针对两种对立关系，但是有些题目会涉及三种循环关系，怎么做呢？其实就是将扩大两倍规模变为扩大三倍规模（下面有例题会讲到）
种类并查集题目：
- 洛谷P1892 团伙（基础种类并查集）
- 洛谷P2024 食物链（上文说到的三种循环关系的例题，值得做）
- 洛谷P1525 关押罪犯（转换一下题目就是种类并查集，思路比较巧）
- 洛谷P1196 银河英雄传说（带权并查集，更新于2020.6.18 鸽子来补充带权并查集了qvq）
并查集&种类并查集题解：
- 洛谷P2024 食物链（三种循环关系）
题目请大家直接点开看，因为描述很清晰就不再赘述了，直接来讲思路（这题就是思维难度大，容易绕晕QAQ）
1. 判断是否是假话，其实就是判断当前给出的条件是否与之前构建的并查集关系树冲突，冲突则是假话（于是转换了题目后，就变成维护种类并查集）
2. 我们需要维护三种关系：“同类”、“猎物”、“天敌”，所以扩大三倍规模，第一倍维护同类、第二倍维护猎物、第三倍维护天敌
3. 搞清楚三种关系的传递：猎物的猎物是天敌、天敌的猎物是同类、同类的猎物是猎物、同类的天敌是天敌（反正就是A吃B，B吃C，C吃B）
4. 判断是假话的三条规则：①当前给出x、y是同类，但前面已经构建x、y是天敌关系，是假话；②当前给出x是y的天敌，但前面已经构建x、y是同类或y是x的天敌，是假话；③x、y的编号超出了食物链的最大编号（简单明了）
好了，思路如上，我们可以开始敲代码了quq：
```
#include <bits/stdc++.h>
using namespace std;
int n,k,u,v,op,ans,fa[150010];

inline int find(int x) {
	if(fa[x]==x) return x;
	return fa[x]=find(fa[x]);
}

int main() {
	scanf("%d%d",&n,&k);
	for(register int i=1;i<=3*n;i++) fa[i]=i; //扩大三倍规模 
	for(register int i=1;i<=k;i++) {
		scanf("%d%d%d",&op,&u,&v);
		if(u>n||v>n) { //不存在于食物链中，假话 
			ans++;
			continue;
		}
		if(op==1) { //如果两者是同类 
			if(find(u)==find(v+n)||find(u+n)==find(v)) { //如果两者已经是天敌关系，假话 
				ans++;
				continue;
			}
			fa[find(u)]=find(v); //合并 
			fa[find(u+n)]=find(v+n);
			fa[find(u+n+n)]=find(v+n+n);
		}
		else { //如果x是y天敌 
			if(find(u)==find(v)||find(u)==find(v+n)) { //如果两者已经是同类或y是x天敌，假话 
				ans++;
				continue;
			}
			fa[find(u)]=find(v+n+n); //注意一下对应关系！
			fa[find(u+n)]=find(v);
			fa[find(u+n+n)]=find(v+n);
		}
	}
	printf("%d",ans);
	return 0;
}
```
- 洛谷P1525 关押罪犯
题目简述一下：给定n个罪犯，m个关系；对于每个关系给出两个罪犯在同一所监狱中的怨气值；要求将所有罪犯分到两所监狱，要让这两所监狱中所有怨气值的最大值最小

现在来讲思路：
1. 首先我们可以想到贪心，怎么贪？即将所有怨气值从大到小排序，然后首先将怨气值大的分开，直到不能这么干
2. 但我们始终需要维护两所监狱中的怨气值，所以我们不妨将种类并查集作为解题主体再加上排序作为辅助
3. 怎么种类并查集？首先还是先排序，如果当前罪犯x的敌人为空，则将当前关系对应的罪犯y设为x的敌人；之后再遇到罪犯x与其他罪犯z有怨气关系时，就将罪犯z与罪犯y建立朋友关系（“敌人的敌人是朋友”的思想）
4. 你可能会疑惑，罪犯y和罪犯z也有可能是互相的敌人啊，怎么就构建朋友关系了呢？可如果全部处理成敌人关系我们将无法解决这道题，但是转换一下思路，我们已经将怨气值从大到小排序，所以怨气值大的看做敌人，之后再遇到敌人就将两个敌人合并为朋友
5. 这并不与在m个关系的描述中罪犯y与罪犯z是敌人相冲突，因为y与z的怨气值小于x与y的怨气值，不会妨碍我们最终求得怨气值的最大值最小
6. 如果在处理过程中找到了一组罪犯u和罪犯v，满足两人在同一集合中，就直接输出u和v的怨气值
7. 如果处理完所有关系都没有输出，则输出0（题目要求的，因为忘了写，白白WA了一个点）
感觉讲得有点绕QAQ，大家在草稿本上手模一下样例应该就懂了，下面给出代码：
```
#include <bits/stdc++.h>
using namespace std;
int n,m,fa[400010];

struct node {
	int u,v,w;
} a[400010];

inline bool cmp(node x,node y) {
	return x.w>y.w;
}

inline int find(int x) {
	if(fa[x]==x) return x;
	return fa[x]=find(fa[x]);
}

int main() {
	scanf("%d%d",&n,&m);
	for(register int i=1;i<=2*n;i++) fa[i]=i; //扩大两倍规模：一倍存朋友，二倍存敌人 
	for(register int i=1;i<=m;i++) {
		scanf("%d%d%d",&a[i].u,&a[i].v,&a[i].w);
	}
	sort(a+1,a+1+m,cmp); //怨气值从大到小排序 
	for(register int i=1;i<=m;i++) {
		if(find(a[i].u)==find(a[i].v)) { //找到了最大值最小的怨气值 
			printf("%d",a[i].w);
			return 0;
		}
		if(find(a[i].u+n)==a[i].u) { //如果还没有敌人，将当前关系对应的罪犯标记为敌人 
			fa[a[i].u+n]=a[i].v;
		}
		else if(find(a[i].u+n)!=a[i].u) { //如果有敌人了，则将之前的敌人与现在的敌人合并为朋友 
			fa[find(a[i].u+n)]=find(a[i].v);
		}
		if(find(a[i].v+n)==a[i].v) { //双向的 
			fa[a[i].v+n]=a[i].u;
		}
		else if(find(a[i].v+n)!=a[i].v) {
			fa[find(a[i].v+n)]=find(a[i].u);
		}
	}
	puts("0");  //没有找到，输出0 
	return 0;
}
```
- 洛谷P1955 程序自动分析
说在前面：

这道题因为蒟蒻只会map实现离散化，但是这道题第二个点还是会T，只有90pts（吸氧倒是能A掉）所以各位dalao可以跳过这道题的题解，以下讲的是90pts 的做法，抱歉啊！（咕咕咕）

更新于2020.6.18 蒟蒻下午去学习了一下离散化及其实现，写了学习记录

题目请大家直接点击题目链接查看，不多赘述，直接讲思路
1. 这题就是普通的并查集，但是数据太大了，直接存放肯定炸得体无完肤，所以我们需要引入“离散化”来存放数据
2. 离散化大致有两种：
（1）去重（可以用到unique去重函数）+ 排序 +二分索引（可以用到lower_bound函数）

（2）Hash表（散列表）：如果维护的好，可以实现O(1)的查询

下面给出~~蒟蒻的90pts代码~~满分代码（更新啦~使用STL实现离散化，具体可见上面的“学习记录”）：
```
#include <bits/stdc++.h>
using namespace std;
bool flag;
int t,n,tot,res,fa[2000010],b[6000010];

struct node {
	int u,v,e;
} a[2000010];

inline bool cmp(node x,node y) {
	return x.e>y.e;
}

inline int find(int x) {
	if(fa[x]==x) return x;
	return fa[x]=find(fa[x]);
}

int main() {
	scanf("%d",&t);
	while(t--) {
		scanf("%d",&n);
		tot=0;
		memset(a,0,sizeof(a));  //记得清空啊
		memset(b,0,sizeof(b));
		memset(fa,0,sizeof(fa));
		for(register int i=1;i<=n;i++) {
			scanf("%d%d%d",&a[i].u,&a[i].v,&a[i].e);
			b[++tot]=a[i].u;
			b[++tot]=a[i].v;
		}
		sort(b+1,b+1+tot);  //第一步，排序
		res=unique(b+1,b+1+tot)-(b+1);   //第二步，去重
		for(register int i=1;i<=n;i++) {   //第三步，二分索引
			a[i].u=lower_bound(b+1,b+res+1,a[i].u)-b;
			a[i].v=lower_bound(b+1,b+res+1,a[i].v)-b;
		}
		for(register int i=1;i<=res;i++) fa[i]=i;
		sort(a+1,a+1+n,cmp);  //先处理所有合并的情况
		flag=true;
		for(register int i=1;i<=n;i++) {
			if(a[i].e==1) {
				fa[find(a[i].u)]=find(a[i].v);
			}
			else {
				if(find(a[i].u)==find(a[i].v)) {
					puts("NO");
					flag=false;   //打上标记
					break;
				}
			}
		}
		if(flag==true) puts("YES");
	}
	return 0;
}
```
- 洛谷P3144 [USACO16OPEN]Closing the Farm S （此为低配版）
洛谷P6121 [USACO16OPEN]Closing the Farm G （此为加强版）

直接讲加强版的思路（其实都差不多啦）：
1. 题目要求按顺序关闭谷仓，每次关闭都要判断当前剩余所有谷仓是否联通
2. 我们转换一下，将顺序关闭改为倒序开启！，每一次开启就相当于插入一个点，然后用并查集维护联通块
3. 但是跟其他并查集不一样，我们的fa数组不能直接初始化，而是应该开u号仓就将fa[u]赋成u，联通块++
4. 对于现在开的u号仓，我们遍历与u号仓有路径相连的其他仓库，进行判断
5. 判断：如果遍历到的v号仓库还没有开仓（即fa[v]=0）则跳过不管
6. 如果已经开过仓了，再判断i和v是否在一个集合，如果不在就将u、v合并再将联通块--
7. 处理完所有与u相连的仓库后，将当前的联通块个数保存在ans[u]中，最后循环判断如果ans[i]==1就输出YES，反之输出NO
下面给出加强版代码（终于没有咕咕咕了，更新于2020.6.18）：
```
#include <bits/stdc++.h>
using namespace std;
int n,m,u,v,tot,sum,fa[2000010],ans[2000010],head[2000010],order[2000010]; //开大一点

struct node {
	int to,net;
} a[2000010];

inline void add(int x,int y) { //链式前向星存边
	a[++tot].to=y;
	a[tot].net=head[x];
	head[x]=tot;
}

inline int find(int x) {
	if(fa[x]==x) return x;
	return fa[x]=find(fa[x]);
} 

int main() {
	scanf("%d%d",&n,&m);
	for(register int i=1;i<=m;i++) {
		scanf("%d%d",&u,&v);
		add(u,v); //双向边
		add(v,u);
	}
	for(register int i=1;i<=n;i++) {
		scanf("%d",&order[i]);
	}
	for(register int i=n;i>=1;i--) { //倒叙开仓
		sum++;  //联通块个数
		fa[order[i]]=order[i];
		for(register int j=head[order[i]];j;j=a[j].net) { //遍历与order[i]相连的v仓库
			int v=a[j].to;
			if(fa[find(v)]!=0) { //v号仓库已经开过
				if(find(v)!=find(order[i])) { //不在一个集合就合并，联通块--
					sum--;
					fa[find(v)]=find(order[i]);
				}
			}
		}
		ans[i]=sum;
	}
	for(register int i=1;i<=n;i++) { //判断输出
		if(ans[i]==1) puts("YES");
		else puts("NO");
	}
	return 0;
}
```
带权并查集：
- 写在前面
关于这个带权并查集，蒟蒻做了两道题，但貌似树的形态都是链，所以和同学还在讨论其他情况需不需要维护size数组（size数组在下面会讲）和一些其他问题

所以现在只讲解链的情况，请见谅（有dalao给讲讲嘛？）
- 知识搬运
并查集实际上是由若干棵树构成的森林，我们可以在树中的每条边上记录一个权值，即维护一个数组d，用d[i]保存节点i到父节点fa[i]之间的边权

在每次路径压缩后，每个访问过的节点都会直接指向树根，如果我们同时更新这些节点的d值，就可以利用路径压缩过程来统计每个节点到树根之间的路径信息

题型一般就是给出点之间的合并，然后询问两个点之间的距离

下面给出在路径压缩时维护d值的代码（注意一下写法哦！建议照下面这样规范敲代码quq）：
```
inline int find(int x) {
	if(fa[x]==x) return x;
	int root=find(fa[x]); //注意一下写法，先将find(fa[x])存放在root中，否则会出错 
	d[x]+=d[fa[x]];
	return fa[x]=root;
}
```
带权并查集题目：

再次温馨提示：以下例题都是链的情况（应该是维护点权）
- 洛谷P1196 [NOI2002]银河英雄传说
- 洛谷P2342 [USACO04OPEN]Cube Stacking G
带权并查集题解：
- 洛谷P1196 [NOI2002]银河英雄传说
题目转换思路：

一共有30000列，每列一艘战舰（摆明了是链的形态）

给定T组对于u、v进行合并或查询，合并时将u这一列移动到v这一列后面；查询时输出u和v之间的战舰数（所以战舰数就是权值）

所以我们开三个数组，一个fa[i]表示i的父亲节点，一个d[i]表示i到其父节点的边权，一个size[i]表示i所在子树的大小

下面给出代码：
```
#include  <bits/stdc++.h>
using namespace std;
char op;
int T,u,v,d[30010],fa[30010],size[30010];

inline int find(int x) {
	if(fa[x]==x) return x;
	int root=find(fa[x]); //注意一下写法，先将find(fa[x])存放在root中，否则会出错 
	d[x]+=d[fa[x]];
	return fa[x]=root;
}

int main () {
	scanf("%d",&T);
	for(register int i=1;i<=30001;i++) {
		fa[i]=i;
		size[i]=1; //每棵子树的大小初始都为1 
	}
	for(register int i=1;i<=T;i++) {
		cin>>op;
		scanf("%d%d",&u,&v);
		if(op=='M') {
			int uu=find(u);
			int vv=find(v);
			fa[uu]=vv; //把u这棵树全部搬到v这棵树下面，成为v这棵树的子树 
			d[uu]+=size[vv]; //更新u这棵子树的祖先到v这棵树的距离 
			size[vv]+=size[uu]; //更新v这棵树的大小 
		}
		else {
			if(find(u)!=find(v)) puts("-1");
			else printf("%d
",abs(d[u]-d[v])-1);
		}
		
	}
	return 0;
}
```
- 洛谷P2342 [USACO04OPEN]Cube Stacking G
这道题跟“银河英雄传说”几乎一模一样，就是合并和查询的方式有点差别，现在来讲思路转换：

合并时给出u、v，要将u移到v上面（转换一下，就是将v移到u下面！这就跟“银河英雄传说”一样了啊）

查询时只给出z，要求输出z之下的积木数（积木数=战舰数=权值）

代码如下：
```
#include  <bits/stdc++.h>
using namespace std;
char op;
int T,u,v,d[30010],fa[30010],size[30010];

inline int find(int x) {
	if(fa[x]==x) return x;
	int root=find(fa[x]);
	d[x]+=d[fa[x]];
	return fa[x]=root;
}

int main () {
	scanf("%d",&T);
	for(register int i=1;i<=30000;i++) {
		fa[i]=i;
		size[i]=1;
	}
	for(register int i=1;i<=T;i++) {
		cin>>op;
		if(op=='M') {
			scanf("%d%d",&u,&v); 
			int uu=find(u);
			int vv=find(v);
			fa[vv]=uu; //注意一下这里与“银河英雄传说”合并的区别 
			d[vv]+=size[uu];
			size[uu]+=size[vv];
		}
		else {
			scanf("%d",&u);
			printf("%d
",size[find(u)]-d[u]-1); //注意是u的根节点的size-d[u]，不能直接写成u的size-d[u] 
		}
		
	}
	return 0;
}
```
带权并查集的一点讨论：

讨论：什么时候需要维护size数组和dis数组

现在给出一个不维护size数组的小程序，处理的是边权（就直接维护dis），上面的例题是点权（都要维护）
```
#include<bits/stdc++.h>
using namespace std;
int fa[30010],dis[30010];
inline int find(int x) {
	if(x==a[x]) return x;
	int root=find(fa[x]);
	dis[x]+=dis[fa[x]];
	return fa[x]=root;
}

inline void un(int x,int y) {
	int xx=find(x),yy=find(y);
	if(xx==yy) return;
	dis[xx]+=dis[y]+1; //这里的1指的是xx到y的边权值 
	fa[xx]=yy;
}

int x,y;

int main() {
	for(register int i=1;i<=100;i++) fa[i]=i;
	while(cin>>x>>y) {
		un(x,y);
		for(register int i=1;i<=5;i++) find(i); //每合并一次就要全部更新i到根节点的距离 
		for(register int i=1;i<=5;i++) cout<<dis[i]<<" "; //输出i到根节点的距离 
		cout<<endl;
	}
	return 0;
}
```
后序：

如果大家的理解和以上我的理解有任何出入，欢迎大家留言，我们一起讨论啊！

To be continue....
查看全文

相关阅读:
响应式布局设计的三大要点
 一个前端的自我修养（转载）
JavaScript利用闭包实现模块化
 关于清除浮动的几种方法
 支持向量机（SVM）
拉格朗日对偶问题与 KKT 条件
 朴素贝叶斯模型
 快速傅里叶变换（FFT）
用线性代数理解 Normal Equation
用线性代数解释图论中的一些结论

原文地址：https://www.cnblogs.com/Eleven-Qian-Shan/p/13233659.html

并查集&种类并查集&带权并查集

前言：

目录

并查集基础：

并查集基础题目：

种类并查集：

种类并查集题目：

并查集&种类并查集题解：

带权并查集：

带权并查集题目：

带权并查集题解：

带权并查集的一点讨论：

后序：

To be continue....