在下终于下定决心写第一篇真正意义上算法的理解博文了!
鼓掌庆祝先~
不过这个肯定不会是一次就写好哒~哈哈哈 慢慢补充
并查集算法产生的原因(意义)
在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。
也就是对于一些集合之间的相连关系的描述
并查集算法的操作(能做什么)
初始化
把每个点所在集合初始化为其自身。
通常来说,这个步骤在每次使用该数据结构时只需要执行一次,无论何种实现方式,时间复杂度均为O(N)。
查找
查找元素所在的集合,即根节点。
合并
将两个元素所在的集合合并为一个集合。
通常来说,合并之前,应先判断两个元素是否属于同一集合,这可用上面的“查找”操作实现。
判断
判断两个元素是否在一个集合之中
了解操作的意义
通过分析并查集的操作可以更好的理解并查集的思想
也就是遇到需要进行这些操作的问题 可以往并查集这方面来思考
并查集的例题
最简单的例题:
若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易,给出某个亲戚关系图,求任意给出的两个人是否具有亲戚关系。
规定:x和y是亲戚,y和z是亲戚,那么x和z也是亲戚。如果x,y是亲戚,那么x的亲戚都是y的亲戚,y的亲戚也都是x的亲戚。
根据给出的对应关系求出给定两人是否有亲戚关系
此时便涉及到
对集合的合并(合并有亲戚关系的集合)
对集合的查找(查找两人是否为同一集合)
详细解答过程
并查集_百度百科
并查集的注意点
树形数据结构的退化
插入节点时的规则如果不加控制
容易导致树形退化
在二叉搜索树中如:以1-2-3-4-5的顺序插入节点
树的高度会变成n 那么所有操作便都需要O(n)时间才能完成
所以同样在并查集为避免退化的发生
可进行如下操作
1.对于每棵树,记录这棵树的高度
2.合并时如果两棵数的高度不同,那么从高度小的向高度大的连边
路径压缩
对于每个节点
1.一旦向上走到了一次根节点,就把这个点到父亲的边改为直接连向根
2.在查询过程中向上经过的所有的节点,都改为直接连到根上
(并没有必要修改高度rank)
高度记录rank[m]为以m为根节点的树的高度
参考资料:
《挑战程序设计竞赛》
并查集 - 百度百科