zoukankan      html  css  js  c++  java
  • 数据结构(九):并查集

     

    一、 并查集概述

      并查集是一种树形结构,用来判断两个元素是否在同一棵树上,以及合并两个元素所在的树。

    二、 并查集特性

      并查集是一种树形结构,但它的特性不像2-3树,二叉树,红黑树那么复杂:

      1、 每个结点都只有一个元素,每一组元素都在一棵树上

      2、 一个组中的元素和另一组的元素间没有任何联系

      3、 元素在树中没有严格的父子大小要求

                          

    三、 并查集实现

      在初始化并查集时,我们通常把元素作为数组的索引,数组的值为元素所在的组别(如果元素非int类型,则可使用其他映射结构来使元素和int类型的数据对应)

       

       当我们合并元素A和B时,只需修改索引A和B的值为相同值即可,如下让元素4和5合并成一个组

      

    /**

     * 并查集实现

     * @author jiyukai

     */

    public class UF {

          

           //记录结点元素和该结点所在组的标识

           public int[] valueAndgroup;

          

           //并查集的组个数

           public int N;

          

           /**

            * 并查集构建

            * @param N

            */

           public UF(int n) {

                  //分组个数赋值

                  this.N = n;

                  //数组初始化

                  valueAndgroup = new int[n];

                  //数组的索引为结点元素的值,值为所在组的标志,初始化时假设每个组有一个元素,则索引用元素表示,所在组可以初始化为i

                  //使用整数来表示节点的值,如果需要其他数据类型,可以用hashTable来进行映射。如:将string映射为int类型

                  for(int i=0;i<n;i++) {

                         valueAndgroup[i] = i;

                  }

           }

          

           /**

            * 并查集分组个数

            * @return

            */

           public int count() {

                  return N;

           }

          

           /**

            * 查找元素p所在分组的标志

            * @param p

            * @return

            */

           public int find(int p) {

                  return valueAndgroup[p];

           }

          

           /**

            * 判断元素p和q是否在同个分组中

            * @param p

            * @param q

            * @return

            */

           public boolean isConnected(int p,int q) {

                  return valueAndgroup[p]==valueAndgroup[q];

           }

          

           /**

            * 合并元素p和q

            * @param p

            * @param q

            */

           public void union(int p,int q) {

                  //p和q已在同一组别中,不用合并

                  if(isConnected(p, q)) {

                         return;

                  }

                 

                  //找出p和q所在的组

                  int p_group = find(p);

                  int q_group = find(q);

                 

                  //将valueAndgroup中p所在组的值更新为q的所在组

                  for(int i=0;i<valueAndgroup.length;i++) {

                         if(valueAndgroup[i]==p_group) {

                                valueAndgroup[i] = q_group;

                         }

                  }

                 

                  //组别-1

                  N--;

           }

          

    }

    四、 并查集合并优化

      在计算机网络中,假设并查集的每个元素为每台计算机的ip,那么通过调用isConnected方法则可知道两台计算机是否互联,调用union方法则可以让两台计算互联。

      在实际运用中,若要使所有计算机两两互联,需要调用N^2次,时间复杂度是相当高的,因此我们需要对算法进行优化。

      假设有两棵独立的树,为了无需在union合并时,遍历整个数组去修改两棵树中元素的组,我们希望将两根树的进行合并,归属于同一个根结点,这样则需要并查集数组中存放的值为元素的父结点

      这样我们在合并时只需将两棵树的根结点修改为同一个,则省去了union的遍历带来的耗时,算法优化如下。

      在如下示意图中,当我们顺着元素(即索引)找父节点,当找到元素和父节点相同时,则认为该元素为根结点,如下图我们可找到4为0的根结点。

       

      在union合并中,我们只需将两棵树的根结点修改为同一个元素,即可将两棵独立的树进行合并

       

      合并后成为如下,只需一步操作完成

       

       

    /**

     * 并查集实现

     * @author jiyukai

     */

    public class UF_Tree {

          

           //记录结点元素和该结点的父结点

           public int[] valueAndgroup;

          

           //并查集的组个数

           public int N;

          

           /**

            * 并查集构建

            * @param N

            */

           public UF_Tree(int n) {

                  //分组个数赋值

                  this.N = n;

                  //数组初始化

                  valueAndgroup = new int[n];

                  //数组的索引为结点元素的值,值为所在组的标志,初始化时假设每个组有一个元素,则索引用元素表示,所在组可以初始化为i

                  //使用整数来表示节点的值,如果需要其他数据类型,可以用hashTable来进行映射。如:将string映射为int类型

                  for(int i=0;i<n;i++) {

                         valueAndgroup[i] = i;

                  }

           }

          

           /**

            * 并查集分组个数

            * @return

            */

           public int count() {

                  return N;

           }

          

           /**

            * 查找元素p所在分组的标志

            * @param p

            * @return

            */

           public int find(int p) {

                  while(true) {

                         if(p == valueAndgroup[p]) {

                                return p;

                         }

                        

                         p = valueAndgroup[p];

                  }

           }

          

           /**

            * 合并元素p和q

            * @param p

            * @param q

            */

           public void union(int p,int q) {

                 

                  //找出p和q所在的根结点

                  int p_root = find(p);

                  int q_root = find(q);

                 

                  //如果q和p的根结点相同

                  if(p_root==q_root) {

                         return;

                  }

                 

                  //如果p和q不在一个分组,则让p的父节点为q的父节点,这样两颗独立的树就合并到一起,就无需再遍历整个数组去查找

                  valueAndgroup[p_root] = q_root;

                 

                  //组别-1

                  N--;

           }

          

    }

    五、 并查集搜索优化

      上述的优化中,我们修改了union方法,使union原本O(N)的复杂度变成了O(1),但是find方法的复杂度却增加了,变成了O(N),所以如上算法的最坏情况下还是O(N^2)

      这时我们需要对find进行再次优化

      在合并两棵树时,我们发现,当小树合并大树,即小树的根结点作为大树的根结点时,树的层级会加深,如下图。

      而当大树合并小树,即大树的根结点作为小树的根结点时,树的层级不会加深,此时可以在find方法处提高效率。

      原始树:

       

      小树合并大树后层级加深

       

      大树合并小树后层级不变

       

      因此,为完成这个需求,我们需要另外一个数组来记录每个元素所在树的层级大小,方便合并时做出判断,实现大树合并小树。

    /**

     * 小树合并大树并查集

     * @author jiyukai

     */

    public class UF_Shorter_Tree {

           //记录结点元素和该结点的父结点

           public int[] valueAndgroup;

          

           //记录结点元素所在树的深度

           private int[] nodeCount;

          

           //并查集的组个数

           public int N;

          

           /**

            * 并查集构建

            * @param N

            */

           public UF_Shorter_Tree(int n) {

                  //分组个数赋值

                  this.N = n;

                  //数组初始化

                  valueAndgroup = new int[n];

                  //数组的索引为结点元素的值,值为所在组的标志,初始化时假设每个组有一个元素,则索引用元素表示,所在组可以初始化为i

                  //使用整数来表示节点的值,如果需要其他数据类型,可以用hashTable来进行映射。如:将string映射为int类型

                  for(int i=0;i<n;i++) {

                         valueAndgroup[i] = i;

                  }

                 

                  //初始化结点元素所在的深度,每个元素初始化的深度为1

                  nodeCount = new int[n];

                  for(int j=0; j<n; j++) {

                         nodeCount[j] = 1;

                  }

                 

           }

          

           /**

            * 并查集分组个数

            * @return

            */

           public int count() {

                  return N;

           }

          

           /**

            * 查找元素p所在分组的标志

            * @param p

            * @return

            */

           public int find(int p) {

                  while(true) {

                         if(p == valueAndgroup[p]) {

                                return p;

                         }

                        

                         p = valueAndgroup[p];

                  }

           }

          

           /**

            * 合并元素p和q

            * @param p

            * @param q

            */

           public void union(int p,int q) {

                 

                  //找出p和q所在的根结点

                  int p_root = find(p);

                  int q_root = find(q);

                 

                  //如果q和p的根结点相同

                  if(p_root==q_root) {

                         return;

                  }

                 

                  if(p_root < q_root) {

                         //p所在树的深度小于q所在树的深度,p相对于q是小树

                        

                         //大树的根作为小树的根去合并

                         valueAndgroup[p_root] = q_root;

                        

                         //更改结点所在树的深度

                         nodeCount[q_root] = nodeCount[q_root] + nodeCount[p_root];

                  }else {

                         //q所在树的深度小于p所在树的深度,q相对于p是小树

                        

                         //大树的根作为小树的根去合并

                         valueAndgroup[q_root] = p_root;

                         //更改结点所在树的深度

                         nodeCount[p_root] = nodeCount[p_root] + nodeCount[q_root];

                  }

                 

                  //组别-1

                  N--;

           }

          

    }

  • 相关阅读:
    hadoop之 解析HDFS的写文件流程
    Linux之 手动释放内存
    Heka 的编译
    go get 下载需要的相关工具
    峰值计算的方法
    thrift简介
    Bazaar 版本控制工具
    Homebrew
    虚拟机下centos时间不正确的方便解决方法
    golang 应用的部署相关技术
  • 原文地址:https://www.cnblogs.com/jiyukai/p/14071615.html
Copyright © 2011-2022 走看看