zoukankan      html  css  js  c++  java
  • 并查集 (UnionFind Sets)

    并查集 (Union-Find Sets)
    并查集:(union-find sets)是一种简单的用途广泛的集合. 并查集是若干个不相交集合,能够实现较快的合并和判断元素所在集合的操作,应用很多。一般采取树形结构来存储并查集,并利用一个rank数组来存储集合的深度下界,在查找操作时进行路径压缩使后续的查找操作加速。这样优化实现的并查集,空间复杂度为O(N),建立一个集合的时间复杂度为O(1),N次合并M查找的时间复杂度为O(M Alpha(N)),这里Alpha是Ackerman函数的某个反函数,在很大的范围内(人类目前观测到的宇宙范围估算有10的80次方个原子,这小于前面所说的范围)这个函数的值可以看成是不大于4的,所以并查集的操作可以看作是线性的。它支持以下三中种操作:
      -Union (Root1, Root2) //并操作;把子集合Root2并入集合Root1中.要求:Root1和 Root2互不相交,否则不执行操作.
      -Find (x) //搜索操作;搜索单元素x所在的集合,并返回该集合的名字.
      -UFSets (s) //构造函数。将并查集中s个元素初始化为s个只有一个单元素的子集合.
      -对于并查集来说,每个集合用一棵树表示。
      -集合中每个元素的元素名分别存放在树的结点中,此外,树的每一个结点还有一个指向其双亲结点的指针。
      -设 S1= {0, 6, 7, 8 },S2= { 1, 4, 9 },S3= { 2, 3, 5 }
      
    -为简化讨论,忽略实际的集合名,仅用表示集合的树的根来标识集合。
      -为此,采用树的双亲表示作为集合存储表示。集合元素的编号从0到 n-1。其中 n 是最大元素个数。在双亲表示中,第 i 个数组元素代表包含集合元素 i 的树结点。根结点的双亲为-1,表示集合中的元素个数。为了区别双亲指针信息( ≥ 0 ),集合元素个数信息用负数表示。   

    下标
    parent  
    集合S1, S2和S3的双亲表示:
                                  S1 ∪ S2的可能的表示方法

    const int DefaultSize = 10;
      class UFSets { //并查集的类定义
      private:
       int *parent;
       int size;
      public:
       UFSets ( int s = DefaultSize );
       ~UFSets ( ) { delete [ ] parent; }
       UFSets & operator = ( UFSets const & Value );//集合赋值
       void Union ( int Root1, int Root2 );
       int Find ( int x );
       void UnionByHeight ( int Root1, int Root2 ); };
       UFSets::UFSets ( int s ) { //构造函数
       size = s;
       parent = new int [size+1];
       for ( int i = 0; i <= size; i++ ) parent[i] = -1;
      }
      unsigned int UFSets::Find ( int x ) { //搜索操作
       if ( parent[x] <= 0 ) return x;
       else return Find ( parent[x] );
      }
      void UFSets::Union ( int Root1, int Root2 ) { //
       parent[Root2] = Root1; //Root2指向Root1
      }


    Find和Union操作性能不好。假设最初 n 个元素构成 n 棵树组成的森林,parent[i] = -1。做处理Union(0, 1), Union(1, 2), …, Union(n-2, n-1)后,将产生如图所示的退化的树。
                                 
    执行一次Union操作所需时间是O(1),n-1次Union操作所需时间是O(n)。若再执行Find(0), Find(1), …, Find(n-1), 若被
    搜索的元素为i,完成Find(i)操作需要时间为O(i),完成 n 次搜索需要的总时间将达到
                  
    Union操作的加权规则
      为避免产生退化的树,改进方法是先判断两集合中元素的个数,如果以 i 为根的树中的结点个数少于以 j 为根的树中的结点个数,即parent[i] > parent[j](parent[]<0),则让 j 成为 i 的双亲,否则,让i成为j的双亲。此即Union的加权规则。
                  parent[0](== -4) < parent[4] (== -3)

      void UFSets::WeightedUnion(int Root1, int Root2) {
       //按Union的加权规则改进的算法
       int temp = parent[Root1] + parent[Root2];
       if ( parent[Root2] < parent[Root1] ) {
        parent[Root1] = Root2; //Root2中结点数多
        parent[Root2] = temp;  //Root1指向Root2
       }
       else {
        parent[Root2] = Root1; //Root1中结点数多
        parent[Root1] = temp;  //Root2指向Root1
       }
      }


                                使用加权规则得到的树

    下面是几到用并查集可以方便解决的问题:

    题目: 亲戚(Relations)
    或许你并不知道,你的某个朋友是你的亲戚。他可能是你的曾祖父的外公的女婿的外甥的表姐的孙子。如果能得到完整的家谱,判断两个人是否亲戚应该是可行的,但如果两个人的最近公共祖先与他们相隔好几代,使得家谱十分庞大,那么检验亲戚关系实非人力所能及.在这种情况下,最好的帮手就是计算机。
    为了将问题简化,你将得到一些亲戚关系的信息,如同Marry和Tom是亲戚,Tom和B en是亲戚,等等。从这些信息中,你可以推出Marry和Ben是亲戚。请写一个程序,对于我们的关心的亲戚关系的提问,以最快的速度给出答案。
    参考输入输出格式 输入由两部分组成。
    第一部分以N,M开始。N为问题涉及的人的个数(1 ≤ N ≤ 20000)。这些人的编号为1,2,3,…,N。下面有M行(1 ≤ M ≤ 1000000),每行有两个数ai, bi,表示已知ai和bi是亲戚.
    第二部分以Q开始。以下Q行有Q个询问(1 ≤ Q ≤ 1 000 000),每行为ci, di,表示询问ci和di是否为亲戚。
    对于每个询问ci, di,若ci和di为亲戚,则输出Yes,否则输出No。
    样例输入与输出
    输入relation.in
    10 7
    2 4
    5 7
    1 3
    8 9
    1 2
    5 6
    2 3
    3
    3 4
    7 10
    8 9
    输出relation.out
    Yes
    No
    Yes
    如果这道题目不用并查集,而只用链表或数组来存储集合,那么效率很低,肯定超时。
    例程:

    #include<iostream>
    using namespace std;
    int N,M,Q;
    int pre[20000],rank[20000];
    void makeset(int x)
    {
    pre[x]=-1;//开始都是根节点
    rank[x]=0;//深度都为0
    }
    int find(int x)
    {
    int r=x;
    while(pre[r]!=-1) r=pre[r];//类似递归的加速查找
    while(x!=r)//统一把根节点置为r(统一集合名称)
    {
    int q=pre[x];
    pre[x]=r;
    x=q;
    }
    return r;
    }
    void unionone(int a,int b)
    {
    int t1=find(a);
    int t2=find(b);
    if(rank[t1]>rank[t2])//?
    pre[t2]=t1;
    else
    pre[t1]=t2;
    if(rank[t1]==rank[t2])
    rank[t2]++;
    }
    int main()

    {
    int i,a,b,c,d;
    while(cin>>N>>M)
    {
    for(i=1;i<=N;i++)
    makeset(i);
    for(i=1;i<=M;i++)
    {
    cin>>a>>b;
    if(find(a)!=find(b))
    unionone(a,b);
    }
    cin>>Q;
    for(i=1;i<=Q;i++)
    {
    cin>>c>>d;
    if(find(c)==find(d))
    cout<<"YES"<<endl;
    else
    cout<<"NO"<<endl;
    }
    }
    return 0;
    }
    作者:BuildNewApp
    出处:http://syxchina.cnblogs.comBuildNewApp.com
    本文版权归作者、博客园和百度空间共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则作者会诅咒你的。
    如果您阅读了我的文章并觉得有价值请点击此处,谢谢您的肯定1。
  • 相关阅读:
    MySQL中having与where
    HTML中meta标签的作用与使用
    PHP加密与解密
    mongodb----基础描述及安装
    nosql----redis性能优化
    python----案例一:爬取猫眼电影排行榜数据
    python----yield(generator)生成器
    linux下查看cpu个数的方法
    awk----利用循环统计个数
    shell----重启tomcat问题
  • 原文地址:https://www.cnblogs.com/syxchina/p/2197370.html
Copyright © 2011-2022 走看看