zoukankan      html  css  js  c++  java
  • Disjoint Sets

    Disjoint Sets

    Disjoint Sets的意思是一堆集合們,它們相互之間都沒有交集。沒有交集是指:各個集合之間沒有擁有共同、相同的元素。中文稱作「分離集」。

    Disjoint Sets的性質相當特殊。資訊學家仔細觀察其特性後,精心設計出一套優雅美觀的資料結構,可以快速的做集合運算。

    Union、Find、Split

    由於每個Disjoint Sets指的就是集合們都沒有交集,我們就不用考慮交集、差集等等的運算,因為結果很明顯。所以只需要考慮union、find、split這三個集合運算:

    union就是將兩個集合做聯集,合併成一個集合。find就是找找看一個元素是在哪個集合裡面。split就是把一個元素從一個集合中分離出來。

    【split此處暫不介紹,俟編者讀過書後再來寫。】

    Disjoint Sets的應用範例:分組

    現在教室裡有十個學生,他們為了做報告,要進行自由分組──每組的人數是不固定的,有些人是自己一個人一組,也有可能這十個學生都同一組。學生聲稱已經分好組了,但是你還是很擔心分組的情況,所以去找了幾個學生來問話。學生會告訴你他和誰誰誰一組,但是他可能不知道他們那組全部的人到底有誰,因為同一組的組員可能又去拉別人入組,但是他不知情。現在你知道了一些學生告訴你的資訊,你要怎麼知道到底誰和誰同組,誰和誰不同組呢?

    要解決這樣的問題,便可以使用Disjoint Sets。不管學生怎麼分組,任何一個學生除了是自己組的組員之外,不可能是別組的組員。所以這些學生分出來的組(集合),必定是Disjoint Sets。

    Disjoint Sets: 簡單的資料結構

    簡單的資料結構

    讓一條int陣列的第x格代表第x人,格子裡填上這個人所屬的團體編號。若兩個人在同一團體,他們的格子裡就會有相同的團體編號。這是很直觀的方式。

     
    1. int g[10];  // 每個人所屬的團體編號
    2. g[0] = 0;   // 第 0 人在第 0 團
    3. g[1] = 0;   // 第 1 人在第 0 團
    4. g[2] = 1;   // 第 2 人在第 1 團
    5. g[9] = 7;   // 第 9 人在第 7 團

    初始化

    一開始大家還沒開始分團的時候,其實可以想做是:每個人都不同團,每個人都是自己一人一團。有個方便的初始值設定方法,就是將第x格的值設成x,這樣每個人就都是不同團體的了。

     
    1. void initialize()
    2. {
    3.     for (int x=0x<10x++)
    4.         g[x] = x;
    5. }

    Union: 兩個人想合併自己所屬團體

    現在有兩團想要合併成一團,交涉的人分別是x和y。x y想要合併成一團,只要把所有與x y同團的人,都填上同一個團體編號就行了。可以找x y其中一團的團體編號,作為新的團體編號,這樣就不需要額外的編號了。(這裡我們不考慮會不會有人不服氣的問題。)

     
    1. void union(int xint y)
    2. {
    3.     // 要是 x y 不同團,才設成同團,以節省時間。
    4.     if (g[x] != g[y])
    5.     {
    6.         int gmax = max(g[x], g[y]); // 團體編號比較大那個
    7.         int gmin = min(g[x], g[y]); // 團體編號比較小那個
    8.         // 把所有與 x y 同團的人,都填上同一個團體編號。
    9.         for (int i=0i<10i++)
    10.             if (g[i] == gmax)
    11.                 g[i] = gmin;
    12.     }
    13. }
     
    1. void union(int xint y)
    2. {
    3.     if (g[x] == g[y]) return;
    4.     x = g[x]; y = g[y];
    5.     for (int i=0i<10i++)
    6.         if (g[i] == x)
    7.             g[i] = y;
    8. }

    Find: 找出一個人在哪一團?

    直接看團體編號即可。

     
    1. int find(int x)
    2. {
    3.     return g[x];
    4. }

    Equivalent Relation: 兩個人是否同團?

    直接看團體編號即可。

     
    1. bool equivlence(int xint y)
    2. {
    3.     return g[x] == g[y];
    4. }

    Number of Sets: 全部總共有幾個團體?

    兩團合併成一團後,總團體數就會減少一團。所以只要修改一下union的程式碼就可以了。

     
    1. int groups = 10;    // 團體數
    2. void union(int xint y)
    3. {
    4.     if (g[x] == g[y]) return;
    5.     groups--;   // 兩團合併成一團,總團體數就會減少一團。
    6.     int gmax = max(g[x], g[y]), gmin = min(g[x], g[y]);
    7.     for (int i=0i<10i++)
    8.         if (g[i] == gmax)
    9.             g[i] = gmin;
    10. }

    Cardinality of a Set: 一個團體總共有幾個人?

    一個一個數是差勁的方法:

     
    1. // 計算出團體編號為 gn 的人數
    2. int cardinality(int gn)
    3. {
    4.     int people = 0;
    5.     for (int i=0i<10i++)
    6.         if (g[i] == gn)
    7.             people++;
    8.     return people;
    9. }

    比較好的方法是:另外開一條陣列去紀錄每個團體的人數吧!陣列第x格填入團體編號為x的人數。要找出一個團體的人數,就直接從陣列裡面找。

    以團體的角度來看:兩團合併成一團後,團體人數就會改變。以人的角度來看:當一個人所屬的團體被改變時,就調整人數。所以只要修改一下union的程式碼就可以了。

     
    1. int n[10];  // 每個團體的人數
    2. void initialize()
    3. {
    4.     for (int i=0i<10i++)
    5.     {
    6.         g[i] = i;
    7.         n[i] = 1;   // 團體編號從 0 到 9,每團都是一個人。
    8.     }
    9. }
    10. void union(int xint y)
    11. {
    12.     if (g[x] == g[y]) return;
    13.     groups--;
    14.     int gmax = max(g[x], g[y]), gmin = min(g[x], g[y]);
    15.     for (int i=0i<10i++)
    16.         if (g[i] == gmax)
    17.         {
    18.             g[i] = gmin;
    19.             n[gmax]--;  // 團體編號為 gmax 的人數減少一人
    20.             n[gmin]++;  // 團體編號為 gmin 的人數增加一人
    21.         }
    22. }
    23. int cardinality(int gn)
    24. {
    25.     return n[gn];
    26. }

    根據團體的人數多寡來做union

    合併團體時,將小的團體併入大的團體,可以節省一點點設定團體和增減人數所需的時間。

     
    1. void union(int xint y)
    2. {
    3.     if (g[x] == g[y]) return;
    4.     groups--;
    5.     int gmax = xgmin = y;
    6.     if (n[x] > n[y]) swap(gmaxgmin);
    7.     for (int i=0i<10i++)
    8.         if (g[i] == gmax)
    9.         {
    10.             g[i] = gmin;
    11.             n[gmax]--;
    12.             n[gmin]++;
    13.         }
    14. }

    Singleton Set: 團體是否合併過?

    自己一個人一組,沒有union過。

     
    1. bool singleton(int x)
    2. {
    3.     return member[x] == 1;
    4. }

    時間複雜度

    union為O(N),find、equivalence、cardinality、singleton為O(1)。

    如果有N個人,全部的人都union過一遍,每次union要花O(N)時間,總共是花O(N^2)時間。

    空間複雜度

    如果有N個人,就需要一條N格的陣列,為O(N)。

    UVa 10608

    Disjoint Sets: Disjoint-set Linked Lists

    Disjoint-set Linked Lists

    和Set Linked Lists的方式是一樣的。【待補文字】

    Disjoint Sets: Disjoint-set Forest

    Disjoint-set Forest

    讓一條int陣列的第x格代表第x人──不過,格子裡改成填上x的老大是誰:

     
    1. int g[10];  // 紀錄每個人的老大
    2. g[0] = 0;   // 第 0 人的老大是第 0 人
    3. g[1] = 0;   // 第 1 人的老大是第 0 人
    4. g[2] = 1;   // 第 2 人在老大是第 1 人
    5. g[9] = 3;   // 第 9 人在老大是第 8 人

    有一點像是老鼠會,也可以看作是圖論所提到的有根樹(rooted tree)。各位可能會有一個疑問:一個團體之中,每個人都有一個老大,那麼某君的老大是誰呢?可以暫且設定成自己:

    以無法向上追溯的設定,來代表這個人是團體的大頭目。團體的所有成員,他們往上追溯之後,會是同一個頭目。一個團體中,也只會有一個頭目,由他來支配團體、做為團體的代表。

    一個團體就像是一棵分支很複雜的有根樹,不過卻是萬流歸宗的。這些團體構成了一叢森林,故名Disjoint-set Forest。

    初始化

    一開始大家還沒開始分團的時候,其實可以想做是:每個人都不同團,每個人都是自己一人一團,而且自己當頭目。根據上述的設定方是,要將第x格的值設成x,這樣每個人就都是不同團體的頭目了。

     
    1. int p[10];
    2. void initialize()
    3. {
    4.     for (int x=0x<10x++)
    5.         p[x] = x;
    6. }

    Find: 找出一個人在哪一團?

    接下來談談頭目吧。頭目在一個團體之中扮演舉足輕重的角色,一個團體只會有一個頭目,所以可以用頭目做為一個團體的代表。

     
    1. int find(int x)
    2. {
    3.     // 當 x 不是頭目,就繼續追本溯源,直到找到頭目。
    4.     while (x != p[x])
    5.         x = p[x];
    6.     return x;
    7. }
     
    1. int find(int x)
    2. {
    3.     return x == p[x] ? x : find(p[x]);
    4. }

    find的時候可以順便把遇到的人,將其老大都設為頭目。如此一來下次find的時候就會變更快了。

     
    1. int find(int x)
    2. {
    3.     return x == p[x] ? x : p[x] = find(p[x]);
    4. }

    Union: 兩個人想合併自己所屬團體

    目標是將x y兩個團體做合併,並重新選出一個頭目。最簡單的方式是:讓x的頭目帶著他所有小弟,投靠y團體的隨便一個人之下,如此一來兩個團體就擁有共同的頭目了,也依然保持著老鼠會的架構。

     
    1. void union(int xint y)
    2. {
    3.     return p[find(x)] = y;
    4. }

    union的時候,直接投靠對方的老大,可以讓樹的深度增加最少。如此一來下次find的時候就會變更快了。

     
    1. void union(int xint y)
    2. {
    3.     return p[find(x)] = find(y);
    4. }

    實做小叮嚀:union要確保投奔的人是頭目,投奔後頭目只有一個。另外也要避免同團體的人互相設定彼此是頭目,否則find會無限循環。

    Equivalent Relation: 兩個人是否同團?

    同一個團體中的成員,他們的頭目都是同一個人。要看兩個人是不是同一團,看看他們的頭目是不是同一人就行了。

     
    1. bool equivalence(int xint y)
    2. {
    3.     return find(x) == find(y);
    4. }

    Number of Sets: 全部總共有幾個團體?

    兩團合併成一團後,總團體數就會減少一團。所以只要修改一下union的程式碼就可以了。

     
    1. int groups = 10;    // 團體數
    2. void union(int xint y)
    3. {
    4.     x = find(x); y = find(y);
    5.     if (x == yreturn;
    6.     groups--;   // 兩團合併成一團,總團體數就會減少一團。
    7.     p[x] = y;
    8. }

    Cardinality of a Set: 一個團體總共有幾個人?

    先前提到頭目可以支配、代表一個團體,所以把焦點放在頭目上吧。嘗試開一個陣列來記錄頭目帶領的人數,n[頭目] = 頭目帶領的人數。

    以團體的角度來看:兩團合併成一團後,團體人數就會改變。以人的角度來看:當一個人所屬的團體被改變時,就調整人數。所以只要修改一下union的程式碼就可以了。

     
    1. int n[10];  // 每個頭目帶領的人數
    2. void initialize()
    3. {
    4.     for (int i=0i<10i++)
    5.     {
    6.         g[i] = i;
    7.         n[i] = 1;   // 頭目有第 0 到第 9 人,每團都是一個人。
    8.     }
    9. }
    10. void union(int xint y)
    11. {
    12.     x = find(x); y = find(y);
    13.     if (x == yreturn;
    14.     groups--;
    15.     n[y] += n[x];   // 新頭目吸收人數
    16.     n[x] = 0;       // 舊頭目不再帶領人
    17.     p[x] = y;
    18. }
    19. int cardinality(int x)
    20. {
    21.     return n[find(x)];
    22. }

    Singleton Set: 團體是否合併過?

    自己一個人一組,沒有union過。

     
    1. bool singleton(int x)
    2. {
    3.     return n[find(x)] == 1;
    4. }

    也就是自已當頭目的意思。

     
    1. bool singleton(int x)
    2. {
    3.     return p[x] == x;
    4. }

    時間複雜度

    union、find、singleton、equivalence的平均時間是Ω(α(N)),無法更低了,cardinality為O(1)。其中α(N)是Ackermann function f(N,N)的反函數。我不會證。【待補文字】

    空間複雜度

    如果有N個人,就需要一條N格的陣列,為O(N)。

    UVa 793 879 10158 10505 10583 10608 10685

    Empty Set: 空集合

    之前我們都未處理空集合。現在我們要改良原本的方法,讓它可以處理空集合,而效率仍然保持一樣。

    先將資料結構做點改變。現在將陣列的第0格當作是一個空集合,不代表任何人。總人數如果有100人,那麼就要開101格的陣列。第0格是空集合,第1格到第100格,分別代表著100個人。

    現在既然有了空集合,便可將頭目的老大設定為空集合,更具義理。也就是說,初始化時要將陣列的初始值都改成0。

     
    1. int g[10+1];
    2. void initialize()
    3. {
    4.     for (int x=0x<10+1x++)
    5.         p[x] = 0;
    6. }
     
    1. void empty(int x)
    2. {
    3.     return x == 0;
    4. }

    多了空集合,就要另外考慮空集合做聯集時的影響。不管什麼集合,只要和空集合作聯集,集合都不會改變。所以,凡是遇到空集合,就不必做聯集了。

     
    1. void union(int xint y)
    2. {
    3.     x = find(x); y = find(y);
    4.     if (x == y || x == 0 || y == 0return;
    5.     return p[x] = y;
    6. }

    其他部分大致都不變,就不另外說明了。

    Disjoint Sets進階應用

    Disjoint Sets進階應用(UVa 10608)

    我們可將Disjoint Set運用在結交朋友上面。但是樹立敵人該怎麼做呢?

    先來整理一下Disjoint-set Forest的概念:

    一、每個團體的頭目只有一個。每個團體的成員,他們的頭目都一樣,頭目可以視為一個團體的代表。

    二、紀錄每個團體的人數時,我們利用了一條陣列,令n[頭目] = 頭目帶領的人數。

    靈感來了:如法炮製,開一條類似記錄團體人數的陣列,用來紀錄頭目的敵人是哪一個頭目,意義同於紀錄敵對團體。

    初始化

    一開始大家都是沒有敵人的。

     
    1. int enemy[10+1];
    2. void intialize()
    3. {
    4.     // 一開始每個人的敵人都是空集合
    5.     for (int i=0i<10+1i++)
    6.         enemy[i] = 0;
    7. }

    樹立敵人

    兩個團體的頭目互相設定彼此是敵人即可。

     
    1. void set_enemy(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     enemy[a] = b;   // a 的敵人是 b
    5.     enemy[b] = a;   // b 的敵人是 a
    6. }

    有一些意外狀況要考慮清楚。一、在a b互相設定為敵人之前,a b其實都各自有敵人了;二、a本來沒有敵人,b本來沒有敵人,或者a b本來都沒有敵人;三、a的敵人可能早就是b了,b的敵人也可能早就是a了,或者早就互為敵人了;四、a b互為朋友,不可能互為敵人。

    第一點:在a b互相設定為敵人之前,a b其實都各自有敵人了。按照題意,a的敵人,是b的朋友,所以a b互設敵人,要將a既有的敵人,併入b的團體中;同理,也要將b既有的敵人,併入a的團體中。

     
    1. void set_enemy(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     union(enemy[a], b); // a 的敵人,是 b 的朋友
    5.     union(enemy[b], a); // b 的敵人,是 a 的朋友
    6.     enemy[a] = b;
    7.     enemy[b] = a;
    8. }

    第二點:a本來沒有敵人,b本來沒有敵人,或者a b本來都沒有敵人。我們的聯集程式碼可以處理空集合,沒有問題。

     
    1. void set_enemy(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     union(enemy[a], b); // 空集合做聯集,沒有問題
    5.     union(enemy[b], a);
    6.     enemy[a] = b;
    7.     enemy[b] = a;
    8. }

    第三點:a的敵人可能早就是b了,b的敵人也可能早就是a了,或者早就互為敵人了。我們的聯集程式碼可以處理相同集合做聯集,沒有問題。

     
    1. void set_enemy(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     union(enemy[a], b); // 相同集合做聯集,沒有問題
    5.     union(enemy[b], a);
    6.     enemy[a] = b;
    7.     enemy[b] = a;
    8. }

    若是 enemy[a] == b,按照union的程式碼,enemy[a]和b不會真的做union。所以沒有必要增加程式碼。維持第二點的程式碼即可。

    第四點:a b互為朋友,不可能互為敵人。這會導致矛盾,所以要修改一下程式碼,預防這個情況。

     
    1. void set_enemy(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     if (a == b// a 和 b 在同一個團體
    5.         cout << "發生了矛盾" << endl;
    6.     else
    7.     {
    8.         union(enemy[a], b);
    9.         union(enemy[b], a);
    10.         enemy[a] = b;
    11.         enemy[b] = a;
    12.     }
    13. }

    結交朋友

    由於現在多了enemy陣列的關係,交友就不能單純的只做union了。

    如同樹立敵人,有一些意外狀況要考慮清楚。一、在a b互相設定為朋友之前,a b其實都各自有朋友了;二、a本來沒有朋友,b本來沒有朋友,或者a b本來都沒有朋友;三、a的朋友可能早就是b了,b的朋友也可能早就是a了,或者早就互為朋友了;四、a b互為敵人,不可能互為朋友。

    第一點。其實就是union的概念。

     
    1. void set_friend(int xint y)
    2. {
    3.     union(xy);
    4. }

    第二點。仍是union的概念。

    第三點。我們的聯集程式碼可以處理相同集合做聯集,沒有問題。

    第四點。這會導致矛盾,所以要修改一下程式碼。

     
    1. void set_friend(int xint y)
    2. {
    3.     int a = find(x), b = find(y);
    4.     if (enemy[a] == b || enemy[b] == a)
    5.         cout << "發生了矛盾" << endl;
    6.     else
    7.         union(ab);
    8. }

    转自http://acm.nudt.edu.cn/~twcourse/DisjointSets.html

  • 相关阅读:
    mysql中delimiter
    error: unpacking of archive failed on file /usr/sbin/zabbix_agent;592e5bc3: cpio: open
    CefSharp中文帮助文档
    ASP.NET Aries 开发框架
    简洁的富文本编辑器
    asp.net core 获取appsettings.json里的配置
    在asp.net core中使用NLog
    临时禁用Resharper
    visual studio 无添加视图 选项
    visual studio(vs)初始化
  • 原文地址:https://www.cnblogs.com/hailong88/p/3293425.html
Copyright © 2011-2022 走看看