zoukankan      html  css  js  c++  java
  • [算法]——集合子集

    1)集合子集

    对于给定的集合S={1,2,3},求其所有子集。LintCode

    一种通常的做法是:对于集合中的任意一个元素e,有两种可能:被选中作为子集中的元素,或否。因此,一个包含N个元素的集合,共有2^N个子集。如上例,其所有子集如下:

    s0={}, s1={1}, s2={2}, s3={3}, s4={1,2}, s5={2,3}, s6={1,3}, s7={1,2,3}.

    使用递归很容易写出如下代码:

    // Method 1 recursion
    class Solution {
    	void subsetcore(vector<int> &nums,int pos,
    		vector<vector<int> > &vs, vector<int> &v){
    		if (pos==nums.size()){
    			vs.push_back(v);		// get one subset
    			return;
    		}
    		v.push_back(nums[pos]);		// select this element
    		subsetcore(nums,pos+1,vs,v);
    		v.pop_back();				// not select
    		subsetcore(nums,pos+1,vs,v);
    	}
    public:
    	/**
    	 * @param S: A set of numbers.
    	 * @return: A list of lists. All valid subsets.
    	 * Tip: eacho element has two state: to be selected and not
    	 */
    	vector<vector<int> > subsets(vector<int> &nums) {
    		// write your code here
    		vector<vector<int> > vs;
    		vector<int> v;
    		sort(nums.begin(),nums.end());
    		subsetcore(nums,0,vs,v);
    		return vs;
    	}
    };
    

    其中数组v是当前正在生成的子集,pos是当前选择的元素在原集合(nums)中的位置。直到pos等于原集合的大小,说明寻找到一个子集,则将其加入到结果vs中。其中24行为排序,可以保证最终求得的子集按照字典序,如非必要,可以不用排序。这是回溯法(backtrack)的典型应用。

    由于使用递归,其速度往往很慢。假如原集合中有20个元素,则其递归调用了2^20次,很明显容易出现栈溢出

    2)集合子集非递归版

    仍以上例,对于一个集合S'={1,2},其子集共有四个{},{1},{2},{1,2}。集合S=S'+{3},因此,S的子集=S'的子集+{S'的子集+{3}}。同理,集合S''={1}的子集为{},{1}。

    因此可以使用下面方法:初始一个空子集{};从原始集合中取一个元素e,将现在所求得的所有子集复制,并加入元素e;直到所有元素都取完毕。一种实现代码如下:

    // Method 2 loop
    class Solution {
    public:
    	/**
    	 * @param S: A set of numbers.
    	 * @return: A list of lists. All valid subsets.
    	 *
    	 * Tip: all subsets count: 2^n (include null)
    	 * sketch : set { 1, 2, 3 }
    	 * [ ]
    	 * [ ] [ ] -> [ ] [1]
    	 * [ ] [1] [ ] -> [ ] [1] [2] [1,2]
    	 * [ ] [1] [2] [1,2] [ ] -> [ ] [1] [2] [1,2] [3] [1,3] [2,3] [1,2,3]
    	 */
    	vector<vector<int> > subsets(vector<int> &nums) {
    		// write your code here
    		vector<vector<int> > vs(1);
    		for (int i=0; i<nums.size(); ++i){
    			int size = vs.size();
    			for (int j=0; j<size; ++j){
    				vs.push_back(vs[j]);
    				vs.back().push_back(nums[i]);
    			}
    		}
    		return vs;
    	}
    };
    

    其中20~23行,将当前求得的所有子集复制,并加入当前元素nums[i]。

    3)具有重复元素的集合子集

    从严格意义讲,集合中无重复元素,但是在实际编程时,很多问题将转化成求具有重复元素的集合子集问题。很明显,求得的所有子集,必须唯一。LintCode

    一种简单的思路:仍然按照1)、2)中的方法求所有子集,然后对子集去重复。但是这种方法并不完美。

    可以将原始集合排序,然后每次选择元素时,判断是否与之前选择的元素是否相同,从而进行去重复。一种代码如下:

    class Solution {
    public:
    	/**
    	 * @param S: A set of numbers.
    	 * @return: A list of lists. All valid subsets.
    	 * Tip : See problem 18 subsets
    	 */
    	vector<vector<int> > subsetsWithDup(const vector<int> &S) {
    		// write your code here
    		vector<int> A(S);
    		sort(A.begin(),A.end());
    		vector<vector<int> > vs(1);
    		for (int i=0,count=0; i<A.size(); ++i){
    			int size = vs.size();
    			for (int j=0; j<size; ++j){
    				if (i==0 || A[i-1]!=A[i] || j>=count){
    					vs.push_back(vs[j]);
    					vs.back().push_back(A[i]);
    				}
    			}
    			count=size;
    		}
    		return vs;
    	}
    };
    

    其中16~19行,如果之前选择的元素为空,或者之前的元素与当前元素不同,或者,所选择的总数大于之前的子集,则认为是一个新的无重复子集。

    注:以上代码可参见 https://git.oschina.net/eudiwffe/lintcode/blob/master/C++/subsets.cpp

    https://git.oschina.net/eudiwffe/lintcode/blob/master/C++/subsets-ii.cpp

  • 相关阅读:
    用CSS开启硬件加速来提高网站性能
    vim中替换内容
    alias vi=vim
    PHP 多进程初识
    端口的查看
    PHP三种终止脚本执行:return,die,exit
    2021.3.14(每周总结)
    2021.3.13
    2021.3.12
    2021.3.11
  • 原文地址:https://www.cnblogs.com/eudiwffe/p/6558744.html
Copyright © 2011-2022 走看看