在Python set是基本数据类型的一种集合类型,它有可变集合(set())和不可变集合(frozenset)两种。创建集合set、集合set添加、集合删除、交集、并集、差集的操作都是非常实用的方法。
- python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.
- sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。
1 x = set('spam') 2 y = set(['h','a','m']) 3 z = {1, 4, 5, 3, 7, 8} 4 print(x, y, z) 5 6 {'a', 'm', 's', 'p'} {'a', 'h', 'm'} {1, 3, 4, 5, 7, 8}
1 x = set('spam') 2 y = set(['h','a','m']) 3 z = {1, 4, 5, 3, 7, 8} 4 print(x, y, z) 5 print(x & y) # 交集 6 7 {'m', 'a'} 8 print(x | y) # 并集 9 10 {'p', 's', 'm', 'h', 'a'} 11 print(x - y) 12 print(y - x) # 差集 13 14 {'p', 's'} 15 {'h'}
集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:
去重,把一个列表变成集合,就自动去重了。
关系测试,测试两组数据之前的交集、差集、并集等关系
1,集合的创建
1 set1 = set({1,2,'barry'}) 2 set2 = {1,2,'barry'} 3 print(set1,set2) # {1, 2, 'barry'} {1, 2, 'barry'}
2,集合的增
1 set1 = {'alex','wusir','ritian','egon','barry'} 2 set1.add('景女神') 3 print(set1) 4 5 #update:迭代着增加 6 set1.update('A') 7 print(set1) 8 set1.update('老师') 9 print(set1) 10 set1.update([1,2,3]) 11 print(set1)
3,集合的删
1 set1 = {'alex','wusir','ritian','egon','barry'} 2 3 set1.remove('alex') # 删除一个元素 4 print(set1) 5 6 set1.pop() # 随机删除一个元素 7 print(set1) 8 9 set1.clear() # 清空集合 10 print(set1) 11 12 del set1 # 删除集合 13 print(set1)
4,集合的其他操作:
4.1 交集。(& 或者 intersection)
1 set1 = {1,2,3,4,5} 2 set2 = {4,5,6,7,8} 3 print(set1 & set2) # {4, 5} 4 print(set1.intersection(set2)) # {4, 5}
4.2 并集。(| 或者 union)
1 set1 = {1,2,3,4,5} 2 set2 = {4,5,6,7,8} 3 print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7} 4 5 print(set2.union(set1)) # {1, 2, 3, 4, 5, 6, 7}
4.3 差集。(- 或者 difference)
1 set1 = {1,2,3,4,5} 2 set2 = {4,5,6,7,8} 3 print(set1 - set2) # {1, 2, 3} 4 print(set1.difference(set2)) # {1, 2, 3}
4.4反交集。 (^ 或者 symmetric_difference)
1 set1 = {1,2,3,4,5} 2 set2 = {4,5,6,7,8} 3 print(set1 ^ set2) # {1, 2, 3, 6, 7, 8} 4 print(set1.symmetric_difference(set2)) # {1, 2, 3, 6, 7, 8}
4.5子集与超集
1 set1 = {1,2,3} 2 set2 = {1,2,3,4,5,6} 3 4 print(set1 < set2) 5 print(set1.issubset(set2)) # 这两个相同,都是说明set1是set2子集。 6 7 print(set2 > set1) 8 print(set2.issuperset(set1)) # 这两个相同,都是说明set2是set1超集。
5,frozenset不可变集合,让集合变成不可变类型。
1 s = frozenset('barry') 2 print(s,type(s)) # frozenset({'a', 'y', 'b', 'r'}) <class 'frozenset'>
二,深浅copy
1,先看赋值运算。
1 l1 = [1,2,3,['barry','alex']] 2 l2 = l1 3 4 l1[0] = 111 5 print(l1) # [111, 2, 3, ['barry', 'alex']] 6 print(l2) # [111, 2, 3, ['barry', 'alex']] 7 8 l1[3][0] = 'wusir' 9 print(l1) # [111, 2, 3, ['wusir', 'alex']] 10 print(l2) # [111, 2, 3, ['wusir', 'alex']]
对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。
2,浅拷贝copy。
1 l1 = [1,2,3,['barry','alex']] 2 3 l2 = l1.copy() 4 print(l1,id(l1)) # [1, 2, 3, ['barry', 'alex']] 2380296895816 5 print(l2,id(l2)) # [1, 2, 3, ['barry', 'alex']] 2380296895048 6 7 l1[1] = 222 8 print(l1,id(l1)) # [1, 222, 3, ['barry', 'alex']] 2593038941128 9 print(l2,id(l2)) # [1, 2, 3, ['barry', 'alex']] 2593038941896 10 11 12 l1[3][0] = 'wusir' 13 print(l1,id(l1[3])) # [1, 2, 3, ['wusir', 'alex']] 1732315659016 14 print(l2,id(l2[3])) # [1, 2, 3, ['wusir', 'alex']] 1732315659016
对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。
3,深拷贝deepcopy。
1 import copy 2 l1 = [1,2,3,['barry','alex']] 3 l2 = copy.deepcopy(l1) 4 5 print(l1,id(l1)) # [1, 2, 3, ['barry', 'alex']] 2915377167816 6 print(l2,id(l2)) # [1, 2, 3, ['barry', 'alex']] 2915377167048 7 8 l1[1] = 222 9 print(l1,id(l1)) # [1, 222, 3, ['barry', 'alex']] 2915377167816 10 print(l2,id(l2)) # [1, 2, 3, ['barry', 'alex']] 2915377167048 11 12 l1[3][0] = 'wusir' 13 print(l1,id(l1[3])) # [1, 222, 3, ['wusir', 'alex']] 2915377167240 14 print(l2,id(l2[3])) # [1, 2, 3, ['barry', 'alex']] 2915377167304
对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。