一、概述
集合(set)是一种无序且不重复的序列。
无序不重复的特点决定它存在以下的应用场景:
- 去重处理
- 关系测试
差集、并集、交集等,下文详述。
二、创建集合
创建集合的方法与创建字典类似,但没有键值对的概念,具体如下:
s1 = {11,22,33}
还可以通过以下两种方法创建:
s2 = set()
s3 = set([11,22,33])
这两种方法本质上是同一种,都是通过调用系统的set()方法进行参数传递和类型转换,如果不传入参数则直接new一个空的集合;如果传入的参数有重复的元素则直接去重处理。
三、集合的常见函数用法
3.1 元素对象常见操作
- add()
添加一个元素到指定的集合,每次只能添加一个。
s1 = {"Java", "PHP", "C++"} print(s1) s1.add("Python") print(s1) 输出: {'C++', 'PHP', 'Java'} {'C++', 'Python', 'PHP', 'Java'}
- remove()
删除集合中指定的对象,一次只能删除一个,如果该对象不存在则报错。
s1 = {'Java', 'PHP', 'Python', 'C++'} s1.remove("C++") print(s1) s1.remove("C#") #移除不存在的对象 输出: Traceback (most recent call last): File "D:/python/S13/Day3/set.py", line 8, in <module> s1.remove("C#") KeyError: 'C#' {'Java', 'PHP', 'Python'} #第一次成功移除C++,C#不存在,移除时报错
- discard()
与remove()类似,也是删除指定的对象,一次只能删除一个,但是如果该对象不存在时不报错。
s1 = {'Java', 'PHP', 'Python', 'C++'} s1.discard("C++") s1.discard("C#") print(s1) 输出: {'Python', 'PHP', 'Java'}
- pop()
删除集合中任意一个对象,注意不能指定。
s1 = {'Java', 'PHP', 'Python', 'C++'} s1.pop() print(s1) 输出: 运行多次会发现输出的s1不固定
- clear()
清空集合。
s1 = {'Java', 'PHP', 'Python', 'C++'} s1.clear() print(s1) print(len(s1)) 输出: set() 0
3.2 关系测试常见操作
关系测试常用于对两个集合的关系判定。
- difference()
语法结构: set1.difference(set2)或set1 - set2
差集关系运算,以新的set集合形式返回set1中包含,但在set2中不存在的元素集合(不影响原set1和set2)。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.difference(s2)) print(s1 - s2) print(s1) print(s2) 输出: {'PHP', 'Python', 'C++'} {'PHP', 'Python', 'C++'} {'PHP', 'Python', 'C++', 'Java'} {'Shell', 'Java', 'Ruby'}
- issubset()
语法结构: set1.issubset(set2)
判断集合set1是否为set2的子集,返回布尔值。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.issubset(s2)) 输出: False
- issuperset()
语法结构: set1.issuperset(set2)
判断set1是否为set2的父集。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'C++'} print(s1.issuperset(s2)) 输出: True
- isdisjoint()
语法结构: set1.isdisjoint(set2)
判断set1和set2是否存在交集, 如果不存在返回True, 存在则返回False.
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'C++'} s3 = {'GO'} print(s1.isdisjoint(s2)) print(s1.isdisjoint(s3)) 输出: False True
- symmetric_difference()
语法结构:set1.symmetric_difference(set2)或set1 ^ set2
返回set1和set2的对称式差集,相当于执行set1.difference(set2)和set2.difference(set1),以新的set集合形式返回set1和set2中差异部分元素(不在两者中同时存在)集合(仅在set1和set2中出现过一次的元素不影响原set1和set2)。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.symmetric_difference(s2)) print(s1 ^ s2) 输出: {'PHP', 'Ruby', 'Shell', 'C++', 'Python'} {'PHP', 'Ruby', 'Shell', 'C++', 'Python'}
- symmetric_difference_update()
语法结构:set1.symmetric_difference(set2)
返回set1和set2的对称式差集,并覆盖更新原set1集合(原来被调用操作的对象),即执行set1 = set1.symmetric_difference(set2)
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.symmetric_difference(s2)) s1.symmetric_difference_update(s2) print(s1) 输出: {'PHP', 'C++', 'Shell', 'Python', 'Ruby'} {'Python', 'Shell', 'Ruby', 'PHP', 'C++'}
- intersection()
语法结构: set1.intersection(set2)或set1 & set2
交集运算,以set方式返回set1和set2的交集部分(同时存在的元素),不影响原集合set1和set2.
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.intersection(s2)) 输出: {'Java'}
- intersection_update()
语法结构: set1.intersection_update(set2)
执行交集运算,并将结果覆盖更新原集合set1(原来被调用操作的对象)。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} s1.intersection_update(s2) print(s1) 输出: {'Java'}
- union()
语法结构: set1.union(set2)或set1 | set2
执行并集计算,合并set1和set2中的对象并做去重处理,最后以集合形式返回结果。
综合上述关系运算函数,可确定并集计算相当于对称差集与交集的并集计算,即合并重复重现的对象和不重复出现的对象,set1.union(set2) = (set1.symmetric_difference(set2)).union(set1.intersection(set2))s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1.union(s2)) 输出: {'Shell', 'PHP', 'Ruby', 'C++', 'Python', 'Java'}
- update()
语法结构: set1.update(obj)
往集合中批量添加元素,添加的对象必须是可以迭代的对象(当然如果原集合中存在与迭代对象中重复的元素会做去重处理),本质上是通过循环,把传入的迭代对象逐个添加更新到原集合中。
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} s1.update(s2) print(s1) 输出: {'Python', 'Ruby', 'Shell', 'C++', 'Java', 'PHP'}
- in 或not in
成员运算函数同样适用于集合,最后返回布尔值。
s1 = {'Java', 'PHP', 'Python', 'C++'} print('Java' in s1) if 'Go' in s1: print("OK") else: print("Not OK") 输出: True Not OK
- <=
语法结构: set1 <= set2
判断set1中的每个元素是否都在set2中,即判断set1是否为set2的子集,等同于set1.issubset(set2)
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} s3 = s1.union(s2) print(s1 <= s2) print(s1.issubset(s2)) print(s1 <= s3) print(s1.issubset(s3)) 输出: False False True True
3.3 关系测试运算符
常见的关系测试运算符如下:
s1 = {'Java', 'PHP', 'Python', 'C++'} s2 = {'Java', 'Shell', 'Ruby'} print(s1 - s2) print(s1.difference(s2)) print("") print(s1 & s2) print(s1.intersection(s2)) print("") print(s1 | s2) print(s1.union(s2)) print("") print(s1 ^ s2) print(s1.symmetric_difference(s2)) print("") print(s1 <= s2) print(s1.issubset(s2)) 输出: {'C++', 'PHP', 'Python'} {'C++', 'PHP', 'Python'} {'Java'} {'Java'} {'C++', 'Python', 'Shell', 'Ruby', 'Java', 'PHP'} {'C++', 'Python', 'Shell', 'Ruby', 'Java', 'PHP'} {'C++', 'Shell', 'Python', 'Ruby', 'PHP'} {'C++', 'Shell', 'Python', 'Ruby', 'PHP'}
False
False