set集合
set集合是python的一个基本数据类型. 一般不是很常用. set中的元素是不重复的.无序的.
里面的元素必须是可hash的(int, str, tuple,bool), 我们可以这样来记. set就是dict类型的数据但是不保存value, 只保存key. set也用{}表示
注意: set集合中的元素必须是可hash的, 但是set本身是不可hash得. set是可变的.
使用set集合这个特性.我们可以使用set来去掉重复
# 给list去重复
lst = [45, 5, "哈哈", 45, '哈哈', 50] lst = list(set(lst)) # 把list转换成set, 然后再转换回list print(lst)
1. 增加
s.add("郑裕玲") # 重复的内容不会被添加到set集合中 s.update("麻花藤") # 迭代更新
2. 删除
s.remove("关之琳") # 直接删除元素 # s.remove("马虎疼") # 不存在这个元素. 删除会报错 s.clear() # 清空set集合.需要注意的是set集合如果是空的. 打印出来是set() 因为要和dict区分的.
3. 修改
# set集合中的数据没有索引. 也没有办法去定位一个元素. 所以没有办法进行直接修改. # 我们可以采用先删除后添加的方式来完成修改操作 s = {"刘嘉玲", '关之琳', "王祖贤","张曼玉", "李若彤"} # 把刘嘉玲改成赵本山 s.remove("刘嘉玲") s.add("赵本山") print(s)
4. 查询
set是一个可迭代对象. 所以可以进行for循环 for el in s: print(el) ----------- s1 = {"刘能", "赵四", "皮长山"} s2 = {"刘科长", "冯乡长", "皮长山"}
# 交集 # 两个集合中的共有元素 print(s1 & s2) # {'皮长山'} print(s1.intersection(s2)) # {'皮长山'} 并集 print(s1 | s2) # {'刘科长', '冯乡长', '赵四', '皮长山', '刘能'} print(s1.union(s2)) # {'刘科长', '冯乡长', '赵四', '皮长山', '刘能'} # 差集 print(s1 - s2) # {'赵四', '刘能'} 得到第一个中单独存在的 print(s1.difference(s2)) # {'赵四', '刘能'} # 反交集 print(s1 ^ s2) # 两个集合中单独存在的数据 {'冯乡长', '刘能', '刘科长', '赵四'} print(s1.symmetric_difference(s2)) # {'冯乡长', '刘能', '刘科长', '赵四'} # 子集 print(s1 < s2) # set1是set2的子集吗? True print(s1.issubset(s2)) # 超集 print(s1 > s2) # set1是set2的超集吗? False print(s1.issuperset(s2))