目录
一、集合
1.1 集合及其作用
什么是集合?集合就是在{}内用逗号分隔开多个元素,多个元素满足以下三个条件:
1. 集合内元素必须为不可变类型
2. 集合内元素无序
3. 集合内元素没有重复
s={1,2} # s=set({1,2})
s={1,[1,2]} # TypeError: unhashable type: 'list'
s={1,'a','v','b','g'} # 元素无序,多次打印排序不一样
print(s)
s={1,2,3,3,3,3,3,'a','f'} # {1, 2, 3, 'a', 'f'}
print(s)
集合与list、tuple、dict一样,都可以存放多个值,但是集合主要用于:去重、关系运算。
l1=['abc','acd','111','222']
l2=['awc','aed','111','222']
l=[]
for x in l1:
if x in l2:
l.append(x)
print(l) # ['111', '222'] 列表的关系运算,取重合部分
了解:
s={} # 默认是空字典
print(type(s)) # <class 'dict'>
定义空集合
s=set()
print(s,type(s)) # set() <class 'set'>
1.2 类型转换
但凡能被for循环的遍历的数据类型(遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型
>>> s = set([1,2,3,4]) # 列表转换
{1, 2, 3, 4}
>>> s1 = set((1,2,3,4)) # 元组转换
{1, 2, 3, 4}
>>> s2 = set({'name':'jason',})
{'name'}
>>> s3 = set('goooooooal')
{'l', 'a', 'o', 'g'}
>>> s3 = set([1,1,1,1,1,1,1,2,[111,222]]) #报错,含有可变类型数据
1.3 集合的使用
集合内置方法的使用:
>>>l1={'abc','acd','111','222'}
>>>l2={'qwc','qed','111','222'}
1.3.1 关系运算--取交集
>>>res=l1 & l2 # 优先使用符号进行运算
>>>print(res)
>>>print(l1.intersection(l2)) # 使用内置方法
{'111', '222'}
1.3.2 关系运算--取并集/合集:
>>>print(l1 | l2) # 优先使用符号进行运算
>>>print(l1.union(l2))
{'abc', 'acd', '111', 'qed', 'qwc', '222'}
1.3.3 关系运算--取差集:
>>>print(l1 - l2) # 优先使用符号进行运算
>>>print(l1.difference(l2))
{'acd', 'abc'}
>>>print(l2 - l1) # 优先使用符号进行运算
>>>print(l2.difference(l1))
{'qed', 'qwc'}
1.3.4 关系运算--对称差集:两个集合去掉重合部分
>>>print(l1 ^ l2) # 优先使用符号进行运算
>>>print(l1.symmetric_difference(l2))
print((l1 - l2) |(l2 - l1))
1.3.5 关系运算--父子集 :包含的关系
>>>s1={1,2,3}
>>>s2={1,2,4}
>>>print(s1>s2) # 不存在包含关系,False
>>>print(s1.issubset(s2)) # 不存在包含关系,False
>>>print(s1.issuperset(s2)) # 不存在包含关系,False
>>>s1={1,2,3}
>>>s2={1,2}
print(s1>s2) # 当s1大于或等于s2时,才能说s1是s2的父集
>>>s1={1,2,3}
>>>s2={1,2,3}
print(s1==s2) # s1与s2互为父子集
1.3.6 去重运算,有局限性
局限性1:只能针对不可变类型去重,
>>>print(set([1,1,1,1,2]))
{1, 2}
局限性2:无法保证原来的顺序
>>>l=[1,'a','b','z',1,1,1,2]
>>>l=list(set(l))
>>>print(l)
[1, 2, 'z', 'b', 'a']
若字典去重,可变类型去重使用字典,不能使用集合
>>>l=[{'name':'lili','age':18,'sex':'male'},
{'name':'jack','age':73,'sex':'male'},
{'name':'tom','age':20,'sex':'female'},
{'name':'lili','age':18,'sex':'male'},
{'name':'lili','age':18,'sex':'male'},
]
>>>new_l=[]
>>>for dic in l:
>>> if dic not in new_l:
>>> new_l.append(dic)
>>>print(new_l)
[{'name': 'lili', 'age': 18, 'sex': 'male'}, {'name': 'jack', 'age': 73, 'sex': 'male'}, {'name': 'tom', 'age': 20, 'sex': 'female'}]
1.3.7 其他内置方法
>>>s={1,2,3} #定义一个集合
方法1:discard
>>>s.discard(4) # 删除元素不存在do nothing
>>>print(s)
{1, 2, 3}
>>>s.remove(4) # 删除元素不存在则报错
方法2:update 更新集合元素
>>>s.update({1,3,5})
>>>print(s)
{1, 2, 3, 5}
方法3:pop 从集合中取走元素
>>>res=s.pop()
>>>print(res)
1
方法4:add 添加单个元素
>>>s.add(4)
>>>print(s)
{2, 3, 4, 5}