一、集合set的定义初始化
- 约定set翻译为集合,collection翻译为集合类型,是一个大概念;集合是可变的,无序的,不重复元素的集合
- set() 定义一个空集合
- set(iterable) 定义一个有元素的集合
- set的元素要求必须可以hash,目前学过的不可hash的类型有list,set
- 元素不可以索引
- 举例:
- >>> s1 = set()
>>> s1
set()
>>> s2 = set(range(5))
>>> s2
{0, 1, 2, 3, 4}
>>> s3 = set(list(range(10)))
>>> s3
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s4 = {9,101,10}
>>> s5 = {[1],(1,),1} #报错,集合元素必须是可hash
二、python的哈希hash
- 在python中list,set和dict都是可变的,所以他们都是不可hash的
- tuple和string是不可变的,只可以做复制或者切片等操作,所以他们是可hash的
三、集合set元素增加
- s.add(value) 增加一个元素到set中,如果元素存在,什么都不做
- s.update(*others) 合并其他元素到set集合中来,参数other必须是可迭代对象,就地修改
四、集合set元素删除
- s.remove(value) 从set中移除一个元素,元素不存在,抛出keyError异常
- s.discard(value) 从set中移除一个元素,元素不存在什么都不做
- s.pop() 移除并返回任意的元素,空集合返回keyError异常
- s.clear() 清空集合
五、集合set元素修改,查询
- set没有修改,要么删除,要么加入新的元素
- set是非线性结构,无法索引查询
- 可以迭代集合中所有元素
- in和not in判断元素是否在set中
六、集合set和线性结构
- 线性结构的查询时间复杂度是O(n),即随着数据规模的增大而耗时
- set,dict等非线性结构,内部使用hash值作为key,时间复杂度是O(1)