zoukankan      html  css  js  c++  java
  • 基本数据类型之集合

    1、集合类型
        关系运算
        去重(有局限性)
    
    2、总结与分类
        有序or无序:有序又称之为序列类型
    
        存一个值or多个值:存一个值称为原子类型,存多个值称为容器类型
    
        可变or不可变
    
    3、字符编码(理论多,结论少)
        文本文件
        x='上'
    

    基本数据类型之集合

    1、作用

    集合可以进行独特的关系运算,对某些数据能做出去重的操作

    1.1 关系运算

    friends1 = ["zero","kevin","jason","egon"]
    friends2 = ["Jy","ricky","jason","egon"]
    l=[]
    for x in friends1:
        if x in friends2:
            l.append(x)
    print(l)
    # ['jason', 'egon']
    

    如上面这段代码,要取两个列表中的共同朋友。需要进行较为复杂的操作,而使用集合,只需要一个方法便能得到。还有其他方法在后面会具体说明

    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    
    res=friends1 & friends2
    print(res)
    # {'jason', 'egon'}
    
    print(friends1.intersection(friends2))
    # {'jason', 'egon'}
    

    1.2、去重

    使用集合去重有两个注意点:

    1.2.1 只能针对不可变类型去重

    因为集合内不能存放不可哈希的数据类型,即集合内不能有可变数据类型的数据,所以集合的去重只能针对不可变类型去重。

    print(set([1,1,1,1,2]))
    # {1, 2}
    
    print({1, 1, 1, [1, 1, 2]})
    # TypeError: unhashable type: 'list'
    

    1.2.2 无法保证原来的顺序

    集合是一种无序的数据类型,所以去重后无法保证顺序相同

    l=[1,'a','b','z',1,1,1,2]
    l=list(set(l))
    print(l)
    # [1, 2, 'b', 'z', 'a']
    

    下面是不使用集合的去重方法

    l=[
        {'name':'lili','age':18,'sex':'male'},
        {'name':'jack','age':73,'sex':'male'},
        {'name':'tom','age':20,'sex':'female'},
        {'name':'lili','age':18,'sex':'male'},
        {'name':'lili','age':18,'sex':'male'},
    ]
    new_l=[]
    for dic in l:
        if dic not in new_l:
            new_l.append(dic)
    print(new_l)
    
    '''
    [{'name': 'lili', 'age': 18, 'sex': 'male'}, {'name': 'jack', 'age': 73, 'sex': 'male'}, {'name': 'tom', 'age': 20, 'sex': 'female'}]
    '''
    
    

    2、定义:

    集合的形式是在{}内用逗号分隔开多个元素,并且这多个元素有以下三个特点

    2.1集合内元素必须为不可变类型

    2.2集合内元素无序

    2.3集合内元素没有重复

    s={} # 直接使用{}默认创建空字典
    print(type(s))
    # <class 'dict'>
    
    # 定义空集合的方法
    s=set()
    print(s,type(s))
    # set() <class 'set'>
    
    s={1,2} # s=set({1,2}),集合的定义
    s={1} # s=set({1}),集合的定义
    
    
    # 集合内元素的3个特征
    
    s={1,[1,2]} # 集合内元素必须为不可变类型
    # TypeError: unhashable type: 'list'
    
    s={1,'a','z','b',4,7} # 集合内元素无序
    # 输出结果不同
    
    s={1,1,1,1,1,1,'a','b'} # 集合内元素没有重复
    print(s)
    # {1, 'a', 'b'}
    

    3、类型转换

    3.1类型转换的条件

    所有能被for循环遍历的数据类型都能被转换成集合,但是有一个前提条件:这个数据内的元素必须都为不可变数据类型

    res=set('hellolllll')
    print(res)
    # {'e', 'l', 'o', 'h'}
    
    s = set(range(5))
    print(s)
    # {0, 1, 2, 3, 4}
    
    print(set([1,1,1,1,1,1]))
    # {1}
    
    print(set([1,1,1,1,1,1,[11,222]]) # 报错
    # TypeError: unhashable type: 'list'
          
    print(set({'k1':1,'k2':2}))
    # {'k2', 'k1'}
    

    4、内置方法

    4.1 关系运算符

    4.1.1 取交集:两者共同的好友
    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    res=friends1 & friends2
    print(res)
    # {'egon', 'jason'}
    
    print(friends1.intersection(friends2))
    # {'egon', 'jason'}
    
    4.1.2 取并集/合集:两者所有的好友
    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    print(friends1 | friends2)
    # {'Jy', 'ricky', 'jason', 'kevin', 'egon', 'zero'}
    
    print(friends1.union(friends2))
    # {'Jy', 'ricky', 'jason', 'kevin', 'egon', 'zero'}
    
    4.1.3 取差集:取friends1独有的好友
    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    print(friends1 - friends2)
    # {'zero', 'kevin'}
    
    print(friends1.difference(friends2))
    # {'zero', 'kevin'}
    
    取friends2独有的好友
    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    print(friends2 - friends1)
    # {'Jy', 'ricky'}
    
    print(friends2.difference(friends1))
    # {'Jy', 'ricky'}
    
    4.1.4 对称差集: 求两个用户独有的好友们(即去掉共有的好友)
    friends1 = {"zero","kevin","jason","egon"}
    friends2 = {"Jy","ricky","jason","egon"}
    print(friends1 ^ friends2)
    # {'ricky', 'Jy', 'zero', 'kevin'}
    
    print(friends1.symmetric_difference(friends2))
    # {'ricky', 'Jy', 'zero', 'kevin'}
    
    4.1.5 父子集:包含的关系
    s1={1,2,3}
    s2={1,2,4}
    # 不存在包含关系,下面比较均为False
    print(s1 > s2)
    print(s1 < s2)
    
    s1={1,2,3}
    s2={1,2}
    print(s1 > s2) # 当s1大于或等于s2时,才能说是S2是s1的子集
    print(s1.issuperset(s2)) # s1是父集
    # True
    
    print(s2.issubset(s1)) # s2是子集,s2 < s1  =>True
    # True
    
    s1={1,2,3}
    s2={1,2,3}
    print(s1 == s2) # s1与s2互为子集
    # True
    
    print(s1.issuperset(s2))
    # True
    
    print(s2.issuperset(s1))
    # True
    

    4.2其他操作

    4.2.1 长度:

    s1 = {1, 2, 3}
    print(len(s1))
    # 3
    

    4.2.2 成员运算

    s1 = {1, 2, 3}
    print(1 in s1)
    # True
    

    4.2.3 循环遍历

    s1 = {1, 2, 3}
    for i in s1:
        print(i)
    

    4.2.4 删除元素

    4.2.4.1 discard
    s1 = {1, 2, 3}
    s1.discard(4)
    # 不会报错
    
    4.2.4.2 remove
    s1 = {1, 2, 3}
    s1.remove(4)
    # KeyError: 4
    
    4.2.4.3 pop

    pop有返回值:删除的元素

    s1 = {1, 2, 3}
    res = s1.pop()
    print(res)
    # 1
    
    print(s1)
    # {2, 3}
    

    4.2.5 添加元素:add

    s1 = {1, 2, 3}
    s1.add(4)
    print(s1)
    # {1, 2, 3, 4}
    

    4.2.6 更新:update

    s1 = {1, 2, 3}
    s1.update({1, 3, 5})
    print(s1)
    # {1, 2, 3, 5}
    

    4.2.6 仅作了解的方法

    4.2.6.1 是否独立:isdisjoint
    s1 = {1, 2, 3}
    res = s1.isdisjoint({3, 4, 5, 6})
    # 两个集合有交集,则返回False
    print(res)
    res = s1.isdisjoint({4, 5, 6})
    # 两个集合完全独立、没有共同部分,则返回True
    print(res)
    
    4.2.6.2 update系列

    这个系列相当于在之前的功能上添加一个赋值操作

    s = {1, 2, 3}
    s.difference_update({3,4,5}) # s=s.difference({3,4,5})
    print(s)
    # {1, 2}
    
  • 相关阅读:
    获取程序的当前启动路径
    SuspendLayout,ResumeLayout,Layout,PerformLayout
    序列化反序列化的简单例子
    简单的异步编程入门例子
    ClickOnce的更新策略
    ubuntu update(国内升级源)
    为AptGet设置代理
    如何启用 Ubuntu 中的 root 帐号
    The Great Tunnel Debate: PBT vs TMPLS
    Traffic engineering for Ethernet: PBT vs. TMPLS
  • 原文地址:https://www.cnblogs.com/achai222/p/12482927.html
Copyright © 2011-2022 走看看