zoukankan      html  css  js  c++  java
  • Python的Dict容器

    什么是dict

    我们已经知道,List 和 tuple 可以用来表示顺序集合,例如,班里同学的名字:

    ['Alice', 'Bob', 'Candy', 'David', 'Ellena'] # List
    ('Alice', 'Bob', 'Candy', 'David', 'Ellena') # tuple
    

    或者考试的成绩:

    [45, 60, 75, 86, 49] # list
    (45, 60, 75, 86, 49) # tuple
    

    如果同学名字的列表和同学成绩的列表是一一对应的,那么通过下标,我们也可以找到每个同学的成绩。

    names = ['Alice', 'Bob', 'Candy', 'David', 'Ellena']
    scores = [45, 60, 75, 86, 49]
    index = 0
    for name in names:
        score = scores[index]
        print('name = {}, score = {}'.format(name, score))
        index = index + 1
    

    事实上,我们可以得到这样的映射。

    'Alice' ==> 45
    'Bob' ==> 60
    'Candy' ==> 75
    'David' ==> 86
    'Ellena' ==> 49
    

    但是使用两个list,始终有些麻烦的,尤其是需要变换一个列表的顺序后,另外一个列表也需要做同样的变换,否则就可能出现对应不上的问题。

    python的dict就是专门保存这种映射的,使用dict可以方便的保存“名字”->“成绩”的映射。
    在dict中,每一项包含一个key和一个value,key和value是一一对应的,在解决上面的问题中,我们可以使用名字作为key,成绩作为value,那么dict的定义如下:

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    

    在定义里,我们使用花括号{}表示这是一个dict,然后key和value之间使用冒号:分割,并且每一组key:value的最后,以逗号,表示这一组的结束。

    我们也可以使用以下的方式定义一个dict。

    d = dict()
    print(d) # ==> {}
    

    不过这种定义方式,默认得到的是一个空dict,需要调用函数往里面添加数据,我们后面会继续学习。

    Python读取dict元素

    我们现在可以创建一个dict,保存名字和成绩的对应关系。

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49,
        'Gaven': 86
    }
    

    此时,如果想通过名字来查询某个同学的成绩,也就是通过key来查询value,这个时候怎么办呢?
    dict提供通过key找到对应value的功能,通过d[key]的形式,就可以得到对应的value。

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49,
        'Gaven': 86
    }
    print(d['Bob']) # ==> 60
    print(d['Alice']) # ==> 45
    

    这和list通过下标找到对应位置的元素是类似的。
    回顾一下前面使用下标的方式访问list元素的时候,当下标不存在时,就会引发错误,在dict中,也是一样的,当对应的key不存在时,也会引发错误。 

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49,
        'Gaven': 86
    }
    print(d['Dodo'])
    # 抛出异常
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    KeyError: 'Dodo'
    

    它的意思是key不存在,因此我们在需要通过key找到value时,一定要先判断key存不存在,然后才使用上面的方式获取对应的value,以避免错误。

    if 'Alice' in d:
        print(d['Alice']) # ==> 45
    if 'Dodo' in d: # Dodo不存在,所以不会走下面的逻辑
        print(d['Dodo'])
    

    除了使用这种方法,还有一种方法可以通过key来获取对应的value,这种方法不会引起错误,dict本身提供get方法,把key当作参数传递给get方法,就可以获取对应的value,当key不存在时,也不会报错,而是返回None。 

    print(d.get('Alice')) # ==> 45
    print(d.get('Dodo')) # ==> None
    

    因为通过get方法在代码实现上更加简单,且不会引起错误,因此更加推荐使用get方法来获取dict的元素。

    Python添加dict元素

    dict和tuple不一样,dict是可变的,我们随时可以往dict中添加新的key-value,比如对于上节课的成绩dict: 

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    

    需要往里面添加Dodo、Mimi的成绩时,可以使用赋值语句往里面添加元素

    d['Mimi'] = 72
    d['Dodo'] = 88
    print(d)
    

    实际上,value可以是任意类型的元素,可以是list、tuple等,假如Mimi近两次成绩分别是72,73,Dodo近两次的成绩分别是88,90,则可以使用赋值语句往dict中添加list元素。 

    d['Mimi'] = [72, 73]
    d['Dodo'] = [88, 90]
    print(d)
    

    此后,如果Mimi、Dodo的第三次成绩也出来了,分别是75,90,则可以先通过key把对应的value查询出来,然后再往类型是list的value中添加第三次的成绩。

    d['Mimi'].append(75)
    d['Dodo'].append(90)
    print(d) 

    Python更新dict元素

    上一节课我们学习了往dict中添加元素的方法,通过赋值语句就可以把元素添加到dict中去,但是赋值的时候,我们并不确定key是否已经在dict里面了,如果dict里面已经有对应的key了,那将会发生什么呢?

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    d['Bob'] = 75
    print(d)
    # ==> {'Alice': 45, 'Bob': 75, 'Candy': 75, 'David': 86, 'Ellena': 49}
    

    这个时候我们发现,原来Bob的成绩是60,现在变成75了,因为d['Bob'] = 75的缘故。
    因此我们发现这个赋值语句其实有两个功能:

    1. 当key不存在时,往dict中添加对应的key: value元素。
    2. 当key存在时,会更新dict,用新的value替换原来的value。

    因此,在使用赋值语句往dict中添加元素时,为了避免不必要的覆盖问题,我们需要先判断key是否存在,然后再做更新。

    Python删除dict元素

    当同学转校时,我们需要把同学的成绩从已有的成绩dict中删除,这个时候我们就需要学习如何删除dict中的元素。
    dict提供便捷的pop()方法,允许我们快速删除元素,pop()方法需要指定需要删除的元素的key,并返回对应的value。
    假设Alice转校了,需要把Alice的成绩删除,可以这样写:

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    print(d) # ==> {'Alice': 45, 'Bob': 60, 'Candy': 75, 'David': 86, 'Ellena': 49}
    alice_score= d.pop('Alice')
    print(alice_score) # ==> 45
    print(d) # ==> {'Bob': 60, 'Candy': 75, 'David': 86, 'Ellena': 49}
    

    需要注意的是,pop()方法的参数是dict中的key,当key不存在时,同样会引起错误。比如在上述操作中,已经把Alice的成绩删除了,假如再次pop('Alice'),将会引发错误。

      

    d.pop('Alice')
    # 报错
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    KeyError: 'Alice'
    

      

    Python dict的特点

    查找速度快

    dict的第一个特点是查找速度快,无论dict有10个元素还是10万个元素,查找速度都一样。而list的查找速度随着元素增加而逐渐下降。
    不过dict的查找速度快不是没有代价的,dict的缺点是占用内存大,还会浪费很多内容,list正好相反,占用内存小,但是查找速度慢。

    有序与无序

    在Python3.5之前,dict中的元素是无序的,也就是dict中元素的插入顺序和打印顺序未必一致,比如使用Python3.5之前的版本执行以下代码:

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    print(d) # ==> {'Bob': 60, 'Ellena': 49, 'Alice': 45, 'Candy': 75, 'David': 86}
    

    可以看到,打印的顺序和定义的顺序并不一致。
    但是在Python3.6、Python3.7版本中,却得到了有序的结果。

      

    print(d) # ==> {'Alice': 45, 'Bob': 60, 'Candy': 75, 'David': 86, 'Ellena': 49}
    

    为什么在不同的版本中,会得到不一样的结果呢?这是因为底层的实现发生了改变,我们可以认为在Python3.6的版本以后,dict是有序的,但是一般而言,为了避免不必要的误解,一般在需要有序的dict时,我们会使用一种叫做Ordereddict的字典,来确保有序。

    key不可变

    对于基础数据类型,字符串、数字等,这些都是不可变的,可以作为dict的key,而对于复杂数据类型,经过前面的学习,我们知道tuple是不可变的,list是可变的,因此tuple可以作为dict的key,但是list不可以作为dict的key,否则将会报错。

    key = (1, 2, 3) # 以tuple作为key
    d[key] = True
    key = [1, 2, 3]
    d[key] = True
    # 报错
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    TypeError: unhashable type: 'list'
    

    如上所示,如果将list作为dict的key,将会引起错误。
    由于dict是按 key 查找,所以,在一个dict中,key不能重复。

    Python遍历dict

    通过直接print(d),我们打印出来的是完整的一个dict;有时候,我们需要把dict中m一定条件的元素打印出来,比如成绩超过60的,在这种情况下,我们需要则需要遍历dict(这种时候需要使用for循环),并通过条件判断把满足条件的打印出来。
    遍历dict有两种方法, 第一种是遍历dict的所有key,并通过key获得对应的value。

    d = {
        'Alice': 45,
        'Bob': 60,
        'Candy': 75,
        'David': 86,
        'Ellena': 49
    }
    for key in d: # 遍历d的key
        value = d[key]
        if value > 60:
            print(key, value)
    # ==> Candy 75
    # ==> David 86
    

    第二种方法是通过dict提供的items()方法,items()方法会返回dict中所有的元素,每个元素包含key和value。

    for key, value in d.items():
        if value > 60:
            print(key, value)
    # ==> Candy 75
    # ==> David 86
    

     

    Python操作dict的其他方法

    除了前面学习的增删改查,dict还提供了非常多的工具函数帮助我们方便快捷的使用dict。

    获取dict的所有key

    dict提供keys()函数,可以返回dict中所有的key。

    d = {'Alice': [50, 61, 66], 'Bob': [80, 61, 66], 'Candy': [88, 75, 90]}
    for key in d.keys():
        print(key)
    # ==> Alice
    # ==> Bob
    # ==> Candy
    

     

    获取dict所有的value

    dict提供values()函数,可以返回dict中所有的value。

    d = {'Alice': [50, 61, 66], 'Bob': [80, 61, 66], 'Candy': [88, 75, 90]}
    for key in d.values():
        print(key)
    # ==> [50, 61, 66]
    # ==> [80, 61, 66]
    # ==> [88, 75, 90]
    

    清除所有元素

    dict提供clear()函数,可以直接清除dict中所有的元素。

    d = {'Alice': [50, 61, 66], 'Bob': [80, 61, 66], 'Candy': [88, 75, 90]}
    print(d) # ==> {'Alice': [50, 61, 66], 'Bob': [80, 61, 66], 'Candy': [88, 75, 90]}
    d.clear()
    print(d) # ==> {}
    

      

    原文:https://www.imooc.com/code/21982

  • 相关阅读:
    spark视频-Spark Streaming实时计算和流处理
    spark视频-Spark把云计算大数据速度提高100倍以上
    spark视频-Spark on Docker深入揭秘
    spark视频-Spark as a Service
    spark视频-Spark on Yarn
    MyEclipse Web 项目导入 Eclipse 中需要改的文件
    【解决】小米M1刷机教程(卡刷)
    【解决】笔记本发射WiFi
    【解决】U盘装系统(Win7/Win8)& 装双系统
    【解决】Internet访问看似正常(无叹号受限)却打不开网页
  • 原文地址:https://www.cnblogs.com/sucretan2010/p/14780256.html
Copyright © 2011-2022 走看看