zoukankan      html  css  js  c++  java
  • python数据结构

     

    Python 有许多内建的数据结构。如果你困惑于什么是数据结构,那么可以参考一下 Wikipedia 

    简单的来说,数据结构(data structure)是计算机中存储、组织数据的方式。比如我们之前的课程中使用过的列表就是一种数据结构,在这里我们还会深入学习它。

    知识点

    • 列表的方法与列表元素的删除
    • 将列表用作栈和队列
    • 列表推导式
    • 元组、集合、字典的创建与操作
    • enumerate() 和 zip() 函数

    实验步骤

    1. 列表

    >>> a = [23, 45, 1, -3434, 43624356, 234]
    >>> a.append(45)
    >>> a
    [23, 45, 1, -3434, 43624356, 234, 45]
    

    首先我们建立了一个列表 a。然后调用列表的方法 a.append(45) 添加元素 45 到列表末尾。你可以看到元素 45 已经添加到列表的末端了。有些时候我们需要将数据插入到列表的任何位置,这时我们可以使用列表的 insert() 方法。

    >>> a.insert(0, 1) # 在列表索引 0 位置添加元素 1
    >>> a
    [1, 23, 45, 1, -3434, 43624356, 234, 45]
    >>> a.insert(0, 111) # 在列表索引 0 位置添加元素 111
    >>> a
    [111, 1, 23, 45, 1, -3434, 43624356, 234, 45]
    

    列表方法 count(s) 会返回列表元素中 s 的数量。我们来检查一下 45 这个元素在列表中出现了多少次。

    >>> a.count(45)
    2
    

    如果你想要在列表中移除任意指定值,你需要使用 remove() 方法。

    >>> a.remove(234)
    >>> a
    [111, 1, 23, 45, 1, -3434, 43624356, 45]
    

    现在我们反转整个列表。

    >>> a.reverse()
    >>> a
    [45, 43624356, -3434, 1, 45, 23, 1, 111]
    

    怎样将一个列表的所有元素添加到另一个列表的末尾呢,可以使用列表的 extend() 方法。

    >>> b = [45, 56, 90]
    >>> a.extend(b) # 添加 b 的元素而不是 b 本身
    >>> a
    [45, 43624356, -3434, 1, 45, 23, 1, 111, 45, 56, 90]
    

    给列表排序,我们使用列表的 sort() 方法,排序的前提是列表的元素是可比较的。

    >>> a.sort()
    >>> a
    [-3434, 1, 1, 23, 45, 45, 45, 56, 90, 111, 43624356]
    

    你也能使用 del 关键字删除指定位置的列表元素。

    >>> del a[-1]
    >>> a
    [-3434, 1, 1, 23, 45, 45, 45, 56, 90, 111]
    

    1.1. 将列表用作栈和队列

    栈是我们通常所说的一种 LIFO (Last In First Out 后进先出)数据结构。它的意思是最后进入的数据第一个出来。一个最简单的例子往一端封闭的管道放入一些弹珠然后取出来,如果你想把弹珠取出来,你必须从你最后放入弹珠的位置挨个拿出来。用代码实现此原理:

    >>> a = [1, 2, 3, 4, 5, 6]
    >>> a
    [1, 2, 3, 4, 5, 6]
    >>> a.pop()
    6
    >>> a.pop()
    5
    >>> a.pop()
    4
    >>> a.pop()
    3
    >>> a
    [1, 2]
    >>> a.append(34)
    >>> a
    [1, 2, 34]
    

    上面的代码中我们使用了一个新方法 pop()。传入一个参数 i 即 pop(i) 会将第 i 个元素弹出。

    在我们的日常生活中会经常遇到队列,比如售票窗口、图书馆、超市的结账出口。队列 是一种在末尾追加数据以及在开始弹出数据的数据结构。与栈不同,它是FIFO (First In First Out 先进先出)的数据结构。

    >>> a = [1, 2, 3, 4, 5]
    >>> a.append(1)
    >>> a
    [1, 2, 3, 4, 5, 1]
    >>> a.pop(0)
    1
    >>> a.pop(0)
    2
    >>> a
    [3, 4, 5, 1]
    

    我们使用 a.pop(0) 弹出列表中第一个元素。

    1.2. 列表推导式

    列表推导式为从序列中创建列表提供了一个简单的方法。如果没有列表推导式,一般都是这样创建列表的:通过将一些操作应用于序列的每个成员并通过返回的元素创建列表,或者通过满足特定条件的元素创建子序列。

    假设我们创建一个 squares 列表,可以像下面这样创建。

    >>> squares = []
    >>> for x in range(10):
    ...     squares.append(x**2)
    ...
    >>> squares
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    

    注意这个 for 循环中的被创建(或被重写)的名为 x 的变量在循环完毕后依然存在。使用如下方法,我们可以计算 squares 的值而不会产生任何的副作用:。

    squares = list(map(lambda x: x**2, range(10)))
    

    等价于下面的列表推导式。

    squares = [x**2 for x in range(10)]
    

    上面这个方法更加简明且易读。

    列表推导式由包含一个表达式的中括号组成,表达式后面跟随一个 for 子句,之后可以有零或多个 for 或 if 子句。结果是一个列表,由表达式依据其后面的 for 和 if 子句上下文计算而来的结果构成。

    例如,如下的列表推导式结合两个列表的元素,如果元素之间不相等的话:

    >>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
    [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
    

    等同于:

    >>> combs = []
    >>> for x in [1,2,3]:
    ...     for y in [3,1,4]:
    ...         if x != y:
    ...             combs.append((x, y))
    ...
    >>> combs
    [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
    

    值得注意的是在上面两个方法中的 for 和 if 语句的顺序。

    列表推导式也可以嵌套。

    >>> z = [x + 1 for x in [x ** 2 for x in a]]
    >>> z
    [2, 5, 10]
    

    2. 元组

    元组是由数个逗号分割的值组成。

    >>> a = 'Fedora', 'ShiYanLou', 'Kubuntu', 'Pardus'
    >>> a
    ('Fedora', 'ShiYanLou', 'Kubuntu', 'Pardus')
    >>> a[1]
    'ShiYanLou'
    >>> for x in a:
    ...     print(x, end=' ')
    ...
    Fedora ShiYanLou Kubuntu Pardus
    

    你可以对任何一个元组执行拆封操作并赋值给多个变量,就像下面这样:

    >>> divmod(15,2)
    (7, 1)
    >>> x, y = divmod(15,2)
    >>> x
    7
    >>> y
    1
    

    元组是不可变类型,这意味着你不能在元组内删除或添加或编辑任何值。如果你尝试这些操作,将会出错:

    >>> a = (1, 2, 3, 4)
    >>> del a[0]
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    TypeError: 'tuple' object doesn't support item deletion
    

    要创建只含有一个元素的元组,在值后面跟一个逗号。

    >>> a = (123)
    >>> a
    123
    >>> type(a)
    <class 'int'>
    >>> a = (123, )
    >>> b = 321,
    >>> a
    (123,)
    >>> b
    (321,)
    >>> type(a)
    <class 'tuple'>
    >>> type(b)
    <class 'tuple'>
    

    通过内建函数 type() 你可以知道任意变量的数据类型。还记得我们使用 len() 函数来查询任意序列类型数据的长度吗?

    >>> type(len)
    <class 'builtin_function_or_method'>
    

    3. 集合

    集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。集合对象还支持 union(联合),intersection(交),difference(差)和 sysmmetric difference(对称差集)等数学运算。

    大括号或 set() 函数可以用来创建集合。注意:想要创建空集合,你必须使用 set() 而不是 {}。后者用于创建空字典,我们在下一节中介绍的一种数据结构。

    下面是集合的常见操作:

    >>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
    >>> print(basket)                      # 你可以看到重复的元素被去除
    {'orange', 'banana', 'pear', 'apple'}
    >>> 'orange' in basket
    True
    >>> 'crabgrass' in basket
    False
    
    >>> # 演示对两个单词中的字母进行集合操作
    ...
    >>> a = set('abracadabra')
    >>> b = set('alacazam')
    >>> a                                  # a 去重后的字母
    {'a', 'r', 'b', 'c', 'd'}
    >>> a - b                              # a 有而 b 没有的字母
    {'r', 'd', 'b'}
    >>> a | b                              # 存在于 a 或 b 的字母
    {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
    >>> a & b                              # a 和 b 都有的字母
    {'a', 'c'}
    >>> a ^ b                              # 存在于 a 或 b 但不同时存在的字母
    {'r', 'd', 'b', 'm', 'z', 'l'}
    

    从集合中添加或弹出元素:

    >>> a = {'a','e','h','g'}
    >>> a.pop()
    'h'
    >>> a.add('c')
    >>> a
    {'c', 'e', 'g', 'a'}
    

    4. 字典

    字典是是无序的键值对(key:value)集合,同一个字典内的键必须是互不相同的。一对大括号 {} 创建一个空字典。初始化字典时,在大括号内放置一组逗号分隔的键:值对,这也是字典输出的方式。我们使用键来检索存储在字典中的数据。

    >>> data = {'kushal':'Fedora', 'kart_':'Debian', 'Jace':'Mac'}
    >>> data
    {'kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian'}
    >>> data['kart_']
    'Debian'
    

    创建新的键值对很简单:

    >>> data['parthan'] = 'Ubuntu'
    >>> data
    {'kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'}
    

    使用 del 关键字删除任意指定的键值对:

    >>> del data['kushal']
    >>> data
    {'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'
    

    使用 in 关键字查询指定的键是否存在于字典中。

    >>> 'ShiYanLou' in data
    False
    

    必须知道的是,字典中的键必须是不可变类型,比如你不能使用列表作为键。

    dict() 可以从包含键值对的元组中创建字典。

    >>> dict((('Indian','Delhi'),('Bangladesh','Dhaka')))
    {'Indian': 'Delhi', 'Bangladesh': 'Dhaka'}
    

    如果你想要遍历一个字典,使用字典的 items() 方法。

    >>> data
    {'Kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'}
    >>> for x, y in data.items():
    ...     print("{} uses {}".format(x, y))
    ...
    Kushal uses Fedora
    Jace uses Mac
    kart_ uses Debian
    parthan uses Ubuntu
    

    许多时候我们需要往字典中的元素添加数据,我们首先要判断这个元素是否存在,不存在则创建一个默认值。如果在循环里执行这个操作,每次迭代都需要判断一次,降低程序性能。

    我们可以使用 dict.setdefault(key, default) 更有效率的完成这个事情。

    >>> data = {}
    >>> data.setdefault('names', []).append('Ruby')
    >>> data
    {'names': ['Ruby']}
    >>> data.setdefault('names', []).append('Python')
    >>> data
    {'names': ['Ruby', 'Python']}
    >>> data.setdefault('names', []).append('C')
    >>> data
    {'names': ['Ruby', 'Python', 'C']}
    

    试图索引一个不存在的键将会抛出一个 keyError 错误。我们可以使用 dict.get(key, default) 来索引键,如果键不存在,那么返回指定的 default 值。

    >>> data['foo']
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    KeyError: 'foo'
    >>> data.get('foo', 0)
    0
    

    如果你想要在遍历列表(或任何序列类型)的同时获得元素索引值,你可以使用 enumerate()

    >>> for i, j in enumerate(['a', 'b', 'c']):
    ...     print(i, j)
    ...
    0 a
    1 b
    2 c
    

    你也许需要同时遍历两个序列类型,你可以使用 zip() 函数。

    >>> a = ['Pradeepto', 'Kushal']
    >>> b = ['OpenSUSE', 'Fedora']
    >>> for x, y in zip(a, b):
    ...     print("{} uses {}".format(x, y))
    ...
    Pradeepto uses OpenSUSE
    Kushal uses Fedora
    

    5. 程序示例

    5.1. students.py

    这是一个判断学生成绩是否达标的程序,要求输入学生数量,以及各个学生物理、数学、历史三科的成绩,如果总成绩小于 120,程序打印 “failed”,否则打印 “passed”。

    #!/usr/bin/env python3
    n = int(input("Enter the number of students: "))
    data = {} # 用来存储数据的字典变量
    Subjects = ('Physics', 'Maths', 'History') # 所有科目
    for i in range(0, n):
        name = input('Enter the name of the student {}: '.format(i + 1)) # 获得学生名称
        marks = []
        for x in Subjects:
            marks.append(int(input('Enter marks of {}: '.format(x)))) # 获得每一科的分数
        data[name] = marks
    for x, y in data.items():
        total =  sum(y)
        print("{}'s total marks {}".format(x, total))
        if total < 120:
            print(x, "failed :(")
        else:
            print(x, "passed :)")
    

    运行如下:

    此处输入图片的描述

    5.2. matrixmul.py

    这个例子里我们计算两个矩阵的乘积。要求输入矩阵的行/列数(在这里假设我们使用的是 n × n 的矩阵)。

    #!/usr/bin/env python3
    n = int(input("Enter the value of n: "))
    print("Enter values for the Matrix A")
    a = []
    for i in range(n):
        a.append([int(x) for x in input().split()])
    print("Enter values for the Matrix B")
    b = []
    for i in range(n):
        b.append([int(x) for x in input().split()])
    c = []
    for i in range(n):
        c.append([a[i][j] * b[j][i] for j in range(n)])
    print("After matrix multiplication")
    print("-" * 7 * n)
    for x in c:
        for y in x:
            print(str(y).rjust(5), end=' ')
        print()
    print("-" * 7 * n)
    

    运行如下:

    此处输入图片的描述

    这里我们使用了几次列表推导式。[int(x) for x in input().split()] 首先通过 input() 获得用户输入的字符串,再使用 split() 分割字符串得到一系列的数字字符串,然后用 int() 从每个数字字符串创建对应的整数值。我们也使用了 [a[i][j] * b[j][i] for j in range(n)] 来得到矩阵乘积的每一行数据。

    总结

    本实验了解了 Python 内置的几种常用数据结构,在写程序的过程中,不同的场景应当选取合适的数据结构。

    一般来说,目前我们见到的数据结构已经够用了,不过 Python 中还有一些其它有用的数据结构,可以在这里了解:https://docs.python.org/3/library/datatypes.html

  • 相关阅读:
    ASP.NET MVC 5
    Web Components是不是Web的未来
    如何选择高性价比的控件产品
    ASP.NET MVC 5
    ubuntu系统安装
    Ubuntu linux安装完成后隐藏linux磁盘挂载点
    win10 查看本机的激活秘钥
    windows cmd下列出当前目录下的所有文件
    error LNK2005: “找到一个或多个多重定义的符号” 已经在 xxxx.obj 中定义 的解决方法
    架构设计:负载均衡层设计方案(3)——Nginx进阶
  • 原文地址:https://www.cnblogs.com/mrchige/p/6375513.html
Copyright © 2011-2022 走看看