Python3简明教程（六）—— 数据结构

zoukankan html css js c++ java

Python3简明教程（六）—— 数据结构
简单的来说，数据结构（data structure）是计算机中存储、组织数据的方式。比如我们之前使用过的列表就是一种数据结构，在这里我们还会深入学习它。之前也有简单的介绍。

列表
>>> a = [23, 45, 1, -3434, 43624356, 234] >>> a.append(45) >>> a [23, 45, 1, -3434, 43624356, 234, 45]
首先我们建立了一个列表 a。然后调用列表的方法 a.append(45) 添加元素 45 到列表末尾。你可以看到元素 45 已经添加到列表的末端了。有些时候我们需要将数据插入到列表的任何位置，这时我们可以使用列表的 insert() 方法。
>>> a.insert(0, 1) # 在列表索引 0 位置添加元素 1 >>> a [1, 23, 45, 1, -3434, 43624356, 234, 45] >>> a.insert(0, 111) # 在列表索引 0 位置添加元素 111 >>> a [111, 1, 23, 45, 1, -3434, 43624356, 234, 45]
具体来说是，插入位置后元素后移，这样保证了插入后新添加元素就是索引的位置。

列表方法 count(s) 会返回列表元素中 s 的数量。我们来检查一下 45 这个元素在列表中出现了多少次。
>>> a.count(45) 2
如果你想要在列表中移除任意指定值，你需要使用 remove() 方法。
>>> a.remove(234) >>> a [111, 1, 23, 45, 1, -3434, 43624356, 45]
现在我们反转整个列表。
>>> a.reverse() >>> a [45, 43624356, -3434, 1, 45, 23, 1, 111]
怎样将一个列表的所有元素添加到另一个列表的末尾呢，可以使用列表的 extend() 方法。(这还有一种简单的方法，直接用“+”连接)
>>> b = [45, 56, 90] >>> a.extend(b) # 添加 b 的元素而不是 b 本身 >>> a [45, 43624356, -3434, 1, 45, 23, 1, 111, 45, 56, 90]
给列表排序，我们使用列表的 sort() 方法，排序的前提是列表的元素是可比较的。
>>> a.sort() >>> a [-3434, 1, 1, 23, 45, 45, 45, 56, 90, 111, 43624356]
你也能使用 del 关键字删除指定位置的列表元素。
>>> del a[-1] >>> a [-3434, 1, 1, 23, 45, 45, 45, 56, 90, 111]
将列表用作栈和队列

栈是我们通常所说的一种 LIFO （Last In First Out 后进先出）数据结构。它的意思是最后进入的数据第一个出来。一个最简单的例子往一端封闭的管道放入一些弹珠然后取出来，如果你想把弹珠取出来，你必须从你最后放入弹珠的位置挨个拿出来。用代码实现此原理：
>>> a = [1, 2, 3, 4, 5, 6] >>> a [1, 2, 3, 4, 5, 6] >>> a.pop() 6 >>> a.pop() 5 >>> a.pop() 4 >>> a.pop() 3 >>> a [1, 2] >>> a.append(34) >>> a
上面的代码中我们使用了一个新方法 pop()。传入一个参数 i 即 pop(i) 会将第 i 个元素弹出。请注意，没有push()函数，因为append()函数就能实现了。

在我们的日常生活中会经常遇到队列，比如售票窗口、图书馆、超市的结账出口。队列是一种在末尾追加数据以及在开始弹出数据的数据结构。与栈不同，它是 FIFO （First In First Out 先进先出）的数据结构。
>>> a = [1, 2, 3, 4, 5] >>> a.append(1) >>> a [1, 2, 3, 4, 5, 1] >>> a.pop(0) 1 >>> a.pop(0) 2 >>> a [3, 4, 5, 1]
我们使用 a.pop(0) 弹出列表中第一个元素。可见栈和队列在代码实现上没有多大区别，只是出队一个从队首，一个从队尾。

列表推导式

列表推导式为从序列中创建列表提供了一个简单的方法。

如果没有列表推导式，一般都是这样创建列表的：通过将一些操作应用于序列的每个成员并通过返回的元素创建列表，或者通过满足特定条件的元素创建子序列。
>>> squares = [] >>> for x in range(10): ... squares.append(x**2) ... >>> squares [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
注意这个 for 循环中的被创建（或被重写）的名为 x 的变量在循环完毕后依然存在。

使用如下方法，我们可以计算 squares 的值而不会产生任何的副作用：
squares = list(map(lambda x: x**2, range(10)))
等价于下面的列表推导式。
squares = [x**2 for x in range(10)]
上面这个方法更加简明且易读。

列表推导式由包含一个表达式的中括号组成，表达式后面跟随一个 for 子句，之后可以有零或多个 for 或 if 子句。结果是一个列表，由表达式依据其后面的 for 和 if 子句上下文计算而来的结果构成。

例如，如下的列表推导式结合两个列表的元素，且元素之间不相等：
>>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y] [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
等同于：
>>> combs = [] >>> for x in [1,2,3]: ... for y in [3,1,4]: ... if x != y: ... combs.append((x, y)) ... >>> combs [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
值得注意的是在上面两个方法中的 for 和 if 语句的顺序。

列表推导式也可以嵌套。
>>> a=[1,2,3] >>> z = [x + 1 for x in [x ** 2 for x in a]] >>> z [2, 5, 10]
元组

元组是由数个逗号分割的值组成，一般用小括号括起来，也可以省略。
>>> a = 'Fedora', 'ShiYanLou', 'Kubuntu', 'Pardus' >>> a ('Fedora', 'ShiYanLou', 'Kubuntu', 'Pardus') >>> a[1] 'ShiYanLou' >>> for x in a: ... print(x, end=' ') ... Fedora ShiYanLou Kubuntu Pardus
你可以对任何一个元组执行拆封操作并赋值给多个变量，就像下面这样：
>>> divmod(15,2) (7, 1) >>> x, y = divmod(15,2) >>> x 7 >>> y 1
元组是不可变类型，这意味着你不能在元组内删除或添加或编辑任何值。如果你尝试这些操作，将会出错：
>>> a = (1, 2, 3, 4) >>> del a[0] Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'tuple' object doesn't support item deletion >>> a.append(2) Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'tuple' object has no attribute 'append'
要创建只含有一个元素的元组，在值后面跟一个逗号。
>>> a = (123) >>> a 123 >>> type(a) <class 'int'> >>> a = (123, ) >>> b = 321, >>> a (123,) >>> b (321,) >>> type(a) <class 'tuple'> >>> type(b) <class 'tuple'>
通过内建函数 type() 你可以知道任意变量的数据类型。还记得我们使用 len() 函数来查询任意序列类型数据的长度吗？
>>> type(len) <class 'builtin_function_or_method'> >>> type(print) <class 'builtin_function_or_method'>
集合

集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。集合对象还支持 union（联合），intersection（交），difference（差）和 symmetric difference（对称差集）等数学运算。

大括号或 set() 函数可以用来创建集合。注意：想要创建空集合，你必须使用 set() 而不是 {}。后者用于创建空字典，我们在下一节中介绍的一种数据结构。

下面是集合的常见操作：
>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'} >>> print(basket) # 你可以看到重复的元素被去除 {'orange', 'banana', 'pear', 'apple'} >>> 'orange' in basket True >>> 'crabgrass' in basket False >>> # 演示对两个单词中的字母进行集合操作 ... >>> a = set('abracadabra') >>> b = set('alacazam') >>> a # a 去重后的字母 {'a', 'r', 'b', 'c', 'd'} >>> a - b # a 有而 b 没有的字母 {'r', 'd', 'b'} >>> a | b # 存在于 a 或 b 的字母 {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'} >>> a & b # a 和 b 都有的字母 {'a', 'c'} >>> a ^ b # 存在于 a 或 b 但不同时存在的字母 {'r', 'd', 'b', 'm', 'z', 'l'}
从集合中添加或弹出元素：
>>> a = {'a','e','h','g'} >>> a.pop() 'h' >>> a.add('c') >>> a {'c', 'e', 'g', 'a'}
字典

字典是是无序的键值对（key:value）集合，同一个字典内的键必须是互不相同的。一对大括号 {} 创建一个空字典。初始化字典时，在大括号内放置一组逗号分隔的键：值对，这也是字典输出的方式。我们使用键来检索存储在字典中的数据。
>>> data = {'kushal':'Fedora', 'kart_':'Debian', 'Jace':'Mac'} >>> data {'kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian'} >>> data['kart_'] 'Debian'
创建新的键值对很简单：
>>> data['parthan'] = 'Ubuntu' >>> data {'kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'}
使用 del 关键字删除任意指定的键值对：
>>> del data['kushal'] >>> data {'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'
使用 in 关键字查询指定的键是否存在于字典中：
>>> 'ShiYanLou' in data False
dict() 可以从包含键值对的元组中创建字典：
>>> dict((('Indian','Delhi'),('Bangladesh','Dhaka'))) {'Indian': 'Delhi', 'Bangladesh': 'Dhaka'}
如果你想要遍历一个字典，使用字典的 items() 方法：
>>> data {'Kushal': 'Fedora', 'Jace': 'Mac', 'kart_': 'Debian', 'parthan': 'Ubuntu'} >>> for x, y in data.items(): ... print("{} uses {}".format(x, y)) ... Kushal uses Fedora Jace uses Mac kart_ uses Debian parthan uses Ubuntu
许多时候我们需要往字典中的元素添加数据，我们首先要判断这个元素是否存在，不存在则创建一个默认值。如果在循环里执行这个操作，每次迭代都需要判断一次，降低程序性能。

我们可以使用 dict.setdefault(key, default) 更有效率的完成这个事情：
>>> data = {} >>> data.setdefault('names', []).append('Ruby') >>> data {'names': ['Ruby']} >>> data.setdefault('names', []).append('Python') >>> data {'names': ['Ruby', 'Python']} >>> data.setdefault('names', []).append('C') >>> data {'names': ['Ruby', 'Python', 'C']}
试图索引一个不存在的键将会抛出一个 keyError 错误。我们可以使用 dict.get(key, default) 来索引键，如果键不存在，那么返回指定的 default 值：
>>> data['foo'] Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'foo' >>> data.get('foo', 0) 0
如果你想要在遍历列表（或任何序列类型）的同时获得元素索引值，你可以使用 enumerate()。
>>> for i, j in enumerate(['a', 'b', 'c']): ... print(i, j) ... 0 a 1 b 2 c
你也许需要同时遍历两个序列类型，你可以使用 zip() 函数。请注意，与写成二重循环是不同的。
>>> a = ['Pradeepto', 'Kushal'] >>> b = ['OpenSUSE', 'Fedora'] >>> for x, y in zip(a, b): ... print("{} uses {}".format(x, y)) ... Pradeepto uses OpenSUSE Kushal uses Fedora
综合示例

这个例子里我们计算两个矩阵的 Hadamard 乘积。要求输入矩阵的行/列数（在这里假设我们使用的是 n × n 的矩阵）。
#!/usr/bin/env python3 n = int(input("Enter the value of n: ")) print("Enter values for the Matrix A") a = [] for i in range(n): a.append([int(x) for x in input().split()]) print("Enter values for the Matrix B") b = [] for i in range(n): b.append([int(x) for x in input().split()]) c = [] for i in range(n): c.append([a[i][j] * b[i][j] for j in range(n)]) print("After matrix multiplication") print("-" * 7 * n) for x in c: for y in x: print(str(y).rjust(5), end=' ') print() print("-" * 7 * n)
这里我们使用了几次列表推导式。[int(x) for x in input().split()] 首先通过 input() 获得用户输入的字符串，再使用 split()分割字符串得到一系列的数字字符串，然后用 int() 从每个数字字符串创建对应的整数值。我们也使用了 [a[i][j] * b[i][j] for j in range(n)] 来得到矩阵乘积的每一行数据。

一般来说，目前我们见到的数据结构已经够用了，不过 Python 中还有一些其它有用的数据结构，可以在这里了解：https://docs.python.org/3/library/datatypes.html。

参考链接：https://www.shiyanlou.com/courses/596
查看全文

相关阅读:
Linux ALSA音频库(一) 交叉编译详细说明
 在KEIL下查看单片机编程内存使用情况
 Linux Socket
QT报错随手记
 Cortex-M3双堆栈MSP和PSP+函数栈帧
 Linux命令
 cdev_alloc与cdev_init区别
 一些编译报错
 SFUD+FAL+EasyFlash典型场景需求分析，并记一次实操记录
 RTThread DFS文件系统使用: 基于使用SFUD驱动的SPI FLASH之上的ELM FATFS文件系统

原文地址：https://www.cnblogs.com/lfri/p/10371351.html

Python3简明教程（六）—— 数据结构

列表

将列表用作栈和队列

列表推导式

元组

集合

字典

综合示例