数据结构与算法 Python语言描述笔记

zoukankan html css js c++ java

数据结构与算法 Python语言描述笔记
数据结构

线性表包括顺序表和链表，python的list是顺序表，链表一般在动态语言中不会使用。不过链表还是会出现在各种算法题中。

链表 link list
- 单链表
  
  逆转链表： leetcode 206
- 双链表
- 循环单链表
字符串 string

有一个重要的点就是字符串的匹配问题，其中比较重要的是无回溯匹配算法(KMP算法)，算法比较复杂，重要的思想在于匹配过程中不回溯。实际复杂度是O(m+n), m和n分别是匹配模式串和目标串，一般m<<n。
- 通配符 *和?
  
  * 匹配任意一个字符串
  
  ？匹配任意一个字符
- 正则表达式：内容很多，这里就不讲了
  
  原始字符串：在字符串前面加r前缀,不作为转义符
栈 stack

队列 queue

python3有内置的实现模块

二叉树

基本概念：路径，长度，层数。都比较好理解。
root的层数为0。
二叉树的性质：
- 性质6.1：在非空二叉树第i层中最多有2^i个节点
- 性质6.2：高度为h的二叉树最多有2^(h+1)-1个节点
- 性质6.2：对于任何非空二叉树，如果其叶节点的个数为n0,度数为2的节点个数为n2,那么n0=n2+1
  满二叉树：所有分支节点的度数都是2
- 性质6.4: 满二叉树的叶节点比分支节点多一个
  扩充二叉树：把一个二叉树的所有节点变成度数为2的节点（就是这棵树长了一圈叶子），旧节点叫内部节点，新节点叫外部节点。
- 性质6.5：扩充二叉树的外部路径长度叫E, 内部路径长度叫I, n是内部节点数量， E=I+2*n
  完全二叉树：0-(h-1)层的节点都满，并且最后一层的节点都在左边。
- 性质6.6：完全二叉树节点数为n，则高度h=floor(log2n)
- 性质6.7：完全二叉树节点数为n, 并从0开始编号（按层次按左右）
  
  root的编号是0
  
  i的父节点是floor((i-1)/2)
  
  if 2i+1<n, 则其left child: 2i+1 else 无left child
  
  if 2i+2<n, 则其right chiild: 2i +2 else 无right child
  完全二叉树到线性结构有自然的双向映射
- 深度优先遍历 depth first traversal, depth first search, DFS
  
  先根序遍历DLR
  
  中根序遍历LDR
  
  后根序遍历LRD
- 宽度(广度)优先遍历, Breadth First Search, BFS：实现BFS一般要用到一个队列
先根序DFT
```
def preorder(t, proc):
    if not t:
        return None
    proc(t.val)
    preorder(t.left)
    preorder(t.right)
```
广度优先遍历 BFS
```
def levelorder(t, proc_):
    q = Queue()
    q.put(t)
    while not q.empty():
        n = q.get()
        if not n:
            continue
        q.put(n.left)
        q.put(n.right)
        proc_(n.val)
```
- 合并两个二叉树：leetcode 617
堆：一个完全二叉树，并且，任意一个节点存放的数据先于其子节点的数据

小顶堆大顶堆
堆和完全二叉树
- 堆+一个元素 ->完全二叉树
- 堆去掉root 生成两个堆
- 上面得到的两个堆+新的root -> 完全二叉树
- 堆去掉最后一个节点，还是堆
  堆可以用来构建优先队列(py3已经实现了)
  由堆实现的优先队列，创建的时间复杂度是O(n)，插入和弹出是O(logn)
  堆还可以用来排序
heap sort python实现
```
def heap_sort(nums_):
    def siftdown(nums_i, e, begin, end):
        i = begin
        j = begin*2+1
        while j < end:
            if j + 1 < end and nums_i[j+1] < nums_i[j]:
                j += 1
            if e < nums_i[j]:
                break
            nums_i[i] = nums_i[j]
            i = j
            j = 2*j+1
        nums_i[i] = e

    end = len(nums_)
    for k in range(end//2, -1, -1):
        siftdown(nums_, nums_[k], k, end)
    for k in range((end-1), 0, -1):
        e = nums_[k]
        nums_[k] = nums_[0]
        siftdown(nums_, e, 0, k)
    return nums_[::-1]
```
heap sort c++实现序列是数组
c++堆排序

排序算法 sort algorithm
- 内排序：在内存上排序
- 外排序
  归并是外排序的基础
  原地排序算法：空间复杂度为O(1)
稳定性
就是原序列里有一些Key一样的元素，排序之后能否保持不改变这部分序列的相对顺序。
比如key-value pair，按照key 排序：
(0, 100), (1, 50), (1, 60), (1, 45), (-2, 80)
希望排序之后(1, 50), (1, 60), (1, 45)这三个元素的相对位置不变。

适应性
如果一个排序算法对接近有序的序列工作的更快，就称这种算法具有适应性。

也就是说，如果本来已经快排序完了，还差一点，那么算法是能够利用这种优势迅速完成剩下的工作，还是推倒重来，按照原本既定的方法重新排序。

9.2 简单排序算法
- 插入排序：已经有一个排序完的序列，从剩余序列中顺序拿出一个跟前面的序列挨个比较，寻找合适的位置插入。用于链表不错
- 选择排序：
  
  简单选择排序：每次找到最小的元素放在最前面
  
  直接选择排序算法：把找到的最小元素和已排序序列后面的元素交换位置。是一个非常烂的算法。别用。
  
  堆排序：堆排序的问题是不稳定
- 交换排序
  
  冒泡排序
  
  交错排序：从左向右扫描一遍，从右向左再扫描一遍
9.3快速排序
查看全文

相关阅读:
杀死初创科技公司的四大工程陷阱
 杀死初创科技公司的四大工程陷阱
 Linux中su和sudo的用法整理
 Linux中su和sudo的用法整理
 Docket 使用命令
 Docker 部署 portainer
Linux 双网卡绑定
 docker安装部署，阿里源加速
 nmcli详解
 搭建LAMP环境示例

原文地址：https://www.cnblogs.com/theodoric008/p/7899523.html

数据结构与算法 Python语言描述 笔记

数据结构

链表 link list

字符串 string

栈 stack

队列 queue

二叉树

堆：一个完全二叉树，并且，任意一个节点存放的数据先于其子节点的数据

排序算法 sort algorithm

9.2 简单排序算法

9.3快速排序

数据结构与算法 Python语言描述笔记