说明:
本文主要使用python实现常见的排序与搜索算法:冒泡排序、选择排序、插入排序、希尔排序、快速排序、归并排序以及二分查找等。
对算法的基本思想作简要说明,只要理解了基本的思想,与实现语言无关。
本文主要参考网络文章,仅供学习。
开发环境:Python3.5
一、冒泡排序
冒泡排序(Bubble Sort)算是一种比较常见的排序算法,重复遍历要排序的数列,一次比较相邻的两个元素,如果顺序错误即互相交换位置,遍历直到无需再交换,则此时数列已经排序完成。此算法名字由来:因为越小的元素(升序)经由交换慢慢 “浮”到数列的顶端。
1、冒泡排序的基本思想(运作原理):
· 比较相邻的元素,如果第一个比第二个大(升序),就交换它们两个。
· 对每一对相邻的元素作同样的工作,从开始第一对到结尾最后一对,这一步做完后,最后的元素会是最大的数。
· 针对所有的元素重复以上的步骤,除了最后一个(倒数第二个与其已作比较)。
· 持续每次对越来越少的元素重复上面的步骤,知道没有任何一对数字需要比较。
交换过程示意图(第一次)(来自网络):
2、python实现过程:
这里提供两种实现过程,第二个实现过程为上面示意图所示。
1 # coding=utf-8 2 3 4 def bubble_sort(ls): 5 """冒泡排序""" 6 print("before: ", ls) 7 for i in range(0, len(ls) - 1): 8 # i = [0, 1, ...., len(ls) - 2],每次比较的第一个数的下标 9 # j = [i + 1, i + 2, ..., len(ls) - 1],每次比较的第二个数的下标 10 for j in range(i + 1, len(ls)): 11 if ls[i] > ls[j]: 12 ls[i], ls[j] = ls[j], ls[i] 13 print(ls) 14 print("after: ", ls) 15 16 17 def bubble_sort2(ls): 18 """冒泡排序""" 19 print("before:", ls) 20 for j in range(len(ls) - 1, 0, -1): 21 # j = [len(ls) - 1, len(ls) - 2, ..., 1], 每次需要比较的次数 22 # i = [0, 1, 2, ..., j - 1],需要比较的下标 23 for i in range(j): 24 if ls[i] > ls[i + 1]: 25 ls[i], ls[i + 1] = ls[i + 1], ls[i] 26 print(ls) 27 print("after:", ls) 28 29 30 if __name__ == "__main__": 31 ls1 = [54, 26, 93, 17, 77, 31, 44, 55, 20] 32 ls2 = [54, 26, 93, 17, 77, 31, 44, 55, 20] 33 34 bubble_sort(ls1) 35 print("-"*50) 36 bubble_sort2(ls2)
执行结果(分割线上为 bubble_sort1() 的执行结果,分割线下为 bubble_sort2() 的执行结果):
3、时间复杂度:
最优时间复杂度:O(n)(表示遍历一次发现没有任何可以交换的元素排序结束,在内循环可以做一个标识判断,如果首次循环没有任何交换,则跳出)
最坏复杂度:O(n2)
稳定性:稳定
二、选择排序
选择排序( Selection Sort )是一种简单直观的排序算法,基本原理:首先在未排序中找到最小(大)的元素,存放在排序序列的起始位置,然后在从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序的末尾,一次类推,直到所有元素均排序完毕。
选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上,则它不会被移动。选择排序每次交换一对元素,它们当中至少有一个呗移到其最终位置上,因此对 n 个元素的表进行排序共进行至多 n - 1次交换。在所有完成依靠交换去移动元素的排序方法中,选择排序属于非常好的一种。
1、排序过程,图示(图来源网络):
假设右边为已排序,然后从左边未排序中选择一个最大值,放到右边来。
2、python实现过程:
这里代码的思想为:假设左边为已排序,右边为排序。
1 # coding=utf-8 2 3 4 def selection_sort(ls): 5 """选择排序""" 6 # 假设左边为已排序,右边为未排序 7 8 print("before:", ls) 9 for i in range(0, len(ls) - 1): 10 # i = [0, 1, 2,,, len(ls) - 2] 11 # j = [i + 1, i + 2,,, len(ls) - 1] 12 min_index = i 13 for j in range(i + 1, len(ls)): 14 if ls[j] < ls[min_index]: 15 min_index = j 16 17 if min_index != i: 18 ls[min_index], ls[i] = ls[i], ls[min_index] 19 print(ls) 20 print("after:", ls) 21 22 23 if __name__ == "__main__": 24 ls = [54, 26, 93, 17, 77, 31, 44, 55, 20] 25 26 selection_sort(ls)
3、时间复杂度:
最优时间复杂度:O(n2)
最坏时间复杂度:O(n2)
稳定性:不稳定(考虑升序每次选择最大的情况)
三、插入排序
插入排序(Insert ion Sort),其工作原理:通过构建有序序列,对于未排序数据中从后向前扫描,找到相应位置并插入。插入排序在实现上,在从后面向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
1、排序过程,图示意(图片来自网络):
2、python实现过程:
从小标为 1 开始,往 0 遍历,比较交换。
1 # coding=utf-8 2 3 4 def insert_sort(ls): 5 """插入排序""" 6 # 假设左边已排序,右边为未排序,每次从右边取一个数,遍历已排序的子序列,直到找到次数的位置。 7 print("before: ", ls) 8 for j in range(1, len(ls)): 9 for i in range(j, 0, - 1): 10 if ls[i] < ls[i - 1]: 11 ls[i], ls[i - 1] = ls[i - 1], ls[i] 12 print(ls) 13 print("after: ", ls) 14 15 16 if __name__ == "__main__": 17 ls = [54, 26, 93, 17, 77, 31, 44, 55, 20] 18 19 insert_sort(ls)
执行结果:
3、时间复杂度:
最优时间复杂度:O(n)(升序序列,序列已经处于升序状态)
最坏时间复杂度:O(n2)
稳定性:稳定
四、希尔排序
希尔排序(Shell Sort)是插入排序的一种。也称为增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是把纪录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个序列恰被分成一组,算法便终止。
1、希尔排序过程:
基本思想:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表识为了更好理解这算法,算法本身还是使用数组进行排序。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中进行更好的描述算法,这样它们就应该看起来是这样(竖着的元素是步长组成):
最后以 1 步长进行排序(此时就是简单的插入排序)
2、python实现过程:
实现过程基本和插入排序类似,只是插入排序的 step 固定为 1,而希尔排序的 step 会变化直至 为 1。
1 # coding=utf-8 2 3 4 def shell_sort(ls): 5 """希尔排序""" 6 print("before: ", ls) 7 8 step = len(ls) // 2 # 初始步长 9 10 while step > 0: 11 # 插入排序 12 for j in range(step, len(ls)): 13 for i in range(j, 0, - step): 14 if ls[i] < ls[i - step]: 15 ls[i], ls[i - step] = ls[i - step], ls[i] 16 step //= 2 17 print(ls) 18 print("shell_sort :", ls) 19 20 21 if __name__ == "__main__": 22 ls = [54, 26, 93, 17, 77, 31, 44, 55, 20] 23 24 shell_sort(ls)
执行结果:
3、时间复杂度:
最优时间复杂度:根据步长序列的不同而不同。
最坏时间复杂度:O(n2)。
稳定性:不稳定。
五、快速排序
快速排序(Quick Sort),又称为划分交换排序(Partition-exchange Sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要笑,然后在按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
1、快速排序过程:
① 从数列中选出一个元素,称为“基准”(pivot)。
② 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准大的摆在基准的后面(相同的数,可以放到任意一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
③ 递归(recursive)把小于基准值元素子数列和大于基准值元素的子数列排序。
递归的的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。
2、python实现过程:
这里提供两种快速排序的方式,基本思想一样,第一种是在原有列表进行操作(通过游标进行),第二种则是新建左右子列表进行存储。
1 # coding=utf-8 2 3 4 def quick_sort1(ls, start, end): 5 """ 6 快速排序-1 7 low 和 high 分别指向序列的头和尾 8 low += 1, high -= 1 9 在low自增过程中,直到找到大于 mid_val 的下标 10 在high自增减过程中,直到找到小于 mid_val 的小标 11 然后将这两个值交换 12 """ 13 14 # 递归退出条件 15 if start >= end: 16 return 17 18 low = start 19 high = end 20 mid_val = ls[low] 21 22 while low < high: 23 while low < high and ls[high] > mid_val: 24 high -= 1 25 ls[low] = ls[high] 26 27 while low < high and ls[low] < mid_val: 28 low += 1 29 ls[high] = ls[low] 30 31 ls[low] = mid_val 32 33 print("mid:", mid_val, ls) 34 35 quick_sort1(ls, start, low - 1) # 左边的子序列 36 quick_sort1(ls, low + 1, end) # 右边的子序列 37 38 return ls 39 40 41 def quick_sort2(ls): 42 """快速排序-2""" 43 44 # 递归退出条件 45 if len(ls) <= 1: 46 return ls 47 48 left_ls, right_ls = [],[] 49 mid_val = ls[0] 50 for i in range(1, len(ls)): 51 if ls[i] < mid_val: 52 left_ls.append(ls[i]) 53 else: 54 right_ls.append(ls[i]) 55 56 print(left_ls, mid_val, right_ls) 57 58 # 递归调用,左右子列表 59 left_res = quick_sort2(left_ls) 60 right_res = quick_sort2(right_ls) 61 62 return left_res + [mid_val] + right_res 63 64 65 66 if __name__ == "__main__": 67 ls1 = [54, 26, 93, 17, 77, 31, 44, 55, 20] 68 ls2 = [54, 26, 93, 17, 77, 31, 44, 55, 20] 69 70 print("before:", ls1) 71 res1 = quick_sort1(ls1, 0, len(ls1) - 1) 72 print("quick sort1: ", res1) 73 74 print("-"*50) 75 print("before: ", ls2) 76 res2 = quick_sort2(ls2) 77 print("quick sort2:", res2)
执行结果:
3、时间复杂度:
最优时间复杂度:O(nlogn)
最坏时间复杂度:O(n2)
稳定性:不稳定
六、归并排序
归并排序是采用分治法的一种非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。
将数组分解最小之后,然后合并两个有序数组,基本思路:比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直到一个数组为空,最后把另外一个数组的剩余部分复制过来即可。
1、归并排序过程,图示:
2、python实现过程:
先把序列拆分成 left_ls 和 right_ls ,然后再合并成一个res。
1 # coding=utf-8 2 3 4 def merge_sort(ls): 5 """归并排序""" 6 n = len(ls) 7 8 # 递归退出条件 9 if n <= 1: 10 return ls 11 12 mid = n // 2 13 14 # 1、拆分子序列 15 left_ls = merge_sort(ls[:mid]) 16 right_ls = merge_sort(ls[mid:]) 17 18 # 2、合并子序列:left_ls 和 right_ls 19 left_point, right_point = 0, 0 20 res = [] 21 22 # 当left_ls或者right_ls 结束,就会退出 while,而另外一个则可能未结束,所有后面需要 res += 23 while left_point < len(left_ls) and right_point < len(right_ls): 24 # 比较两个子序列,小的先加入到 res[] 25 if left_ls[left_point] < right_ls[right_point]: 26 res.append(left_ls[left_point]) 27 left_point += 1 28 else: 29 res.append(right_ls[right_point]) 30 right_point += 1 31 print("res:", res) 32 33 res += left_ls[left_point:] 34 res += right_ls[right_point:] 35 36 return res 37 38 39 if __name__ == "__main__": 40 ls = [54, 26, 93, 17, 77, 31, 44, 55, 20] 41 42 print("before: ", ls) 43 res = merge_sort(ls) 44 print("merge sort: ", res)
执行结果:
3、时间复杂度:
最优时间复杂度:O(nlogn)
最坏时间复杂度:O(nlogn)
稳定性:稳定
七、二分查找
二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好,其缺点是要求待查找表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。
基本思想:假设表中元素是按升序排序,将表中间位置记录关键字与查找关键字比较,如果两者相等,则查找成功,否则利用中间位置记录分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一个子表。重复以上过程,知道找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
1、二分查找过程,图示(图片来源网络):
2、python实现过程:
这里主要两种实现方式,一种递归,另一种非递归。
1 # coding=utf-8 2 3 4 def binary_search_recursion(ls, item): 5 """二分查找---递归""" 6 n = len(ls) 7 if n < 1: 8 return False 9 10 mid = n // 2 11 12 # 与中间值比较 13 if item == ls[mid]: 14 return True 15 16 # 去左边子序列查找 17 elif item < ls[mid]: 18 return binary_search_recursion(ls[:mid], item) 19 20 # 去右边子序列查找 21 else: 22 return binary_search_recursion(ls[mid + 1:], item) 23 24 25 def binary_search(ls, item): 26 """二分查找---非递归""" 27 n = len(ls) 28 start = 0 29 end = n - 1 30 31 while start <= end: 32 mid = (start + end) // 2 33 34 if item == ls[mid]: 35 return True 36 elif item < ls[mid]: 37 end = mid - 1 38 else: 39 start = mid + 1 40 return False 41 42 43 if __name__ == "__main__": 44 ls = [17, 20, 26, 31, 44, 54, 55, 77, 93] 45 46 num = int(input("请输入一个整数:")) 47 res = binary_search(ls, num) 48 print("查找结果:", res)
八、完整代码
1 # coding=utf-8 2 3 4 def bubble_sort(ls): 5 """冒泡排序""" 6 print("before: ", ls) 7 for i in range(0, len(ls) - 1): 8 # i = [0, 1, ...., len(ls) - 2],每次比较的第一个数的下标 9 # j = [i + 1, i + 2, ..., len(ls) - 1],每次比较的第二个数的下标 10 for j in range(i + 1, len(ls)): 11 if ls[i] > ls[j]: 12 ls[i], ls[j] = ls[j], ls[i] 13 print(ls) 14 print("after: ", ls) 15 16 17 def bubble_sort2(ls): 18 """冒泡排序""" 19 print("before:", ls) 20 for j in range(len(ls) - 1, 0, -1): 21 # j = [len(ls) - 1, len(ls) - 2, ..., 1], 每次需要比较的次数 22 # i = [0, 1, 2, ..., j - 1],需要比较的下标 23 for i in range(j): 24 if ls[i] > ls[i + 1]: 25 ls[i], ls[i + 1] = ls[i + 1], ls[i] 26 print(ls) 27 print("after:", ls) 28 29 30 def selection_sort(ls): 31 """选择排序""" 32 # 假设左边为已排序,右边为未排序 33 34 print("before:", ls) 35 for i in range(0, len(ls) - 1): 36 # i = [0, 1, 2,,, len(ls) - 2] 37 # j = [i + 1, i + 2,,, len(ls) - 1] 38 min_index = i 39 for j in range(i + 1, len(ls)): 40 if ls[j] < ls[min_index]: 41 min_index = j 42 43 if min_index != i: 44 ls[min_index], ls[i] = ls[i], ls[min_index] 45 print(ls) 46 print("after:", ls) 47 48 49 def insert_sort(ls): 50 """插入排序""" 51 # 假设左边已排序,右边为未排序,每次从右边取一个数,遍历已排序的子序列,直到找到次数的位置。 52 print("before: ", ls) 53 for j in range(1, len(ls)): 54 for i in range(j, 0, - 1): 55 if ls[i] < ls[i - 1]: 56 ls[i], ls[i - 1] = ls[i - 1], ls[i] 57 print(ls) 58 print("after: ", ls) 59 60 61 def shell_sort(ls): 62 """希尔排序""" 63 print("before: ", ls) 64 65 step = len(ls) // 2 # 初始步长 66 67 while step > 0: 68 # 插入排序 69 for j in range(step, len(ls)): 70 for i in range(j, 0, - step): 71 if ls[i] < ls[i - step]: 72 ls[i], ls[i - step] = ls[i - step], ls[i] 73 step //= 2 74 print(ls) 75 print("shell_sort :", ls) 76 77 78 def quick_sort1(ls, start, end): 79 """ 80 快速排序-1 81 low 和 high 分别指向序列的头和尾 82 low += 1, high -= 1 83 在low自增过程中,直到找到大于 mid_val 的下标 84 在high自增减过程中,直到找到小于 mid_val 的小标 85 然后将这两个值交换 86 """ 87 88 # 递归退出条件 89 if start >= end: 90 return 91 92 low = start 93 high = end 94 mid_val = ls[low] 95 96 while low < high: 97 while low < high and ls[high] > mid_val: 98 high -= 1 99 ls[low] = ls[high] 100 101 while low < high and ls[low] < mid_val: 102 low += 1 103 ls[high] = ls[low] 104 105 ls[low] = mid_val 106 107 print("mid:", mid_val, ls) 108 109 quick_sort1(ls, start, low - 1) # 左边的子序列 110 quick_sort1(ls, low + 1, end) # 右边的子序列 111 112 return ls 113 114 115 def quick_sort2(ls): 116 """快速排序-2""" 117 118 # 递归退出条件 119 if len(ls) <= 1: 120 return ls 121 122 left_ls, right_ls = [],[] 123 mid_val = ls[0] 124 for i in range(1, len(ls)): 125 if ls[i] < mid_val: 126 left_ls.append(ls[i]) 127 else: 128 right_ls.append(ls[i]) 129 130 print(left_ls, mid_val, right_ls) 131 132 # 递归调用,左右子列表 133 left_res = quick_sort2(left_ls) 134 right_res = quick_sort2(right_ls) 135 136 return left_res + [mid_val] + right_res 137 138 139 def merge_sort(ls): 140 """归并排序""" 141 n = len(ls) 142 143 # 递归退出条件 144 if n <= 1: 145 return ls 146 147 mid = n // 2 148 149 # 1、拆分子序列 150 left_ls = merge_sort(ls[:mid]) 151 right_ls = merge_sort(ls[mid:]) 152 153 # 2、合并子序列:left_ls 和 right_ls 154 left_point, right_point = 0, 0 155 res = [] 156 157 # 当left_ls或者right_ls 结束,就会退出 while,而另外一个则可能未结束,所有后面需要 res += 158 while left_point < len(left_ls) and right_point < len(right_ls): 159 # 比较两个子序列,小的先加入到 res[] 160 if left_ls[left_point] < right_ls[right_point]: 161 res.append(left_ls[left_point]) 162 left_point += 1 163 else: 164 res.append(right_ls[right_point]) 165 right_point += 1 166 print("res:", res) 167 168 res += left_ls[left_point:] 169 res += right_ls[right_point:] 170 171 return res 172 173 174 def binary_search_recursion(ls, item): 175 """二分查找---递归""" 176 n = len(ls) 177 if n < 1: 178 return False 179 180 mid = n // 2 181 182 # 与中间值比较 183 if item == ls[mid]: 184 return True 185 186 # 去左边子序列查找 187 elif item < ls[mid]: 188 return binary_search_recursion(ls[:mid], item) 189 190 # 去右边子序列查找 191 else: 192 return binary_search_recursion(ls[mid + 1:], item) 193 194 195 def binary_search(ls, item): 196 """二分查找---非递归""" 197 n = len(ls) 198 start = 0 199 end = n - 1 200 201 while start <= end: 202 mid = (start + end) // 2 203 204 if item == ls[mid]: 205 return True 206 elif item < ls[mid]: 207 end = mid - 1 208 else: 209 start = mid + 1 210 return False