归并排序 - 走看看

zoukankan html css js c++ java

归并排序
这次终于要开始学习跟生活昔昔相关的算法了，首先映入眼帘的是归并排序，对于什么是归并排序网上文章一大堆，这里再来明确一下，先来看一张原理图【下面会用程序来论证整个如图所示的递归合并过程】：

而看一下归并排序的文字描述，理论跟实践相结合：

对思路清楚之后，下面则具体实现一下，实现方法有两种：递归、非递归。具体如下：

递归方式实现归并排序[自顶向下]：

先编写基础框架：

上面先贴出具体实现，然后下面会基于实现一步步去分析其实现原理:
#include <iostream> //合并两个已经排好序的数组 void merge(int array[], int temp[], int left, int middle, int right) { int p_left = left, p_right = middle; int i = left; while(p_left < middle || p_right < right) { if(p_left >= middle) { temp[i] = array[p_right]; p_right++; } else if(p_right >= right) { temp[i] = array[p_left]; p_left++; } else if(array[p_left] > array[p_right]) { temp[i] = array[p_right]; p_right++; } else { temp[i] = array[p_left]; p_left++; } i++; } for (int i = left; i < right; ++i) { array[i] = temp[i]; } } //其中是一个[left, right)闭开区间 void merge_sort_recursive(int array[], int temp[], int left, int right) { if(right - left <= 1) return; int middle = (left + right) / 2; merge_sort_recursive(array, temp, left, middle); merge_sort_recursive(array, temp, middle, right); merge(array, temp, left, middle, right); } //递归实现归并 void merge_sort_recursive(int array[], int length) { int* temp = new int[length]; merge_sort_recursive(array, temp, 0, length); delete []temp; } int main(void) { int array[] = {10, 4, 6, 3, 8, 2, 5, 7}; merge_sort_recursive(array, 8); for (int i = 0; i < 8.; ++i) { std::cout << array[i] << " "; } std::cout << std::endl; return 0; }
编译运行:

是不是对上面的实现一头雾水，没关系，我也一头雾水，下面来剖析它，通过实现再去整理出实现原理，最终再彻底掌握它：

这里将数组{10, 4, 6, 3, 8, 2, 5, 7}通过递归实现归并达到排序的整个过程一步步展现出来，首先看下归并入口方法：

下面就按程序的三步骤来分析，完全按程序实现的逻辑顺序来：

①、int* temp = new int[length];

为啥要用一个跟数据长度一样长的临时变量呢？实际上就是用它进行数据排序的，将排好序的数据到时再同步到真正的数组中去，具体可以在分析流程②上可以看出来。

②、merge_sort_recursive(array, temp, 0, length);【核心】

接着它会调用另一个重载的方法：

其中传过来的参数left=0,right=8，其中需要特别注意的是是包含left，不包含right，是一个闭开区间。

　　a、

　　　　这是递归结束条件，也就是表示只剩一个元素了，具体可以在分析c、d步骤中去理解,很显然此时为false。

　　b、取出中间元素的位置，其中归并排序的思想就是以中间为分界，左边排好序，右边再排好序，最后再左右进行合并则达到归并排序的目的。这里取值是：middle=(0+8) / 2 = 4;
　　　　

　　c、对[left，middle)这个区间进行递归调用,也就是merge_sort_recursive(array, temp, 0, 4)：

　　　　

　　　　接下来具体来分析一下整个递归过程，还是按着merge_sort_recursive的四部步骤去分析：

　　　　ca、,right=4，left=0，right-left=4，不是小于1的，所以条件不成立，继续往下执行。

　　　　cb、，middle = (0 + 4) / 2 = 2;

　　　　cc、,merge_sort_recursive(array, temp, 0, 2)，可见又进行一个递归过程，继续分析：
　　　　　　

　　　　　　cca、,right=2, left=0, right-left=2，不是小于1，所以条件不成立，继续往下执行。

　　　　　　ccb、，middle = (0 + 2) / 2 = 1;

　　　　　　ccc、, merge_sort_recursive(array, temp, 0, 1)，继续递归
　　　　　　　　　　ccca、，right=1, left=0, right-left=1,条件刚好成立，于是乎整个方法都返回递归结束。

　　　　　　ccd、, merge_sort_recursive(array, temp, 1, 2)，继续递归

　　　　　　　　　　ccda、，right=2, left=1, right-left=1,条件刚好成立，递归结束。
　　　　　　这时数据调用的关系如下：
　　　　　　

　　　　　　cce、，merge(array, temp, 0, 1, 2),那这个merge方法调用完之后会是什么效果呢？下面具体分析一下流程：

　　　　　　　　
　　　　　　　　其中参数left=0, middle=1, right=2,下面具体分析：
　　　　　　　　ccea、,p_left=0, p_right=1

　　　　　　　　cceb、,i=0，这个变量是干嘛用的呢？其实它就是用来将排好序的一一加到temp临时数组，而每添加一个则累加一次，这个在下面步骤中可以很清楚的看到。
　　　　　　　　ccec、开始不断循环进行比较，其实这个过程跟上节学的排好序的合并链表思想是一模一样的，从代表风格可以看出来，只是这里采用指针位置移位的方法。
　　　　　　　　　　
　　　　　　　　　　loop1: 其中循环条件：(0 < 1 || 1 < 2)，条件为真,则通往循环体：

　　　　　　　　　　　　　ccec①、(0 >= 1)，条件不满足，执行条件②；
　　　　　　　　　　　　　ccec②、(1 >= 2)，条件不满足，执行条件③；

　　　　　　　　　　　　ccec③、(array[0] > array[1])=(10 > 4)条件满足，则执行条件里面的语句：
　　　　　　　　　　　　　　　　　temp[0] = array[1] = 4，也就是先取两数中较少的放到temp中
　　　　　　　　　　　　　　　　p_right++ ====> p_right=2
　　　　　　　　　　　　　ccec⑤、i++ ====> i=1

　　　　　　　　　 loop2: 其中循环条件：(0 < 1 || 2 < 2)，条件为真,则通往循环体：

　　　　　　　　　　　　　ccec①、(0 >= 1)，条件不满足，执行条件②；
　　　　　　　　　　　　　ccec②、(2 >= 2)，条件满足，执行条件里面的语句；
　　　　　　　　　　　　　　　　 temp[1] = array[0] = 10，也就是将两数中较大的放到了temp中

　　　　　　　　　　　　　　　　　p_left++ ====> p_left=1

　　　　　　　　　　　　　ccec⑤、i++ ====> i=2

　　　　　　　　　loop3:   其中循环条件：(1 < 1 || 2 < 2)，条件为假，退出循环。
　　　　　　　　cced:将temp中的元素一一复制到目标array数组中，目前temp只有两个已经从小到大排好序的数据：4,10
　　　　　　　　　　

　　　　　　这时可以看到2左边的元素已经排好序了：
　　　　　　

　　　　cd、，merge_sort_recursive(array, temp, 2, 4), 由于已经分析了cc的整个递归过程，这里就不仔细分析它了，流程上跟cc是一模一样的，经过这步之后，整个递归的情况如下：
　　　　

　　　　以上cc、cd两步骤就对2左边的数和右边的数进行了从小到大的顺序排序了

　　　　ce、，merge(array, temp, 0, 2, 4),经过上面cce的详细分析合并过程，其实就是对[4、10]和[3、6]两个已经排好序的进一并合并成[3、4、6、10]这样从小到大的序列，下面详细按cce的步骤再来熟悉一下整个的合并过程：
　　　　　　
　　　　　　其中参数left=0, middle=2, right=4,下面具体分析：
　　　　　　cea、,p_left=0, p_right=2
　　　　　　ceb、,i=0，这个变量干嘛用应该就不用多解释了，上面已经分的过。

　　　　　　cec、开始不断循环进行比较，具体不多解释，主要分析循环的整个过程：

　　　　　　　　

　　　　　　　　loop1: 其中循环条件：(0 < 2 || 2 < 4)，条件为真,则通往循环体：

　　　　　　　　　　　　　cec①、(0 >= 2)，条件不满足，执行条件②；
　　　　　　　　　　　　　cec②、(2 >= 4)，条件不满足，执行条件③；

　　　　　　　　　　　　cec③、(array[0] > array[2])=(4 > 3)条件满足，则执行条件里面的语句：
　　　　　　　　　　　　　　　　　temp[0] = array[2] = 3，也就是先取两数中较少的放到temp中
　　　　　　　　　　　　　　　　p_right++ ====> p_right=3
　　　　　　　　　　　　　cec⑤、i++ ====> i=1

　　　　　　　 loop2: 其中循环条件：(0 < 2 || 3 < 4)，条件为真,则通往循环体：

　　　　　　　　　　　　　cec①、(0 >= 2)，条件不满足，执行条件②；
　　　　　　　　　　　　　cec②、(3 >= 4)，条件不满足，执行条件③；
　　　　　　　　　　　　　cec③、(array[0] > array[3])=(4 > 6)条件不满足，执行条件④；

　　　　　　　　　　　　 cec④、temp[1] = array[0] = 4;

　　　　　　　　　　　　　　　　 p_left++ ====> p_left=1;

　　　　　　　　　　　　　cec⑤、i++ ====> i=2

　　　　　　　 loop3:   其中循环条件：(1 < 2 || 3 < 4)，条件为真,则通往循环体：

　　　　　　　　　　　　　cec①、(1 >= 2)，条件不满足，执行条件②；
　　　　　　　　　　　　　cec②、(3 >= 4)，条件不满足，执行条件③；

　　　　　　　　　　　　cec③、(array[1] > array[3])=(10 > 6)条件满足，则执行条件里面的语句：
　　　　　　　　　　　　　　　　 temp[2] = array[3] = 6，也就是先取两数中较少的放到temp中
　　　　　　　　　　　　　　　 p_right++ ====> p_right=4

　　　　　　　　　　　　　cec⑤、i++ ====> i=3

　　　　　　　　loop4:   其中循环条件：(1 < 2 || 4 < 4)，条件为真,则通往循环体：

　　　　　　　　　　　　　cec①、(1 >= 2)，条件不满足，执行条件②；
　　　　　　　　　　　　　cec②、(4 >= 4)，条件满足，则执行条件里面的语句：

　　　　　　　　　　　　　　　　 temp[3] = array[1] = 10;

　　　　　　　　　　　　　　　　 p_left++ ====> p_left=2;　　　　　　　　　　　　　

　　　　　　　　　　　　　cec⑤、i++ ====> i=4

　　　　　　　　loop5:   其中循环条件：(2 < 2 || 4 < 4)，条件为假，退出循环。

　　　　　　ced:将temp中的元素一一复制到目标array数组中，目前tempr的序列就如我们猜想的[3、4、6、10]
　　　　　　　　　　

　　　　这时经过这个合并可以看到已将2左边和右边已排好序的数列合并成从小到大了：
　　　　

　　d、依照c的步骤，对[middle，right)这个区间进行递归调用,也就是merge_sort_recursive(array, temp, 4, 8);

　　　　

　　　　这里就不一一分析递归过程了，具体详细递归全并过程已经在c步骤中进行了描述，贴出最终结果：
　　　　

　　e、
　　　　merge(array, temp, 0, 4, 8)，也就是最终将4左侧已经排好序的[3、4、6、10]和右侧已经排好序的[2、5、7、8]进行最终合并，达到整体从小到大的排序，到这一步也就是整个递归归并实现的全过程，如图：
　　　　
　　从上面这符图就可以清楚的知道是一个自顶向下的归并过程。

③、delete []temp;

当临时数组用完之后，需要将其内存释放，不多解释。

这样整个递归实现归并算法的流程走完，有木有茅塞顿开呢？下面再来总结一下实现思路，以便在要忘得差不多的时候自己从头写时有一个思路参考【以C++实现为例】：

步骤1、先声明一个临时数组，数组的长度则跟待排序的数组一样，其主要目的就是为了将排序之后的数组放在它里面，而不是直接去改原数组的序列，等所有步骤结束之后这个数组就是一个已经排好序的数列了，接着再将它原封不动的拷贝到原数组达到最终排序的目的。

步骤2、声明一个方法专门用来递归实现归并，也就是最核心的方法，其参数为：原数组、临时数组、要归并的数组起始位置left【从0开始，是个闭区间】、要归并的数组结束位置right【这是数组的长度，是个开区间】，而该方法具体实现分如下步骤：

　　a、先来判断递归的结束条件，这是很关键的，而条件就是发现只有一个元素了则结束递归，而如何判断只剩一个元素了呢？用right-left <= 1，其实很好理解，因为是一个[left,right)的闭开区间，当还剩一个无毒时，left=0、right=1。

　　b、计算出中间的位置，因为归并排序的核心思想就是折半之后将左边和右边的数据排序好，然后再将左右排序好的数据进行合并。

　　c、不断递归左边的数据，相当于一个数据拆解的过程，直到只剩一个元素结束递归，其参数为：原数组、临时数组、left，middle。

　　d、不断递归右边的数据，相当于一个数据拆解的过程，直到只剩一个元素结束递归，其参数为：原数组、临时数组、middle，right。
　　e、将左右两边已经排好序的数据进行合并，这个就跟上篇学习的合并已经排好序的链表逻辑类似，其具体合并的过程如下：

　　　　①、声明两个临时变量p_left、p_right，分别指向left、middle，然后会不断的循环去更改这两个临时变量去进行数据合并。

　　　　②、声明一个变量i，默认直接指向参数中的left，它的作用主要是用来往temp指定位置塞数据用的，而往temp塞数据是会让一定顺序进行的。

　　　　③、接着开始循环进行合并，也是该方法的核心：

　　　　　　1、首先循环的条件是：p_left < middle || p_right < right。也就是左边的数据和右边的数据都走完了则循环结束，条件满足则下执行循环体

　　　　　　2、如果左边的数据已经走完，则将p_right指向的数放到temp中，并且p_right++。

　　　　　　3、如果右边的数据已经走完，则将p_left指向的数放到temp中，并且p_left++。

　　　　　　4、如果左边的数据大于右边的数据，则将右边的数据放到temp中，并且将p_right++。

　　　　　　5、否则表示左边的数据小于右边的数据，则将左边的数据放到temp中，并且将p_left++。

　　　　　　6、最后将i++,将temp的下标往下挪。

　　f、将temp已经排好序的完全拷贝至array中。

步骤3、将临时变量的内存释放掉，因为它的使用价值已经到此结束。

非递归方式实现归并排序[自底向上]：

非递归的方式整体步骤跟递归的思路是相反的，有了递归的思路，非递归的方式很容易理解，依然看一张用非递归方式来实现归并排序的整体思路：

实基本思想是：将数组中的相邻元素两两配对。用Merge()函数将他们排序，构成n/2组长度为2的排序好的子数组段，然后再将他们合并成长度为4的子数组段，如此继续下去，直至整个数组排好序。下面看下具体实现：

编译运行：

下面依然用debug的方式一步步分析来理解其实现：

①、int* temp = new int[length];不多解释，跟递归实现的一样。

②、接着开始循环开启归并模式，如下：

　　step loop1:

　　a、：外层循环，具体为啥这么写等整个过程分析完之后就明白了。

　　　　b、：内层循环,计算left的位置。

　　　　　　left loop1: step = 1、left = 0;

　　　　　　　　abc、：计算middle的位置：middle = min(0 + 1, 8) = 1

　　　　　　　　abd、：计算right的位置：right = min(0 + 2 * 1, 8) = 2

　　　　　　　　abe、：这个方法有木有很熟悉，木错，用的跟递归的合并方法一模一样，所以这里就不多解释了。
　　　　　　left = left + 2 * step = 0 + 2 * 1 = 2;
　　　　　　
　　　　　　left loop2: step = 1、left = 2;

　　　　　　　　abc、：计算middle的位置：middle = min(2 + 1, 8) = 3

　　　　　　　　abd、：计算right的位置：right = min(2 + 2 * 1, 8) = 4

　　　　　　　　abe、

　　　　　　left = left + 2 * step = 2 + 2 * 1 = 4;
　　　　　　　　　　

　　　　　　left loop2: step = 1、left = 4;

　　　　　　　　abc、：计算middle的位置：middle = min(4 + 1, 8) = 5

　　　　　　　　abd、：计算right的位置：right = min(4 + 2 * 1, 8) = 6

　　　　　　　　abe、

　　　　　　left = left + 2 * step = 4 + 2 * 1 = 6;
　　　　　　

　　　　　　left loop2: step = 1、left = 6;

　　　　　　　　abc、：计算middle的位置：middle = min(6 + 1, 8) = 7

　　　　　　　　abd、：计算right的位置：right = min(6 + 2 * 1, 8) = 8

　　　　　　　　abe、

　　　　　　left = left + 2 * step = 6 + 2 * 1 = 8;
　　　　　　
　　　　而内层循环的left < length条件不满足了，则退出此次的内层循环，外层的step = step * 2 = 2
　　总结：通过上面第一轮内层循环流程走完，外层的step是用来控制是每次比较的数量，而内层的left肯定是用来控制left的位置的，而middle和left就是根据step和left来决定的，其中step每次是+2，而left则是每次基于上一次+2倍的step。

　　step loop2:

　　　　a、：外层循环

　　　　b、：内层循环

　　　　　　left loop1: step = 2、left = 0;

　　　　　　　　abc、：计算middle的位置：middle = min(0 + 2, 8) = 2

　　　　　　　　abd、：计算right的位置：right = min(0 + 2 * 2, 8) = 4

　　　　　　　　abe、
　　　　　　

　　　　　　left = left + 2 * step = 0 + 2 * 2 = 4;

　　　　　　left loop2: step = 2、left = 4;

　　　　　　　　abc、：计算middle的位置：middle = min(4 + 2, 8) = 6

　　　　　　　　abd、：计算right的位置：right = min(4 + 2 * 2, 8) = 8

　　　　　　　　abe、
　　　　　　

　　　　　　left = left + 2 * step = 4 + 2 * 2 = 8;
　　　　　　而此时left < length不满足条件，此次的内层循环结束。外层的step = step * 2 = 4

　　step loop3:

　　　　a、：外层循环

　　　　b、：内层循环

　　　　　　left loop1: step = 4、left = 0;

　　　　　　　　abc、：计算middle的位置：middle = min(0 + 4, 8) = 4

　　　　　　　　abd、：计算right的位置：right = min(0 + 2 * 4, 8) = 8

　　　　　　　　abe、
　　　　　　　　

　　　　　　left = left + 2 * step = 0 + 2 * 4 = 8;
　　　　　　而此时left < length不满足条件，此次的内层循环结束。外层的step = step * 2 = 8，而外层的step<length也不满足条件，则外层循环也结束，至此整个非递归方法结束。

③、delete []temp;也不多解释。

以上详细的对归并的两种实现方法分析了其实现过程，算法实现完了当然得分析一下它的时间复杂度，这个待下次学习快速排序之后再一次分析~因为他们的时间复杂度是一样的。
查看全文

相关阅读:
刘强东：当下正是行业谷底，可卖了两辆车的二手车电商却估值2亿美金传统商业的价值和经济规律完全适用于互联网任何一种互联网商业模式，如果不能够降低行业的交易成本，不能够提升行业交易效率的话，那么最后注定会失败的。
学习一样新东西行而有效的方法学习捷径一项由10个步骤组成的学习方法
 侃侃程序员的个人努力与前途问题程序员到底怎么了
 你觉得你在创业，但其实你可能只是在做小生意而已制定正确的计划创业和经营小企业之间的差异
 外贸圈贸易经外贸心路一位成功外贸人的SOHO心得
 总结创业成功的共性企业成功的必要条件 --投资教父阎焱：创业成功的九九八十一难
 Navicat 12.x for MySQL最新版安装破解教程（附安装包和注册机，全网独家可用
 Xmanager PowerSuite 6企业版详细安装破解教程，解决评估过期问题（附注册机，全网独家可用），非学校/家庭免费版
 UltraEdit等软件详细安装破解教程，附注册机（全网独家可用）
SpringBoot2.0微信小程序支付多次回调问题

原文地址：https://www.cnblogs.com/webor2006/p/7130706.html