参考http://blog.csdn.net/morewindows/article/details/6684558和http://developer.51cto.com/art/201206/344788.htm
1. 归并排序
归并排序采用的是递归来实现,属于“分而治之”,将目标数组从中间一分为二,之后分别对这两个数组进行排序,排序完毕之后再将排好序的两个数组“归并”到一起,归并排序最重要的也就是这个“归并”的过程,归并的过程中需要额外的跟需要归并的两个数组长度一致的空间,比如需要规定的数组分别为: [3, 6, 8, 11] 和 [1, 3, 12, 15] (虽然逻辑上被划为为两个数组,但实际上这些元素还是位于原来数组中的,只是通过一些 index 将其划分成两个数组,原数组为 [3, 6, 8, 11, 1, 3, 12, 15 ,我们设置三个指针 lo, mid, high 分别为 0,3,7 就可以实现逻辑上的子数组划分)那么需要的额外数组的长度为 4 + 4 = 8 。归并的过程可以简要地概括为如下:
1) 将两个子数组中的元素复制到新数组 copiedArray 中,以前面提到的例子为例,则 copiedArray = [3, 6, 8, 11, 1, 3, 12, 15] ;
2) 设置两个指针分别指向原子数组中对应的第一个元素,假定这两个指针取名为 leftIdx 和 rightIdx ,则 leftIdx = 0 (对应 copiedArray 中的第一个元素 [3] ), rightIdx = 4 (对应 copiedArray 中的第五个元素 [1] );
3) 比较 leftIdx 和 rightIdx 指向的数组元素值,选取其中较小的一个并将其值赋给原数组中对应的位置 i ,赋值完毕后分别对参与赋值的这两个索引做自增 1 操作,如果 leftIdx 或 rigthIdx 值已经达到对应数组的末尾,则余下只需要将剩下数组的元素按顺序 copy 到余下的位置即可。
下面给个归并的具体实例:
- 第一趟:
- 辅助数组 [21 , 28, 39 | 35, 38] (数组被拆分为左右两个子数组,以 | 分隔开)
- [21 , , , , ] (第一次 21 与 35 比较 , 左边子数组胜出, leftIdx = 0 , i = 0 )
- 第二趟:
- 辅助数组 [21, 28 , 39 | 35, 38]
- [21 , 28, , , ] (第二次 28 与 35 比较,左边子数组胜出, leftIdx = 1 , i = 1 )
- 第三趟: [21, 28, 39 | 35 , 38]
- [21 , 28 , 35, , ] (第三次 39 与 35 比较,右边子数组胜出, rightIdx = 0 , i = 2 )
- 第四趟: [21, 28, 39 | 35, 38 ]
- [21 , 28 , 35 , 38, ] (第四次 39 与 38 比较,右边子数组胜出, rightIdx = 1 , i = 3 )
- 第五趟: [21, 28, 39 | 35, 38]
- [21 , 28 , 35 , 38 , 39] (第五次时右边子数组已复制完,无需比较 leftIdx = 2 , i = 4 )
以上便是一次归并的过程,我们可以将整个需要排序的数组做有限次拆分(每次一分为二)直到分为长度为 1 的小数组为止,长度为 1 时数组已经不用排序了。在这之后再逆序(由于采用递归)依次对这些数组进行归并操作,直到最后一次归并长度为 n / 2 的子数组,归并完成之后数组排序也完成。
归并排序需要的额外空间是所有排序中最多的,每次归并需要与参与归并的两个数组长度之和相同个元素(为了提供辅助数组)。则可以推断归并排序的空间复杂度为 1 + 2 + 4 + … + n = n * ( n + 2) / 4 (忽略了 n 的奇偶性的判断),时间复杂度比较难估,这里小弟也忘记是多少了(囧)。
实现代码:
- /**
- * Merge sorting
- */
- MERGE(new Sortable() {
- public <T extends Comparable<T>> void sort(T[] array, boolean ascend) {
- this.sort(array, 0, array.length - 1, ascend);
- }
- private <T extends Comparable<T>> void sort(T[] array, int lo, int hi, boolean ascend) {
- // OPTIMIZE ONE
- // if the substring's length is less than 20,
- // use insertion sort to reduce recursive invocation
- if (hi - lo < 20) {
- for (int i = lo + 1; i <= hi; i++) {
- T toInsert = array[i];
- int j = i;
- for (; j > lo; j--) {
- int compare = array[j - 1].compareTo(toInsert);
- if (compare == 0 || compare < 0 == ascend) {
- break;
- }
- array[j] = array[j - 1];
- }
- array[j] = toInsert;
- }
- return;
- }
- int mid = lo + (hi - lo) / 2;
- sort(array, lo, mid, ascend);
- sort(array, mid + 1, hi, ascend);
- merge(array, lo, mid, hi, ascend);
- }
- private <T extends Comparable<T>> void merge(T[] array, int lo, int mid, int hi, boolean ascend) {
- // OPTIMIZE TWO
- // if it is already in right order, skip this merge
- // since there's no need to do so
- int leftEndCompareToRigthStart = array[mid].compareTo(array[mid + 1]);
- if (leftEndCompareToRigthStart == 0 || leftEndCompareToRigthStart < 0 == ascend) {
- return;
- }
- @SuppressWarnings("unchecked")
- T[] arrayCopy = (T[]) new Comparable[hi - lo + 1];
- System.arraycopy(array, lo, arrayCopy, 0, arrayCopy.length);
- int lowIdx = 0;
- int highIdx = mid - lo + 1;
- for (int i = lo; i <= hi; i++) {
- if (lowIdx > mid - lo) {
- // left sub array exhausted
- array[i] = arrayCopy[highIdx++];
- } else if (highIdx > hi - lo) {
- // right sub array exhausted
- array[i] = arrayCopy[lowIdx++];
- } else if (arrayCopy[lowIdx].compareTo(arrayCopy[highIdx]) < 0 == ascend) {
- array[i] = arrayCopy[lowIdx++];
- } else {
- array[i] = arrayCopy[highIdx++];
- }
- }
- }
- })
2. 快速排序
快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。
总的说来,要直接默写出快速排序还是有一定难度的,因为本人就自己的理解对快速排序作了下白话解释,希望对大家理解有帮助,达到快速排序,快速搞定。
快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。
该方法的基本思想是:
1.先从数列中取出一个数作为基准数。
2.分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。
3.再对左右区间重复第二步,直到各区间只有一个数。
虽然快速排序称为分治法,但分治法这三个字显然无法很好的概括快速排序的全部步骤。因此我的对快速排序作了进一步的说明:挖坑填数+分治法:
先来看实例吧,定义下面再给出(最好能用自己的话来总结定义,这样对实现代码会有帮助)。
以一个数组作为示例,取区间第一个数为基准数。
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
72 |
6 |
57 |
88 |
60 |
42 |
83 |
73 |
48 |
85 |
初始时,i = 0; j = 9; X = a[i] = 72
由于已经将a[0]中的数保存到X中,可以理解成在数组a[0]上挖了个坑,可以将其它数据填充到这来。
从j开始向前找一个比X小或等于X的数。当j=8,符合条件,将a[8]挖出再填到上一个坑a[0]中。a[0]=a[8]; i++; 这样一个坑a[0]就被搞定了,但又形成了一个新坑a[8],这怎么办了?简单,再找数字来填a[8]这个坑。这次从i开始向后找一个大于X的数,当i=3,符合条件,将a[3]挖出再填到上一个坑中a[8]=a[3]; j--;
数组变为:
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
48 |
6 |
57 |
88 |
60 |
42 |
83 |
73 |
88 |
85 |
i = 3; j = 7; X=72
再重复上面的步骤,先从后向前找,再从前向后找。
从j开始向前找,当j=5,符合条件,将a[5]挖出填到上一个坑中,a[3] = a[5]; i++;
从i开始向后找,当i=5时,由于i==j退出。
此时,i = j = 5,而a[5]刚好又是上次挖的坑,因此将X填入a[5]。
数组变为:
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
48 |
6 |
57 |
42 |
60 |
72 |
83 |
73 |
88 |
85 |
可以看出a[5]前面的数字都小于它,a[5]后面的数字都大于它。因此再对a[0…4]和a[6…9]这二个子区间重复上述步骤就可以了。
对挖坑填数进行总结
1.i =L; j = R; 将基准数挖出形成第一个坑a[i]。
2.j--由后向前找比它小的数,找到后挖出此数填前一个坑a[i]中。
3.i++由前向后找比它大的数,找到后也挖出此数填到前一个坑a[j]中。
4.再重复执行2,3二步,直到i==j,将基准数填入a[i]中。
照着这个总结很容易实现挖坑填数的代码:
- int AdjustArray(int s[], int l, int r) //返回调整后基准数的位置
- {
- int i = l, j = r;
- int x = s[l]; //s[l]即s[i]就是第一个坑
- while (i < j)
- {
- // 从右向左找小于x的数来填s[i]
- while(i < j && s[j] >= x)
- j--;
- if(i < j)
- {
- s[i] = s[j]; //将s[j]填到s[i]中,s[j]就形成了一个新的坑
- i++;
- }
- // 从左向右找大于或等于x的数来填s[j]
- while(i < j && s[i] < x)
- i++;
- if(i < j)
- {
- s[j] = s[i]; //将s[i]填到s[j]中,s[i]就形成了一个新的坑
- j--;
- }
- }
- //退出时,i等于j。将x填到这个坑中。
- s[i] = x;
- return i;
- }
再写分治法的代码:
- void quick_sort1(int s[], int l, int r)
- {
- if (l < r)
- {
- int i = AdjustArray(s, l, r);//先成挖坑填数法调整s[]
- quick_sort1(s, l, i - 1); // 递归调用
- quick_sort1(s, i + 1, r);
- }
- }
这样的代码显然不够简洁,对其组合整理下:
- //快速排序
- void quick_sort(int s[], int l, int r)
- {
- if (l < r)
- {
- //Swap(s[l], s[(l + r) / 2]); //将中间的这个数和第一个数交换 参见注1
- int i = l, j = r, x = s[l];
- while (i < j)
- {
- while(i < j && s[j] >= x) // 从右向左找第一个小于x的数
- j--;
- if(i < j)
- s[i++] = s[j];
- while(i < j && s[i] < x) // 从左向右找第一个大于等于x的数
- i++;
- if(i < j)
- s[j--] = s[i];
- }
- s[i] = x;
- quick_sort(s, l, i - 1); // 递归调用
- quick_sort(s, i + 1, r);
- }
- }
快速排序还有很多改进版本,如随机选择基准数,区间内数据较少时直接用另的方法排序以减小递归深度。有兴趣的筒子可以再深入的研究下。
注1,有的书上是以中间的数作为基准数的,要实现这个方便非常方便,直接将中间的数和第一个数进行交换就可以了。