常用的排序算法包括:
- 冒泡排序:
每次在无序队列里将相邻两个数依次进行比较,将小数调换到前面, 逐次比较,直至将最大的数移到最后。最将剩下的N-1个数继续比较,将次大数移至倒数第二。依此规律,直至比较结束。时间复杂度:O(n^2) - 选择排序:
每次在无序队列中“选择”出最大值,放到有序队列的最后,并从无序队列中去除该值(具体实现略有区别)。时间复杂度:O(n^2) - 直接插入排序:
始终定义第一个元素为有序的,将元素逐个插入到有序排列之中,其特点是要不断的 移动数据,空出一个适当的位置,把待插入的元素放到里面去。时间复杂度:O(n^2) - 希尔排序:
希尔排序是对直接插入排序的改进,希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。 - 快速排序:
递归地将数组一分为2,左边是所有比第一个数小的,右边是所有比第一个数大的。这其中涉及到如何移动交换的技巧问题。本题为挖坑填坑模式。时间复杂度:O(nlogn) - 堆排序:
对需要排序的数组首先建立堆,然后(如果最终是由小到大排序)依次交换根位置与最后一个节点位置的数值,之后调整堆,循环往复。时间复杂度:O(nlogn)。关于堆这一数据结构以及堆排序可以参考百度百科:堆排序 - 归并排序:给定两个已经排好序(由小到大)的数组,归并排序的意思是,选取数组A中的第一个值,与另一个数组B中的第一个值比较,每找到一个较小的值就写入新的数组C,直到所有的值都大于此值时,将此值写入C,选取数组A的一个值作为对照值,重复上面的操作。时间复杂度:O(nlogn)
关于各种排序算法的稳定性:
1) 稳定的:如果存在多个具有相同排序码的记录,经过排序后,这些记录的相对次序仍然保持不变,则这种排序算法称为稳定的。
插入排序、冒泡排序、归并排序、分配排序(桶式、基数)都是稳定的排序算法。
2) 不稳定的:否则称为不稳定的。
直接选择排序、堆排序、shell排序、快速排序都是不稳定的排序算法。
关于不同引用场景下使用不同的算法:
(1) 若n较小(如n≤50),可采用直接插入或直接选择排序。
当记录规模较小时,直接插入排序较好;否则因为直接选择移动的记录数少于直接插人,应选直接选择排序为宜。
(2) 若文件初始状态基本有序(指正序),则应选用直接插人、冒泡或随机的快速排序为宜;
(3) 若n较大,则应采用时间复杂度为O(nlgn)的排序方法:快速排序、堆排序或归并排序。
快速排序是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
堆排序所需的辅助空间少于快速排序,并且不会出现快速排序可能出现的最坏情况。这两种排序都是不稳定的。
若要求排序稳定,则可选用归并排序。但本章介绍的从单个记录起进行两两归并的 排序算法并不值得提倡,通常可以将它和直接插入排序结合在一起使用。先利用直接插入排序求得较长的有序子文件,然后再两两归并之。因为直接插入排序是稳定 的,所以改进后的归并排序仍是稳定的。
代码1:冒泡排序,选择排序,直接插入排序,希尔排序,快速排序代码。
1 /** 2 * 冒泡排序: 每次在无序队列里将相邻两个数依次进行比较,将小数调换到前面, 逐次比较,直至将最大的数移到最后。 3 * 最将剩下的N-1个数继续比较,将次大数移至倒数第二位。 依此规律,直至比较结束。 4 */ 5 public static void bubbleSort(int[] a) { 6 int n = a.length; 7 for (int i = 0; i < n - 1; i++) { 8 for (int j = 0; j < n - i - 1; j++) { 9 if (a[j] > a[j + 1]) { 10 int temp = a[j + 1]; 11 a[j + 1] = a[j]; 12 a[j] = temp; 13 } 14 } 15 } 16 } 17 18 /** 19 * 选择排序:每次在无序队列中“选择”出最大值,放到有序队列的最后,并从无序队列 中去除该值(具体实现略有区别)。 20 */ 21 public static void selectSort(int[] a) { 22 int n = a.length; 23 int max_index = 0; 24 for (int i = n - 1; i >= 0; i--) { 25 max_index = i; 26 for (int j = 0; j <= i; j++) { 27 if (a[j] > a[max_index]) 28 max_index = j; 29 } 30 if (max_index != i) { 31 int temp = a[i]; 32 a[i] = a[max_index]; 33 a[max_index] = temp; 34 } 35 } 36 } 37 38 /** 39 * 插入排序:始终定义第一个元素为有序的,将元素逐个插入到有序排列之中,其特点是要不断的 移动数据,空出一个适当的位置,把待插入的元素放到里面去。 40 */ 41 public static void insertSort(int[] a) { 42 int n = a.length; 43 int j = 0; 44 for (int i = 1; i < n; i++) { 45 j = i - 1; 46 int temp = a[i]; 47 while (j >= 0 && a[j] > temp) { 48 a[j + 1] = a[j]; 49 j--; 50 } 51 a[j + 1] = temp; 52 for (int m : a) { 53 System.out.print(m + ","); 54 } 55 System.out.println(); 56 // for (int j = i; j > 0; j--) { 57 // if (a[j] < a[j - 1]) { 58 // int temp = a[j]; 59 // a[j] = a[j - 1]; 60 // a[j - 1] = temp; 61 // } 62 // } 63 } 64 } 65 66 /** 67 * 快速排序:递归地将数组一分为2,左边是所有比第一个数小的,右边是所有比第一个数大的 68 */ 69 public static void quickSort(int[] a) { 70 quickSort(a, 0, a.length - 1); 71 } 72 73 private static void quickSort(int[] a, int l, int r) { 74 if (l < r) { 75 // 取左边第一个值作为分界值 76 int mid = a[l]; 77 int i = l, j = r; 78 while (i < j) { 79 while (i < j && a[j] > mid) 80 j--; 81 if (i < j) 82 a[i++] = a[j]; 83 while (i < j && a[i] <= mid) 84 i++; 85 if (i < j) 86 a[j--] = a[i]; 87 } 88 a[i] = mid; 89 quickSort(a, l, i - 1); 90 quickSort(a, i + 1, r); 91 } 92 } 93 94 /** 95 * 希尔排序是对直接插入排序的改进,希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多, 96 * 当增量减至1时,整个文件恰被分成一组,算法便终止。 97 * 98 * @param a 99 */ 100 public static void shellSort(int[] a) { 101 int d = a.length; 102 while (true) { 103 d = d / 2; 104 for (int x = 0; x < d; x++) {// 分组 105 // 对每组进行直接插入排序 106 for (int i = x + d; i < a.length; i = i + d) { 107 int temp = a[i];// 记录要插入的值 108 int j; 109 // 将要插入的值插入到正确位置,这一过程中不断检测前面的数,如果相比较大,则同时移动一次 110 for (j = i - d; j >= 0 && a[j] > temp; j = j - d) { 111 a[j + d] = a[j]; 112 } 113 a[j + d] = temp; 114 } 115 } 116 if (d == 1) { 117 break; 118 } 119 } 120 }
代码2:推排序(由于java版比较长,所以另写一个)
1 public class HeapSort { 2 private static int[] sort = new int[] { 1, 0, 10, 20, 3, 5, 6, 4, 9, 8, 12, 17, 34, 11 }; 3 4 public static void main(String[] args) { 5 System.out.println(sort.length); 6 buildMaxHeapify(sort); 7 heapSort(sort); 8 print(sort); 9 } 10 11 private static void buildMaxHeapify(int[] data) { 12 // 没有子节点的才需要创建最大堆,从最后一个的父节点开始 13 int startIndex = getParentIndex(data.length - 1); 14 // 从尾端开始创建最大堆,每次都是正确的堆 15 for (int i = startIndex; i >= 0; i--) { 16 maxHeapify(data, data.length, i); 17 } 18 } 19 20 /** 21 * 创建最大堆 22 * 23 * @paramdata 24 * @paramheapSize需要创建最大堆的大小,一般在sort的时候用到,因为最多值放在末尾,末尾就不再归入最大堆了 25 * @paramindex当前需要创建最大堆的位置 26 */ 27 private static void maxHeapify(int[] data, int heapSize, int index) { 28 // 当前点与左右子节点比较 29 int left = getChildLeftIndex(index); 30 int right = getChildRightIndex(index); 31 32 int largest = index; 33 if (left < heapSize && data[index] < data[left]) { 34 largest = left; 35 } 36 if (right < heapSize && data[largest] < data[right]) { 37 largest = right; 38 } 39 // 得到最大值后可能需要交换,如果交换了,其子节点可能就不是最大堆了,需要重新调整 40 if (largest != index) { 41 int temp = data[index]; 42 data[index] = data[largest]; 43 data[largest] = temp; 44 maxHeapify(data, heapSize, largest); 45 } 46 } 47 48 /** 49 * 排序,最大值放在末尾,data虽然是最大堆,在排序后就成了递增的 50 * 51 * @paramdata 52 */ 53 private static void heapSort(int[] data) { 54 // 末尾与头交换,交换后调整最大堆 55 for (int i = data.length - 1; i > 0; i--) { 56 int temp = data[0]; 57 data[0] = data[i]; 58 data[i] = temp; 59 maxHeapify(data, i, 0); 60 } 61 } 62 63 /** 64 * 父节点位置 65 * 66 * @paramcurrent 67 * @return 68 */ 69 private static int getParentIndex(int current) { 70 return (current - 1) >> 1; 71 } 72 73 /** 74 * 左子节点position注意括号,加法优先级更高 75 * 76 * @paramcurrent 77 * @return 78 */ 79 private static int getChildLeftIndex(int current) { 80 return (current << 1) + 1; 81 } 82 83 /** 84 * 右子节点position 85 * 86 * @paramcurrent 87 * @return 88 */ 89 private static int getChildRightIndex(int current) { 90 return (current << 1) + 2; 91 } 92 93 private static void print(int[] data) { 94 int pre = -2; 95 for (int i = 0; i < data.length; i++) { 96 if (pre < (int) getLog(i + 1)) { 97 pre = (int) getLog(i + 1); 98 System.out.println(); 99 } 100 System.out.print(data[i] + "|"); 101 } 102 } 103 104 /** 105 * 以2为底的对数 106 * 107 * @paramparam 108 * @return 109 */ 110 private static double getLog(double param) { 111 return Math.log(param) / Math.log(2); 112 } 113 }
代码3:top-K问题
1 /** 2 * 使用最大堆进行top K的选取 3 */ 4 public static int[] topK(int[] a, int k) { 5 int[] res = new int[k]; 6 if (k > a.length) { 7 System.err.println("k larger than length of array"); 8 return res; 9 } 10 for (int i = 0; i < a.length; i++) { 11 if (a[i] > res[0]) { 12 res[0] = a[i]; 13 for (int j = 0; j < k && 2 * j + 1 < k;) { 14 int tag1 = 0, tag2 = 0; 15 if (2 * j + 2 < k && res[2 * j + 1] > res[2 * j + 2]) { 16 if (res[j] > res[2 * j + 2]) { 17 int temp = res[2 * j + 2]; 18 res[2 * j + 2] = res[j]; 19 res[j] = temp; 20 j = 2 * j + 2; 21 tag1 = 1; 22 } 23 } else { 24 if (res[j] > res[2 * j + 1]) { 25 int temp = res[2 * j + 1]; 26 res[2 * j + 1] = res[j]; 27 res[j] = temp; 28 j = 2 * j + 1; 29 tag2 = 1; 30 } 31 } 32 if (tag1 == 0 && tag2 == 0) 33 break; 34 } 35 } 36 } 37 return res; 38 }