第九章 中位数和顺序统计学
9.2 以期望线性时间做选择
上一讲是找出最小值,同时找出最大值最小值,以及找出次小值的问题。随意选择数组中第i小(大)的元素看起来要比找最小值的简单选择问题要复杂一些。但是令人惊奇的是,两种问题的渐近运行时间却是相同的,都是O(n)。算法导论上介绍了一种用来解决选择问题的分治算法,即RANDOMIZED-SELECT算法。本算法以快速排序算法的分割算法为基础,如同在快速排序中一样,此算法的思想也是对输入数组进行递归划分。但与快速排序不同的是,快速排序会递归处理划分的两边,而RANDOMIZED-SELECT只处理划分的某一边。这一差异在算法的分析中就体现出来了:快速排序的期望运行时间是O(nlgn)。而RANDOMIZED-SELECT的期望运行时间为O(n)。下面是RANDOMIZED-SELECT算法:
RANDOMIZED-SELECT(A, p, r, i) P109
1 if p = r 2 then return A[p] 3 q ← RANDOMIZED-PARTITION(A, p, r) 4 k ← q - p + 1 5 if i = k 6 then return A[q] 7 elseif i < k 8 then return RANDOMIZED-SELECT(A, p, q - 1, i) 9 else return RANDOMIZED-SELECT(A, q + 1, r, i - k)
RANDOMIZED-SELECT利用了RANDOMIZED-PARTITION程序。所以,本算法也是一个随机算法,因为它的行为部分地由随机数生成器的输出来决定。本算法返回A[p..r]中的第i小的元素。
算法第三行的RANDOMIZED-PARTITION执行之后,数组A[p..r]被划分为两个子数组A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每个元素都小于或等于A[q],A[q+1..r]中的每个元素都大于A[q]。
第四行计算A[p..r]的元素个数k,即处于低划分区的元素的个数加上一个主元素。然后第五行检查A[q]是不是第i小的元素。如果是,就返回A[q]。否则,算法要确定第i小的元素落在两个子数组A[p..q-1]和A[q+1..r]中的哪一个之中。如果i<k,则在低区,如i>k,则在高区。然后递归选择。
算法的最坏运行时间为O(n2),即使是要选择最小元素。
《编程之美》中的2.3 寻找发贴“水王”就可以用顺序统计量来解答。
C++代码
1 #include <iostream> 2 #include <ctime> 3 #include <cstdlib> 4 5 using namespace std; 6 7 void swap(int* x, int* y) 8 { 9 int temp; 10 temp = *x; 11 *x = *y; 12 *y = temp; 13 } 14 15 inline int random(int x, int y) 16 { 17 srand((unsigned)time(0)); 18 int ran_num = rand() % (y - x) + x; 19 return ran_num; 20 } 21 22 int partition(int* arr, int p, int r) 23 { 24 int x = arr[r]; 25 int i = p - 1; 26 for(int j = p; j < r; j++) 27 { 28 if (arr[j] <= x) 29 { 30 i++; 31 swap(arr[i], arr[j]); 32 } 33 } 34 swap(arr[i + 1], arr[r]); 35 return ++i; 36 } 37 38 int randomizedpartition(int* arr, int p, int r) 39 { 40 int i = random(p, r); 41 swap(arr[r], arr[i]); 42 return partition(arr, p, r); 43 } 44 45 int randomizedSelect(int* arr, int p, int r, int i) 46 { 47 if(p == r) 48 { 49 return arr[p]; 50 } 51 int q = randomizedpartition(arr, p, r); 52 int k = q - p + 1; 53 if(i == k) 54 { 55 return arr[q]; 56 } 57 else if(i < k) 58 { 59 return randomizedSelect(arr, p, q - 1, i); 60 } 61 else 62 return randomizedSelect(arr, q + 1, r, i - k); 63 } 64 65 int main() 66 { 67 int arr[] = {1, 3, 5, 23, 64, 7, 23, 6, 34, 98, 100, 9}; 68 int i = randomizedSelect(arr, 0, 11, 4); 69 cout << i << endl; 70 return 0; 71 }