寻找两个已序数组中的第k大元素

zoukankan html css js c++ java

寻找两个已序数组中的第k大元素
寻找两个已序数组中的第k大元素
1、问题描述

　　给定两个数组 $A$ 与 $B$ ，其大小分别为 $m$ 、 $n$ ，假定它们都是已按照增序排序的数组，我们用尽可能快的方法去求两个数组合并后第 $k$ 大的元素，其中， $1le kle(m+n)$ 。例如，对于数组 $A=[1,3,5,7,9]$ ， $B=[2,4,6,8]$ 。我们记第 $k$ 大的数为 $max_{k-th}$ ，则 $k=4$ 时， $max_{4-th}=4$ 。这是因为排序之后的数组 $A+B=[1,2,3,4,5,6,7,8,9]$ ，第4大的数是4。我们针对这一个问题进行探讨。

2、算法一

　　第一眼看到这个题的时候，我们能够很快地想出来最基本的一种解法：对数组 $A$ 和 $B$ 进行合并，然后求出其第 $k$ 大的数，即找到答案。合并的过程，我们可以参考归并排序的合并子数组的过程，时间复杂度为 $O(m+n)$ 。下面给出算法：

View Code

int findKthMaxNumOfArrays(int *a,int m,int *b,int n,int k) { int *p=a; int *q=b; int i=0; int j=0; int cur=0; while(i<m&&j<n) { if(a[i]<b[j]) { cur++; if(cur==k) return a[i]; i++; } else { cur++; if(cur==k) return b[j]; j++; } } while(i<m) { cur++; if(cur==k) return a[i]; i++; } while(j<n) { cur++; if(cur==k) return b[j]; j++; } }

3、算法二

　　实际上算法一的时间复杂度已经是线性的了。可是，是否存在更快的算法能够完成这项任务呢？答案是肯定的，时间复杂度可以缩短到 $O(log(m+n))$ 时间内。在这种算法中，二分的思想十分重要。我们将数组 $A$ 分为两半，前一部分的大小为 $left lfloor frac{m}{2} ight floor$ ，后一部分为 $m- left lfloor frac{m}{2} ight floor$ ；数组 $B$ 同时分为这样两部分，第一部分的大小为 $left lfloor frac{n}{2} ight floor$ ，第二部分的大小为 $n- left lfloor frac{n}{2} ight floor$ 。如下图所示：

通过 $a_{frac{m}{2}}$ 与 $b_{frac{n}{2}}$ ，我们将每个数组分为2部分，分别记为 $A1$ 、 $A2$ 和 $B1$ 、 $B2$ 。假定 $b_{frac{n}{2}} ge a_{frac{m}{2}}$ ，如果不是，我们只需要交换 $A$ 、 $B$ 两个数组即可。接下来，我们看第 $k$ 大的数落在了哪个区间里面，令 $t=a_{frac{m}{2}}+b_{frac{n}{2}}+1$ ，这个 $t$ 实际上是包含了 $A1$ ， $a_{frac{m}{2}}$ ， $B1$ 。如果 $kle t$ 时，则说明 $max_{k-th}$ 肯定不在 $B2$ 里面，这是由于： $B2$ 中的所有数 $ge b_{frac{n}{2}}$ ，而 $b_{frac{n}{2}} ge A1,B1$ 中的所有数与 $a_{frac{m}{2}}$ ，而这部分数总共有 $t$ 个，说明 $b_{frac{n}{2}}$ 是第 $t+1$ 个，若 $max_{k-th}$ 出现在 $B2$ 中，则说明 $kge t+1$ ，与假设矛盾。我们可以得出该结论。因此，在判断之后，我们可以剔除数组 $B$ 的 $B2$ 部分，然后再在新数组中寻找；另外，如果 $kge t$ ，则说明 $max_{k-th}$ 肯定不在 $A1$ 部分，这部分的证明同上一个证明相同，不再赘述。同样地，在判断之后，我们可以剔除数组 $A$ 的 $A1$ 部分，然后再在新数组中寻找。基于这样一种思想，我们每次迭代，都删除了其中一个数组中一半的元素，时间复杂度大约可认为是 $O(log(m+n))$ 。

　　在实现的时候，我们需要特别注意边界条件，详细的代码如下：

View Code
int findKthMaxNumOfArrays(int *A, int m, int *B, int n, int k) { if(m == 0)return B[k-1]; if(n == 0)return A[k-1]; int i = m>>1, j = n>>1, *p, *q, t; if(A[i] <= B[j])p = A, q = B; else p = B, q = A, swap(i, j), swap(m, n); t = i + j + 1; if(t >= k)return func(p, m, q, j, k); else if(t < k)return func(p+i+1, m-i-1, q, n, k-i-1); }

4、扩展问题

　　通过算法二，我们很容易地解决一个类似的问题：求两个已序数组 $A$ , $B$ 的中位数。所谓的中位数，对于一个有 $n$ 个元素的已序数组，如果 $n$ 是奇数，则中位数是第 $frac{n+1}{2}$ 个元素的值；如果 $n$ 是偶数，则它的中位数是第 $frac{n}{2}$ 与第 $frac{n}{2}+1$ 数的平均值。对于 $m+n$ 为奇数，则利用算法二求第 $frac{n+m+1}{2}$ 个元素的值即可，对于 $m+n$ 为偶数，利用算法二求第 $frac{m+n}{2}$ 个与第 $frac{m+n}{2}+1$ 个元素的值，求其平均值即可。

　　对于这个问题，在LeetCode中有另外一种解法，但是阅读后发现其需要处理的个别case太多，相比而言没有本文所介绍的算法简洁。如果想要了解，给出链接：http://leetcode.com/2011/03/median-of-two-sorted-arrays.html。
作者：Chenny Chen
出处：http://www.cnblogs.com/XjChenny/
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。

分类: 数据结构与算法
查看全文

相关阅读:
jfixed使固定行列可编辑表格
 Base 64 加密、解密
 去除富文本格式
 阿里移动安全挑战赛第二题研究小结
 CyanogenMod源码下载、编译、刷机过程记录(HTC buzz)
编译民间安卓源码mokesoures4.2.2报错内容【解决了！】
Linux下通过NDK的初步使用【详细步骤+截图】
Linux下实现JNI期间发生的错误……【未解决】
C++调用Java方法时jvm.dll相关错误【每次记录完后都被瞬间解决了……】
JNI学习中——JVM错误：EXCEPTION_ACCESS_VIOLATION (0xc0000005)

原文地址：https://www.cnblogs.com/Leo_wl/p/3162751.html

寻找两个已序数组中的第k大元素

1、问题描述

2、算法一

3、算法二

4、扩展问题