1.Talk is cheap, show you my code.
Please pay attention to the remark.
package solutions.algorithms.interview.merge;
import java.util.Arrays;
/**
* 算法上下文:DC 、 DFS 、 BFS 、 DP 、 GD
* 语法分析三工具:状态机、文法、函数
* LeetCode三连
* 其中前三是字节三轮面试的算法题
* 中间两道也是某头部第一三轮面试的算法题
* 最后一道是阿里一面的算法(不跑测试用例,说思路)
* 均与分而治之相关
*/
public class MergeSolution {
/**
* 面试时是会可能让你手写测试用例,因此前期刷题根基不稳的情况可以考虑取巧,手写必然使你的代码输出结果符合预期的测试用例。
* @param strings
*/
public static void main(String[] strings) {
//测试1:有序二路归并
int[] num1 = {1, 3, 5, 0, 0};
int[] num2 = {2, 4, 6};
mergeTwoArrays(num1, num2, 3, 2);
System.out.println(Arrays.toString(num1));
//测试2:链表归并排序
ListNode node = new ListNode(3);
ListNode head = node;
node = node.next = new ListNode(5);
node = node.next = new ListNode(2);
node = node.next = new ListNode(4);
node = node.next = new ListNode(-3);
node = node.next = new ListNode(-133);
node = node.next = new ListNode(13);
System.out.println(mergeSortLinkedList(head));
num2 = new int[]{4,89,1,13,4,6};
quickSort(num2, 0, num2.length - 1);
System.out.println(Arrays.toString(num2));
//测试3:多路归并
int[][] ints = {
{1, 3, 5, 7, 9},
{2, 4, 6, 8, 10},
{11, 14, 16, 17, 19}
};
//测试3.1:降维+分治法
// System.out.println(Arrays.toString(mergeSort(ints, 0, ints.length - 1)));
//测试3.2:败者树归并
System.out.println(Arrays.toString(mergeSortByLoseTree(ints)));
int[] arr1 = {1, 3, 5, 7, 9};
int[] arr2 = {2, 4, 6, 8, 10};
//测试4:有序二路第K大数
System.out.println(kthMergeArrays(arr1, arr2, 7));
//测试5:有序二路中位数
System.out.println(middleVals(arr1, arr2));
//测试6:快速排序
int[] arrays = {4, 6, 7, 12, 5, 3, 2, 1, 7};
quickSort(arrays, 0, arrays.length - 1);
System.out.println(Arrays.toString(arrays));
}
/**
* 一个正序数组num1的有效元素长度为m,总长度为(m + n),
* 另一个正序数组num2的有效元素长度为n,总长度为n,
* 在num1上合并两个数组。
* 归并两个有序数组
* 1.常规做法:
* 构造一个新的大数组,用两指针分别指向两个子数组通过比较合并元素到新数组(二路归并思路),最后把大数组复制回数组1即可;
* 时间复杂度:O(n + m)
* 空间复杂度:O(n + m)
* 2.针对该题还有优化空间吗?
* 既然已经开辟了num1这个大数组的空间,其原意就是原地合并,所以可以考虑一下如何实现?
* 为了可以利用已经存在有效元素的数组1其余的空闲空间完成归并,可以考虑从数组末端完成归并。
* 时间复杂度:O(m + n)
* 空间复杂度:O(1)
* 如以下代码实现。
* @param num1
* @param num2
* @param m
* @param n
*/
public static void mergeTwoArrays(int[] num1, int[] num2, int m, int n) {
int p1 = m - 1, p2 = n - 1;
int i = m + n - 1;
while (p1 >= 0 && p2 >= 0) {
num1[i --] = num1[p1] > num2[p2] ? num1[p1 --] : num2[p2 --];
}
while (p1 >= 0) {
num1[i --] = num1[p1 --];
}
while (p2 >= 0) {
num2[i --] = num2[p2 --];
}
}
private static class ListNode {
int val;
ListNode next;
ListNode(int val) {
this.val = val;
}
@Override
public String toString() {
ListNode node = this;
StringBuilder builder = new StringBuilder();
while (null != node) {
builder.append(node.val).append("->");
node = node.next;
}
builder.append(node);
return builder.toString();
}
}
/**
* 给出一个单链表,以O(n log n)的时间复杂度完成排序
* 显然,这题是往排序方面去考虑,因为题目没有表示结点值的数据特征,所以只能往经典排序方向去找一种时间复杂度为O(log n)的排序算法。
* 主流的无非两种:快速排序和归并排序。
* 快速排序为啥不采纳?它的时间复杂度与枢纽元素的位置相关,所以并非稳定的O(n log n)的时间复杂度去考虑,而且需要两个方向相反的指针,题目给出的是单链表,使用它实现排序无疑是额外增加不少消耗。
* 故只能在链表上完成归并排序.
* 时间复杂度:O(n log n)
* 空间复杂度:O(n)
* @param node
* @return
*/
public static ListNode mergeSortLinkedList(ListNode node) {
if (null == node) {
return null;
}
if (null == node.next) {
return node;
}
ListNode head = node, slow = node, fast = node;
//快慢指针法找到中位结点,注意只有两个结点的时候要可以收敛才能跳出递归。
while (null != fast.next) {
fast = fast.next;
if (null == fast.next) {
break;
}
slow = slow.next;
fast = fast.next;
}
ListNode mid = slow.next;
slow.next = null;
ListNode list1 = mergeSortLinkedList(head);
ListNode list2 = mergeSortLinkedList(mid);
return mergeSort(list1, list2);
}
private static ListNode mergeSort(ListNode head, ListNode mid) {
//虚拟结点
ListNode node = new ListNode(0);
ListNode ret = node;
while (null != head && null != mid) {
if (head.val < mid.val) {
node = node.next = head;
head = head.next;
}else {
node = node.next = mid;
mid = mid.next;
}
}
if (null != head) {
node.next = head;
}
if (null != mid) {
node.next = mid;
}
return ret.next;
}
/**
* 三面:多路归并排序
* 给K个长度为N的有序数组,合并成一个有序数组。
* 我:最初给出对应K个数组的K个指针,通过指针指向元素比较得出当前最小值,最小值指针前移,填入返回数组中,遍历(kn)就得到结果,时间复杂度:O(k^2n)但是面试时面试官直接指出给错了复杂度。。
* 面试官:还有优化空间吗?
* 我:(错了后当场脑塞了一会)还有利用数组头元素构造有序,后面维护有序再逐一取出即可。(思路是对的,但傻上心头的时候直接说给它排序,被面试官说这样明显还增加了时间复杂度的。。)
* 最后我还是太妄自菲薄了,当场否掉了自己的想法。这部分自主惨败收尾。
* 面试官:应该用某个数据结构处理,下去再想吧。
* 我:..应该用最小堆!!(下线过了一会后)
* 事实上这是一个方法。用最小堆维护K路数组,用对应的当前指针指向元素维护堆结构,取最小值后将其用对应的下一个元素代替并调整堆,如若没有下一元素就把堆的大小减一,再从剩余元素取下一最小值。如果纯粹在内存考虑时间复杂度,遍历(kn)次,每次有log k的调整堆消耗,时间复杂度为 O(kn log k)
* 事后查了一下,还有另一种数据结构可以达到几乎一样的优化程度取最小值的,就是胜者树和败者树,都是树形选择排序的变形。
* 我:还有没有其他更优的办法?
* 我:这就是命了,其实这方法并不陌生,也是以前跟同事讨论过处理归并的一种方法,所以发挥这么差的一次经历后,我真的经历一次挺痛苦的复盘:不要错过以前经历过的任何细节。
* 当时讨论的背景其实是一个二维表,每行每列都有序,按顺序输出所有元素。这二维数组的每一行不就是相当于一个一维有序数组嘛,不就是等价K路归并...吗..。
* 当时我提出的思路就是在一维实施归并,把一维数组当成一个元素,降维处理成每两个数组实施二路归并。元素总遍历次数为
* k / 2 * n + k / 4 * 2n + k / 8 * 4n + ... + k / k * kn / 2 = kn/2 log k 次,相对最小堆和胜败树可以减半。但有利也有弊端:纯粹在内存排序才有优势; 如果应用于外部排序,会额外增加磁盘IO次数。
*
* @param arrs
* @param start
* @param end
* @return
*/
public static int[] mergeSort(int[][] arrs, int start, int end) {
if (start >= end) {
return arrs[end];
}
int mid = start + ((end - start) >>> 1);
int[] arr1 = mergeSort(arrs, start, mid);
int[] arr2 = mergeSort(arrs, mid + 1, end);
return mergeTwoArrays(arr1, arr2);
}
private static int[] mergeTwoArrays(int[] arr1, int[] arr2) {
int p1 = 0;
int p2 = 0;
int length1 = arr1.length;
int length2 = arr2.length;
int[] rs = new int[length1 + length2];
int r = 0;
while (p1 < length1 && p2 < length2) {
rs[r ++] = arr1[p1] <= arr2[p2] ? arr1[p1 ++] : arr2[p2 ++];
}
while (p1 < length1) {
rs[r ++] = arr1[p1 ++];
}
while (p2 < length2) {
rs[r ++] = arr2[p2 ++];
}
return rs;
}
/**
* 败者树示例
* @param arrs
* @return
*/
public static int[] mergeSortByLoseTree(int[][] arrs) {
int k = arrs.length;
if (k == 0) {
return new int[0];
}
int n = arrs[0].length;
int c = k * n;
int[] rs = new int[c];
//败者树,完全二叉树,可以用数组存储,存储败者元素下标
int[] loseTrees = new int[k];
int[] prs = new int[k];
int[] externals = new int[k + 1];
for (int i = 0; i < k; i++) {
externals[i] = arrs[i][prs[i]];
}
externals[k] = Integer.MIN_VALUE;
//建立败者树
for (int i = 0; i < k; i++) {
loseTrees[i] = k;
}
for (int i = (k - 1); i >= 0; i--) {
adjustLoseTrees(loseTrees, externals, i, k);
}
int i = 0;
int p;
//循环(kn)次填充当前最小值
while (i < c) {
p = loseTrees[0];
rs[i ++] = arrs[p][prs[p] ++];
externals[p] = prs[p] >= arrs[p].length ? Integer.MAX_VALUE : arrs[p][prs[p]];
adjustLoseTrees(loseTrees, externals, p, k);
}
return rs;
}
/**
* 维护败者树的调整操作
* @param loseTrees
* @param externals
* @param s
*/
private static void adjustLoseTrees(int[] loseTrees, int[] externals, int s, int k) {
int tmp;
//t是结点(s + k)(映射externals[s])的父结点
int t = s + ((k - s) >> 1);
while (t > 0) {
if (externals[s] > externals[loseTrees[t]]) {
tmp = s;
s = loseTrees[t];
loseTrees[t] = tmp;
}
t >>>= 1;
}
loseTrees[0] = s;
}
/**
* 一面:两个有序数组,求合并后的第K大元素。
* 面试官:有什么思路?
* 我:合并两个数组后取第K个元素。
* 面试官:复杂度怎么样?
* 我:设数组1长度为m,数组2长度为n,时间复杂度为O(m + n),空间复杂度为O(m + n);
* 面试官:还有优化空间吗?
* 我:纯粹需要找到第K大元素,可以用二路指针比较遍历找到第K大直接返回即可,时间复杂度为O(K),空间复杂度为O(1).(实际上当时差点懵了,因为觉得O(m + n)已经是线性复杂度,应该是最优了,差点不再尝试深层考虑)
* 面试官:实现一下。
* @param arr1
* @param arr2
* @param k
* @return
*/
public static int kthMergeArrays(int[] arr1, int[] arr2, int k) {
assert arr1 != null && arr2 != null && k >= 0;
int m = arr1.length;
int n = arr2.length;
//参数合法性校验
if (k > m + n) {
//不存在第K大
return -1;
}
int p1 = 0;
int p2 = 0;
int p = 0;
int t;
while (p1 < m && p2 < n) {
t = arr1[p1] < arr2[p2] ? arr1[p1 ++] : arr2[p2 ++];
if (++p == k) {
return t;
}
}
while (p1 < m) {
t = arr1[p1 ++];
if (++p == k) {
return t;
}
}
while (p2 < n) {
t = arr1[p2 ++];
if (++p == k) {
return t;
}
}
return -1;
}
/**
* 三面:两个正序数组,求两数组归并后的中位数元素。
* 面试官:说一下思路?
* 我:(想了一下。)可以用数组二路归并,归并到两数组总长度的一半时返回对应当前指针指向元素,即中位数。
* 面试官:空间上用了数组存储,还有优化空间吗?
* 我:(提示到我但当时还没接收到)我想想。
* 面试官:先给你20分钟实现一下。
* 我:(啪啪啪打起代码)...(写完了再检查)
* 面试官:中间这里的变量t1,t2什么意思?
* 我:刚刚您提示了我其实只需要返回中位数,就用了哨兵变量监视当前指针元素即可,到了中间长度返回即可。
* 面试官:面试完了。
* @param arr1
* @param arr2
* @return
*/
public static double middleVals(int[] arr1, int[] arr2) {
assert null != arr1 && null != arr2;
int m = arr1.length;
int n = arr2.length;
int total = m + n;
int limit = total >>> 1;
double rs = 0D;
int p1 = 0;
int p2 = 0;
//事实上可以省略,直接p1 + p2,但还要还原当时面试写法
int p = 0;
int t1 = -1, t2 = -1;
while (p1 < m && p2 < n) {
if (arr1[p1] < arr2[p2]) {
t1 = arr1[p1 ++];
}else {
t2 = arr2[p2 ++];
}
if (limit == ++ p) {
return (total & 1) == 0 ? (double)(t1 + t2) / 2 : Math.max(t1, t2);
}
}
while (p1 < m) {
t1 = arr1[p1 ++];
if (limit == ++ p) {
return (total & 1) == 0 ? (double)(t1 + t2) / 2 : Math.max(t1, t2);
}
}
while (p2 < n) {
t2 = arr2[p2 ++];
if (limit == ++ p) {
return (total & 1) == 0 ? (double)(t1 + t2) / 2 : Math.max(t1, t2);
}
}
return -1;
}
//---------------quickSort---------------------------------------------------
/**
* 快速排序
* @param arr
* @param start
* @param end
*/
private static void quickSort(int[] arr, int start ,int end) {
if (start >= end) {
return;
}
int partition = partition(arr, start, end);
quickSort(arr, start, partition - 1);
quickSort(arr, partition + 1, end);
}
private static int partition(int[] arr, int start, int end) {
int sp = start;
int ep = end;
int target = arr[sp];
while (sp < ep) {
while (sp < ep && arr[ep] >= target) {
ep --;
}
arr[sp] = arr[ep];
while (sp < ep && arr[sp] <= target) {
sp ++;
}
arr[ep] = arr[sp];
}
arr[sp] = target;
return sp;
}
}
2.
就一句提炼:归并排序的思想需要重点理清一下,抽象层面说它就是分而治之的一个入门典例。
现实情况:分治法,几乎是实际应用中多数非线性问题的重要解决思路。如上文,笔者四、五月时面试头部,前三轮都是归并。允许笔者大胆猜测一下,题库这类分治法的题目最近也是高频,当然大家可以一起集思广益,一起求证。希望大家可以收获自己满意的offer!