349. 两个数组的交集
难度简单227
给定两个数组,编写一个函数来计算它们的交集。
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2]
示例 2:
输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[9,4]
说明:
- 输出结果中的每个元素一定是唯一的。
- 我们可以不考虑输出结果的顺序。
思考
一、使用Set求解
- HashSet在判断某个元素是否存在的效率是O(1)的。
- 将nums1存入set中,遍历nums2,如果set中存在数,则将该数加入另一个res。
- 取出res中的数即可。
public int[] intersection(int[] nums1, int[] nums2) {
Set<Integer> set = new HashSet<>();
Set<Integer> res = new HashSet<>();
for(int num : nums1) set.add(num); //[1,2,2,1] -> [1,2]
for(int num : nums2){
if(set.contains(num)) res.add(num);//[2]
}
int[]arr = new int[res.size()];
int index = 0;
for(int num : res) arr[index++] = num;
return arr;
}
时间复杂度:(O(M+N)),HashSet在判断某个元素是否存在的效率是O(1)的,构建集合需要其中一个数组长度时间M,遍历另一个需要N。
空间复杂度:(O(M+N)),需要两个集合长度的空间。
二、使用排序+双指针
- 双指针使用前提是两个数组已经有序。
public int[] intersection(int[] nums1, int[] nums2) {
Arrays.sort(nums1);
Arrays.sort(nums2);
Set<Integer> res = new HashSet<>();
int i = 0, j = 0;
while(i < nums1.length && j < nums2.length){
if(nums1[i] == nums2[j]){
res.add(nums1[i]);
i++;j++;
}else if(nums1[i] < nums2[j]){
i++;
}else{
j++;
}
}
int[] arr = new int[res.size()];
int index = 0;
for(int num : res) arr[index++] = num;
return arr;
}
时间复杂度:(O(2NlogN + max(N,M))),排序的时间复杂度是 (NlogN),双指针N。
空间复杂度:(O(N))
350. 两个数组的交集 II
给定两个数组,编写一个函数来计算它们的交集。
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2,2]
示例 2:
输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[4,9]
说明:
- 输出结果中每个元素出现的次数,应与元素在两个数组中出现次数的最小值一致。
- 我们可以不考虑输出结果的顺序。
进阶:
- 如果给定的数组已经排好序呢?你将如何优化你的算法?
- 如果 nums1 的大小比 nums2 小很多,哪种方法更优?
- 如果 nums2 的元素存储在磁盘上,内存是有限的,并且你不能一次加载所有的元素到内存中,你该怎么办?
思考
一、排序+双指针
其实在排序情况下,直接将set改成list就可以了。
二、哈希计数
- 遍历第一个数组,在哈希表中记录出现的数字和出现的次数。
- 遍历第二个数组,如果哈希表中存在这个数,加入答案,并减少哈希表中数字出现的次数。
- 为了降低空间复杂度,首先遍历较短的的数组并记录出现的次数。
public int[] intersect(int[] nums1, int[] nums2) {
if (nums1.length > nums2.length) {
return intersect(nums2, nums1);
}
Map<Integer, Integer> map = new HashMap<Integer, Integer>();
for (int num : nums1) {
map.put(num, map.getOrDefault(num, 0) + 1);
}
int[] res = new int[nums1.length];
int index = 0;
for (int num : nums2) {
int count = map.getOrDefault(num, 0);
if (count > 0) {
res[index++] = num;
count--;
if (count > 0) {
map.put(num, count);
} else {
map.remove(num);
}
}
}
return Arrays.copyOfRange(res, 0, index);
}
时间复杂度:(O(m+n)),其中 m 和 n 分别是两个数组的长度。需要遍历两个数组并对哈希表进行操作,哈希表操作的时间复杂度是 (O(1)),因此总时间复杂度与两个数组的长度和呈线性关系。
空间复杂度:(O(min(m,n))),其中 m 和 n 分别是两个数组的长度。对较短的数组进行哈希表的操作,哈希表的大小不会超过较短的数组的长度。为返回值创建一个数组 res,其长度为较短的数组的长度。
如果nums2的元素存储在磁盘上,内存非常小,不足以将数组全部载入内存,此时会出现两种情况:
- nums1数据量很小,可以完全加载到内存中,使用哈希计数,然后逐步从磁盘扫描nums2。
- nums1数据量很大,两者都无法加载到内存中,这时需要使用外部排序【归并排序】,将分割后的子数组写到单个文件中,归并时将小文件合并为更大的文件。