算法内容来源于网络,本人增加对算法的证明。
百度面试题:现在有一个数组,已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数。
答案1:
创建一个hash_map,key为数组中的数,value为此数出现的次数。遍历一遍数组,用hash_map统计每个数出现的次数,并用两个值存储目前出现次数最多的数和对应出现的次数。
这样可以做到O(n)的时间复杂度和O(n)的空间复杂度,满足题目的要求。
但是没有利用“一个数出现的次数超过了一半”这个特点。也许算法还有提高的空间。
答案2:
使用两个变量A和B,其中A存储某个数组中的数,B用来计数。开始时将B初始化为0。
遍历数组,如果B=0,则令A等于当前数,令B等于1;如果当前数与A相同,则B=B+1;如果当前数与A不同,则令B=B-1。遍历结束时,A中的数就是要找的数。
这个算法的时间复杂度是O(n),空间复杂度为O(1)。
算法2证明:采用反证法。
假设超过一般的数为x,采用算法2最终得到的结果为y(y!=x),从k+1位置(数组元素从1开始)开始,A一直是y。
则[1,k]元素中含有x的个数n(x) <= k/2,
[k+1, n]元素中含有x的个数l(x) = total(x) - n(x) >= (n+1)/2 - k/2 > (n-k)/2
因此在[k+1, n]中,x的个数超过了一半,A的最后结果不可能是y。
因此假设不成立,所以y=x。