有1到10000共10000个数,如果我从中随机拿走一个数,你如何知道我拿走了哪个?
相信很多人看过这道题,并知道答案,这几天和同事聊天时听到了这个问题,因为有过自己的思考过程,不妨记录下来。说是逻辑题,其实也算是一道算法题,同事先讲了下他被面试中的思维过程:
- 先把10000个数相乘,然后再将拿走一个数之后的9999个数相乘,两者相除即可。
这个算法是正确的,但是会有两个潜在的问题:- 如此多的数相乘,其范围必然会超出系统提供的数据类型支持,当然你可以实现自己的大数表示的算法,但那样性能必然有影响。
- 假设扩展一下题目,提供的数组中有0的话,乘法就不可用了。
- 针对前面提出的问题,同事想到了使用加法,先求出10000个数的和,再减去9999个数的和。
这样数据不会溢出,而且加法的效率比乘法也要高很多,即使数据中包含0,也没有任何问题。
然后就过关了,自己回去之后思考了一下,觉得还可以扩展,假设所有的数加起来之后仍然会溢出,那该如何处理,比如从1到(2^64-1),于是想到了位操作,与、或,异或中,要数异或最为神奇,代入一看,果然合适: 先将所有的数异或起来,然后将拿走一个数之后的数异或起来,两者结果再异或,便是拿走的那个数。
我用a,b,c,d4个数来做演示,因为异或符合结合律和交换律(你可以用0,1试一下),于是:
a^b^c^d = (a^b^c)^d
d = (a^b^c^d)^(a^b^c)
d = (a^b^c^d)^(a^b^c)
此处用异或的好处在于
- 不会溢出
- 异或的速度要快于加法
扩展一下题目,如果提供的不是整数,而是浮点数,会有问题吗?当然没有,因为是在位级别上操作,无论是整数还是浮点数,在这个算法看来,都是一堆位,处理起来没有什么差别。
再扩展一下题目,如果提供的数本身就超出了内置类型的表示范围,如在1到2^128,该如何处理?这个问题是在写这篇文章的过程中想到的,暂时没有好的办法。
(异或的确是挺神奇的一个操作,之后打算写一个memory-transaction管理的系列文章,也会提到用这个神奇的异或来实现undo-redo算法。)