异或是一种基于二进制的位运算,用符号XOR或者 ^ 表示,
其运算法则是对运算符两侧数的每一个二进制位,同值取0,异值取1。
它与布尔运算的区别在于,当运算符两侧均为1时,布尔运算的结果为1,异或运算的结果为0。
异或的性质
- 交换律:a ^ b = b ^ a
- 结合律:a ^ b ^ c = a ^ (b ^ c) = (a ^ b) ^ c
- d = a ^ b ^ c 可以推出 a = d ^ b ^ c
- 自反性:a ^ b ^ a = b
- x ^ x = 0, x ^ 0 = x
应用:
1.最早我们常见的就是交换两个数:
void exchange(int a, int b) { a ^= b; b ^= a; a ^= b; }
这里就用到了异或运算的自反性:
首先 a = a ^ b;
然后 b = a ^ b ^ b = a
然后 a = a ^ b ^ a = b
1-1000放在含有1001个元素的数组中,只有唯一的一个元素值重复,其它均只出现一次。每个数组元素只能访问一次,设计一个算法,将它找出来;不用辅助存储空间,能否设计一个算法实现?
解法一:将所有数加起来,减去1+2+...+1000的和。
这个算法已经足够完美了,相信出题者的标准答案也就是这个算法,唯一的问题是,如果数列过大,则可能会导致溢出。
解法二:异或就没有这个问题,并且性能更好。将所有的数全部异或,得到的结果与1^2^3^...^1000的结果进行异或,得到的结果就是重复数。
解法一很显然,解法二需要证明一下:
前面提到异或具有交换律和结合律,所以1^2^...^n^...^n^...^1000,无论这两个n出现在什么位置,都可以转换成为1^2^...^1000^(n^n)的形式。
其次,对于任何数x,都有x^x=0,x^0=x。
所以1^2^...^n^...^n^...^1000 = 1^2^...^1000^(n^n)= 1^2^...^1000^0 = 1^2^...^1000(即序列中除了n的所有数的异或)。
令,1^2^...^n^..^1000(序列中包含一个n)的结果为T
则1^2^..^n^..^n^..^1000(序列中包含2个n)的结果就是T^n。
T^(T^n)=n。
所以,将所有的数全部异或,得到的结果与1^2^3^...^1000的结果进行异或,得到的结果就是重复数。
一个数组存放若干整数,一个数出现奇数次,其余数均出现偶数次,找出这个出现奇数次的数?
这个其实是上一个题目的一个变形题目,最直接的办法还是和上面一样,就是把所有数异或 (奇数个异或是本身,偶数个是0)
使特定位的值取反 (mask中特定位置1,其它位为0 s=s^mask)
比如s = 1111,1010, mask = 1000, s = (1111,1010) ^ (0000,1000) = 1111,0010.
根据规律 x ^ 0 = x, x ^ x = 0, 可以看出,在每一位的运算也是这个规律的 bit ^ bit = 0, bit ^ 0 = bit. 所以当需要把特定位的值取反,把mask中的特定位置1,其他位置0,即可.
一个32位整数任意两个比特位交换的宏定义写法
#include <stdio.h> #define bswap(data, m, n) (data & (1 << m)) == (data & (1 << n)) ? data : data ^ ((1 << m) | (1 << n)) void main(void) { int data = 4; int m = 2, n = 3; //0000 0000 0000 0100 //exchange bit2 and bit3 //0000 0000 0000 1000 //8 printf("%d -> bswap(2, 3) -> %d ", data, bswap(data, m, n)); }
首先看这个宏定义三目运算符号的后半部分: data ^ ((1 << m) | (1 << n))
上面我们总结到把特定位置取反需要使用mask,在这里 ((1 << m) | (1 << n)) == mask,会有两个特定位置需要取反.假设m=4, n =2, mask = 1010, 第4位和第2位需要取反,其他位置保持不变,当data的第4位和第2位的值不同时,和mask进行^运算,正好这两位的值交换过来,比如
(0000,1000) ^ 1010 = 0000,0010. 但是若第4位和第2位的值相同时,则不能起到交换的效果,比如
(0000,1010) ^ 1010 = 0000,0000. 由或者是:
(0000,0000) ^ 1010 = 0000,1010. 所以当这两个比特位的值不相同时可以利用异或来进行比特位交换.当这两个比特位的值相同时,保持不变即可.
所以 由:
(data & (1 << m)) == (data & (1 << n)) ? data : data ^ ((1 << m) | (1 << n))