zoukankan      html  css  js  c++  java
  • 统计二进制展开中数位1的个数的优化

    问题:

      对于任意的非负整数,统计其二进制展开中数位1的总数。


    解决:

      相关Blog:http://www.cnblogs.com/maples7/p/4324844.html

      在看这篇之前可以先看看上述这篇,这篇主要讨论其优化问题。

    常规解法:

    O(logn):

     1 int countOnes(unsigned int n)
     2 {
     3     int ones = 0;
     4     while (0 < n)
     5     {
     6         ones += (1 & n);
     7         n >>= 1;
     8     }
     9     return ones;
    10 }

    无非就是每次取其二进制展开最后一位,是1就计数。

    效率由位运算可知(右移一位等价于除以2),为 O(logn)。

    优化解法1:

    O(countOnes(n)):

     1 int countOnes1(unsigned int n)
     2 {
     3     int ones = 0;
     4     while (0 < n)
     5     {
     6         ones++;            // 计数(最后至少有一位为1)
     7         n &= n - 1;        // 清除当前最靠右的1
     8     }
     9     return ones;
    10 }

    解释如下:

    优化解法2:

    O(logW), W = O(logn) 为整数的位宽, 实际上就是 O(1) 的算法

    代码及解释:

    这个算法是一种合并计数器的策略。把输入数的32Bit当作32个计数器,代表每一位的1个数。然后合并相邻的2个“计数器”,使i成为16个计数器,每个计数器的值就是这2个Bit的1的个数;继续合并相邻的2个“计数器“,使i成为8个计数器,每个计数器的值就是4个Bit的1的个数。。依次类推,直到将i变成一个计数器,那么它的值就是32Bit的i中值为1的Bit的个数。

    实际上还是二分的思想,把一位一位计数变成二分的计数,使 O(logn) 变成了 O(loglogn)。

    为了理解起来方便,代码可简化为:

     1 int BitCount4(unsigned int n) 
     2 { 
     3     n = (n &0x55555555) + ((n >>1) &0x55555555) ; 
     4     n = (n &0x33333333) + ((n >>2) &0x33333333) ; 
     5     n = (n &0x0f0f0f0f) + ((n >>4) &0x0f0f0f0f) ; 
     6     n = (n &0x00ff00ff) + ((n >>8) &0x00ff00ff) ; 
     7     n = (n &0x0000ffff) + ((n >>16) &0x0000ffff) ; 
     8 
     9     return n ; 
    10 }

    其他的一些有助于理解的解释有:

    本段讲解来源:http://www.sandy-sp.com/blog/article.asp?id=11

    说简单点,就是一个 错位分段相加,然后递归合并的过程 。

    下面是细节分析:

    首先先看看那些诡异的数字都有什么特点:
    0x5555……这个换成二进制之后就是0101010101010101……
    0x3333……这个换成二进制之后就是0011001100110011……
    0x0f0f……...这个换成二进制之后就是0000111100001111……
    看出来点什么了吗?
    如果把这些二进制序列看作一个循环的周期序列的话,

    那么第一个序列的周期是2,每个周期是01,第二个序列的周期是4,每个周期是0011,第三个的周期是8,每个是00001111……

    这样的话,我们可以看看如果一个数和这些玩意相与之后的结果:

    整个数按照上述的周期被分成了n段,每段里面的前半截都被清零,后半截保留了数据。不同在于这些数分段的长度是2倍增长的。于是我们可以姑且命名它们为“分段截取常数”。

    这样,如果我们按照分段的思想,每个周期分成一段的话,你或许就可以感觉到这个分段是二分法的倒过来——类似二段合并一样的东西!


    现 在回头来看问题,我们要求的是1的个数。这就要有一个清点并相加的过程(查表法除外)。使用&运算和移位运算可以帮我们找到1,但是却无法计算1 的个数,需要由加法来完成。最传统的逐位查找并相加,每次只加了1位,显然比较浪费,我们能否一次用加法来计算多次的位数呢?

    再考虑问题,找到了1的位置,如何把这个位置变成数量。最简单的情况,一个2位的数,比如11,只要把它的第二位和第一位相加,不就得到了1的个数了吗?!所以对于2位的x,有x中1的个数=(x>>1)+(x&1)。是不是和上面的式子有点像?

    再考虑稍复杂的,一个字节内的情况。
    一个字节的x,显然不能用(x>>1)+(x&1)的方法来完成,但是我们受到了启发,如果把x分段相加呢?把x分成4个2位的段,然后相加,就会产生4个2位的数,每个都代表了x对应2位地方的1的个数。

    例子一:(来源:http://www.sandy-sp.com/blog/article.asp?id=11)


    例子,若求156中1的个数,156二进制是10011100
    最终:

    [1][0][0][1][1][1][0][0] //初始,每一位是一组
    ---
    |0  0 |0  1 |0  1 |0  0|  //与01010101相与的结果,同时2个一组分组
    +
    |0  1 |0  0 |0  1 |0  0|  //右移一位后与01010101相与的结果
    =
    [0  1][0  1][1  0][0  0]  //相加完毕后,现在每2位是一组,每一组保存的都是最初在这2位的1的个数
    ----
    |0  0  0  1 |0  0  0  0|  //与00110011相与的结果,4个一组分组
    +
    |0  0  0  1 |0  0  1  0|  //右移两位后与00110011相与的结果
    =
    [0  0  1  0][0  0  1  0] //相加完毕后,现在每4位是一组,并且每组保存的都是最初这4位的1的个数
    ----
    |0  0  0  0  0  0  1  0|
    +
    |0  0  0  0  0  0  1  0|
    =
    [0  0  0  0  0  1  0  0] //最终合并为8位1组,保存的是整个数中1的个数,即4。

    再举一个例子:(来源:http://www.cnblogs.com/xianghang123/archive/2011/08/24/2152408.html)

    比如这个例子,143的二进制表示是10001111,这里只有8位,高位的0怎么进行与的位运算也是0,所以只考虑低位的运算,按照这个算法走一次

    +---+---+---+---+---+---+---+---+
    | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |   <---143
    +---+---+---+---+---+---+---+---+
    |  0 1  |  0 0  |  1 0  |  1 0  |   <---第一次运算后
    +-------+-------+-------+-------+
    |    0 0 0 1    |    0 1 0 0    |   <---第二次运算后
    +---------------+---------------+
    |        0 0 0 0 0 1 0 1        |   <---第三次运算后,得数为5
    +-------------------------------+

    这里运用了分治的思想,先计算每对相邻的2位中有几个1,再计算每相邻的4位中有几个1,下来8位,16位,32位,因为2^5=32,所以对于32位的机器,5条位运算语句就够了。

    像这里第二行第一个格子中,01就表示前两位有1个1,00表示下来的两位中没有1,其实同理。再下来01+00=0001表示前四位中有1个1,同样的10+10=0100表示低四位中有4个1,最后一步0001+0100=00000101表示整个8位中有5个1。



    再举一个例子:(来源:维基百科)

    例如,要计算二进制数 A=0110110010111010 中 1 的个数,这些运算可以表示为:

    符号 二进制 十进制 注释
    A 0110110010111010   原始数据
    B = A & 01 01 01 01 01 01 01 01 01 00 01 00 00 01 00 00 1,0,1,0,0,1,0,0 A 隔一位检验
    C = (A >> 1) & 01 01 01 01 01 01 01 01 00 01 01 00 01 01 01 01 0,1,1,0,1,1,1,1 A 中剩余的数据位
    D = B + C 01 01 10 00 01 10 01 01 1,1,2,0,1,2,1,1 A 中每个双位段中 1 的个数列表
    E = D & 0011 0011 0011 0011 0001 0000 0010 0001 1,0,2,1 D 中数据隔一位检验
    F = (D >> 2) & 0011 0011 0011 0011 0001 0010 0001 0001 1,2,1,1 D 中剩余数据的计算
    G = E + F 0010 0010 0011 0010 2,2,3,2 A 中 4 位数据段中 1 的个数列表
    H = G & 00001111 00001111 00000010 00000010 2,2 G 中数据隔一位检验
    I = (G >> 4) & 00001111 00001111 00000010 00000011 2,3 G 中剩余数据的计算
    J = H + I 00000100 00000101 4,5 A 中 8 位数据段中 1 的个数列表
    K = J & 0000000011111111 0000000000000101 5 J 中隔一位检验
    L = (J >> 8) & 0000000011111111 0000000000000100 4 J 中剩余数据的检验
    M = K + L 0000000000001001 9 最终答案

    From : 《数据结构习题解析》,邓俊辉

    Reference:

    1、http://blog.chinaunix.net/uid-21275705-id-224360.html

    2、http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetNaive

    3、http://www.cnblogs.com/graphics/archive/2010/06/21/1752421.html

  • 相关阅读:
    代码发布概述图
    gitPython模块
    django重点面试题
    paramiko模块
    Spring Security 注解
    JsonIgnoreProperties JsonIgnore导致RequestBody无法接受参数值
    Http和Rpc区别
    ExceptionHandler(思路参考CustomException)
    Linux安装Nginx
    秒杀扣除库存方案
  • 原文地址:https://www.cnblogs.com/maples7/p/4472208.html
Copyright © 2011-2022 走看看