zoukankan      html  css  js  c++  java
  • hashmap里面hash计算疑问点

    hashmap里面计算hash和放入数组中的计算疑问点:

    static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

    1:疑问一,为什么计算不用% ,而是这么写的  i = (n - 1) & hash

    今天重点:为什么 hash & (n - 1) = hash % n ??

    3556516 转化成二进制是 11 0110 0100 0100 1010 0100

    3556516 & 7 结果是,二进制的后三位

    3556516 % 8结果也是,二进制的后三位

    先说说 3556516 & 7 =二进制的后三位

    7=23-1,二进制,最后三位是1,其余全部是0(前面说过,n是2的次方,n-1的二进制一定满足,后面全是1,前面全是0)

    & 运算的性质,两者同是1得1,否则得0,

    那细想下,3556516 & 7,得到的不就是3556516的二进制的后三位么。这个不懂仔细想想,画画。

    至此,3556516 & 7 结果是,二进制的后三位这个就讲完了,

    即 3556516 & 7= 4(也就是3556516 二进制的最后三位100)

    再说说3556516 % 8=二进制的后三位
    先看这两个式子

    这两个式子,相信大家应该能看懂,20 % 8,把20分成两部分,一部分能整除8,另一部分小于8,肯定就是余数了。

    20的二进制 = 10100

    二进制转化十进行是这么计算的

    10100 = 1 * 24 + 0 * 23 + 1 * 22 + 0 * 21 + 0 * 20 = (1 * 24 + 0 * 23) + (1 * 22 + 0 * 21 + 0 * 20)

    20 % 8 = (16 + 4)% 8 = 4 如果这个你懂了的话,上面那上二进制的式子中,第一个括号里的肯定能被8整除,第二个括号里的就是余数。

    即:20 % 8 = 二进制10100的后三位。3556516 % 8=二进制的后三位是一个道理。

    好了,费了这么大的劲儿,终于解释了

    hash & (n - 1) = hash % n

    为什么用hash & (n - 1) ,而不是用 hash % n
    HashMap 中的哈希函数 hash & (n - 1) 跟取余运算 hash % n 结果是一致的。那它为什么不直接用取余运算呢?

    答案两个字——性能。
    ————————————————

    原文链接

    2:疑问二,hash(Object key)原理,为什么(hashcode >>> 16)

    由于和(length-1)运算,length 绝大多数情况小于2的16次方。所以始终是hashcode 的低16位(甚至更低)参与运算。要是高16位也参与运算,会让得到的下标更加散列。

    所以这样高16位是用不到的,如何让高16也参与运算呢。所以才有hash(Object key)方法。让他的hashCode()和自己的高16位^运算。

    所以(h >>> 16)得到他的高16位与hashCode()进行^运算

    为什么用^而不用&和|

    因为&和|都会使得结果偏向0或者1 ,并不是均匀的概念,所以用^。

    这就是为什么有hash(Object key)的原因。

    补充一些 为什么0和1结果用^ 更均匀

    1. 0000 0100 1011 0011 1101 1111 1110 0001
    2.  >>> 16
    3. 0000 0000 0000 0000 0000 0100 1011 0011

    hashcode为int类型,4个字节32位,为了确保散列性,肯定是32位都能进行散列算法计算是最好的。

    首先要明白,为什么用亦或计算,二进制位计算,a 只可能为0,1,b只可能为0,1。a中0出现几率为1/2,1也是1/2,b同理。

    位运算符有三种,|,&,……,或,与,亦或。 a,b进行位运算,有4种可能 00,01,10,11 a或b计算 结果为1的几率为3/4,0的几率为1/4 a与b计算 结果为0的几率为3/4,1的几率为1/4, a亦或b计算 结果为1的几率为1/2,0的几率为1/2 所以,进行亦或计算,得到的结果肯定更为平均,不会偏向0或者偏向1,更为散列。

    右移16位进行亦或计算,我将其拆分为两部分,前16位的亦或运算,和后16位的亦或运算, 后16位的亦或运算,即原hashcode后16位与原hashcode前16位进行亦或计算,得出的结果,前16位和后16位都有参与其中,保证了 32位全部进行计算。 前16位的亦或运算,即原hasecode前16位与0000 0000 0000 0000进行亦或计算,结果只与前16位hashcode有关,同时亦或计算,保证 结果为0的几率为1/2,1的几率为1/2,也是平均的。

    所以为什么是右移16位,个人觉得博主说的原因是一部分, 也有一个原因是右移16位进行亦或计算的结果中, (1)结果的后16位保证了hashcode32位全部参与计算,也保证了0,1平均,散列性 (2)结果的前16位保证hashcode前16位了0,1平均散列性,附带hashcode前16位参与计算。 (3) 16与16位数相同,利于计算,不需要补齐,移去位数数据 更多情况,hashmap只会用到前16位(临时数据一般不会这么大),所以(1)占主因


    原文链接

  • 相关阅读:
    eslint 屏蔽html的检查
    css 自定义悬浮窗写法
    echarts象形图图例显示问题
    win10上rocketMQ的部署过程
    死锁以及如何避免死锁
    volatile的一个例子-通俗易懂
    Java四种引用类型
    记录下:安全|API接口安全性设计(防篡改和重复调用)
    了解聚集索引,非聚集索引,联合索引,索引覆盖
    mybatis 查询树形结构
  • 原文地址:https://www.cnblogs.com/liran123/p/15347824.html
Copyright © 2011-2022 走看看