zoukankan      html  css  js  c++  java
  • 128 哈希函数

    原题网址:https://www.lintcode.com/problem/hash-function/description

    描述

    在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33,假设任何字符串都是基于33的一个大整数,比如:

    hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE 

                                  = (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE

                                  = 3595978 % HASH_SIZE

    其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。

    给出一个字符串作为key和一个哈希表的大小,返回这个字符串的哈希值。

    您在真实的面试中是否遇到过这个题?  

    说明

    For this problem, you are not necessary to design your own hash algorithm or consider any collision issue, you just need to implement the algorithm as described.

    样例

    对于key="abcd" 并且 size=100, 返回 78

    标签
    哈希表

     

    思路:哈希函数的实现算法题目已经给出了,照着实现就好。这题考察的是类似大数阶乘的数据溢出问题,如果直接将字符串转成整数再求余,emmm……一般会溢出。所以在将字符串逐个字符转成整数的过程中就应该取余防止数据过大。

    对于整数求模,(a * b) % m = a % m * b % m这个基本公式务必牢记。根据这个公式我们可以大大降低时间复杂度和规避溢出。 转载自此处

    具体实现方式可以从高位(权值大的)到低位(权值小的)依次转化,也可以从低位到高位依次转化,后者需要额外定义一个权值,每次循环时*33,权值也同样需要取余。

    AC代码(高位到低位):

    这种很好理解,result 是 HASH_SIZE 整数倍的那部分随着循环继续再乘以33(的幂)一定还是HASH_SIZE的整数倍,所以可以用求余运算剪掉这部分。

    class Solution {
    public:
        /**
         * @param key: A string you should hash
         * @param HASH_SIZE: An integer
         * @return: An integer
         */
        int hashCode(string &key, int HASH_SIZE) {
            // write your code here
         int n=key.size();
         if (n==0)
         {
             return 0;
         }
         long result=key[0];//注意数据类型是long,防止数据过大造成溢出;
         for (int i=1;i<n;i++)
         {
             result=result*33+key[i];
             result=result%HASH_SIZE;//及时求余防溢出;
         }
         return result;
        }
    };

    低位到高位代码:

    这种我的理解是,hashBase 同理上面的推理。至于result,其值一直在增大,超出HASH_SIZE整数倍的部分就可以舍弃。

     int hashCode(string &key, int HASH_SIZE)
     {
         int n=key.size();
         if (n==0)
         {
             return 0;
         }
         long result=0;//注意数据类型;
         long hashBase=1;//权值,注意数据类型;
         for (int i=n-1;i>=0;i--)
         {
             result=result+key[i]*hashBase;
             result=result%HASH_SIZE;//及时求余防溢出;
             hashBase=hashBase*33%HASH_SIZE;//及时求余防溢出;
         }
         return result;
     }

     

    参考:https://blog.csdn.net/nawuyao/article/details/50953557

    https://www.cnblogs.com/libaoquan/p/7217165.html

    https://www.jianshu.com/p/9a67268b5a94

    https://blog.csdn.net/outmain/article/details/51233385

    https://blog.csdn.net/ljlstart/article/details/48391799

     

     

     

  • 相关阅读:
    正则表达式,re模块
    序列化(pickle,shelve,json,configparser)
    unity 模型 材质 贴图 关系;着色器属性
    Unity 控制public/private 是否暴露给Inspector面板
    Unity局部坐标系与世界坐标系的区别
    Unity脚本中可以引用的类型
    Unity 脚本挂载位置
    Unity 获取坐标函数 坐标转换函数
    Unity 烘焙的2种方式
    Unity官方宣传片Adam 播放地址
  • 原文地址:https://www.cnblogs.com/Tang-tangt/p/9140858.html
Copyright © 2011-2022 走看看