- 哈希表充分体现了算法设计领域的经典思想:空间换区时间
- 哈希表是时间和空间之间的一个平衡
- 哈希函数的设计很重要
- 键通过哈希函数得到索引分布均匀
哈希函数的设计:
1.键通过哈希函数得到索引分布均匀:特殊领域的哈希函数设计方式甚至有专门的论文这个不考虑,我们只是设计最普通的函数设计:
- 整型:小范围的正整数直接使用,小范围的负整数进行偏移比如:-100-100可以偏移成0-200
- 大整数:身份证号:通常做法就是取模,比如,取出来后四位,等同于mod 10000,这种方式设计的哈希函数分布不均匀,还容易冲突,一个简单的方法就是:mod一个素数
- 浮点型:在计算机中都是32位或者64位的二进制的标识,只不过计算机解析成了浮点型,转成整型数字处理,还是用取模的方式
- 字符串:转成大的整型数字来处理。
哈希函数总结:上述设计方式都是转化成整型处理,并不是唯一的方法,
原则:
1.一致性:如果a == b,则hash(a) == hash(b)
2.高效性:计算高效简便
3.均匀性:哈希值均匀分布
2:JAVA中的hashCode方法:
package hash; /** * Created by admin on 2019/1/10. */ public class HashCode { public static void main(String[] args) { Integer a = 42; System.out.println(a.hashCode()); Integer b = -42; System.out.println(b.hashCode()); Double c = 3.141592653; System.out.println(c.hashCode()); String d = "airycode"; System.out.println(d.hashCode()); Student s = new Student(3,2,"bobo","bobo"); System.out.println(s.hashCode()); Student s2 = new Student(3,2,"BoBo","BoBo"); System.out.println(s2.hashCode()); } } package hash; /** * Created by admin on 2019/1/10. */ public class Student { int grade; int cls; String firstName; String lastName; public Student(int grade, int cls, String firstName, String lastName) { this.grade = grade; this.cls = cls; this.firstName = firstName; this.lastName = lastName; } @Override public int hashCode() { int B = 31; int hash = 0; hash = hash*B+grade; hash = hash*B+cls; hash = hash*B+firstName.toLowerCase().hashCode();//BB 和bb是一个人 hash = hash*B+lastName.toLowerCase().hashCode(); return hash; } }
3:哈希函数冲突的处理:链地址法
java8之前,哈希表的实现,每个位置上对应的是一个链表。java8之后,数据量小的时候,还是链表,当哈希冲突达到一定的程度每个位置从链表转成红黑树。