作为通信工程的学生,我在学习《信息论与编码》这门课的时候了解过关于加密解密的一些知识,但觉得不够深入,不甚过瘾。
这几天学习了跟密码学有很大关联的哈希算法,跟大家分享一下。
哈希算法是什么
哈希,英文为Hash,有时翻译为散列,所以哈希函数又叫做散列函数。度娘的解释是“
哈希函数的运算结果就是哈希值,通常简称为哈希。
哈希算法的特点
哈希算法应该具备三个基本点:
1.独一无二,两个不同的数据,要有不相同的哈希
2.安全,给定数据M容易算出哈希值X,给定X不可算出M(单向算法)
3.长度固定,给定一种哈希算法,不管输入多大数据,输出长度固定
*当然,安全性只是相对而言,因为输入取值范围无限而哈希长度固定的话,如果输入足够庞大,肯定会找到两个一样的哈希值
假如出现了两个不同输入有相同输出的情况,称为碰撞(collision)。不同的哈希算法,位数越多,则安全级别越高,或者说抗碰撞性越好。
哈希算法的作用
哈希的独一无二保证了:如果数据在存储或传输过程中有丝毫损坏,那它的哈希就会改变。哈希函数最常见的一个作用就是进行完整性校验(Integrity Check),完成即数据无损坏。哈希函数的基本作用是给大数据算出一个摘要性的长度固定的字符,即哈希。
哈希也可以叫做Checksum(校验值)、Digest(摘要)、Fingerprint(指纹),大抵是一个意思:哈希可以代表数据本身。
哈希算法的分类与区别
总体上分为两类:普通哈希;加密哈希(cryptographic hash function)
加密哈希跟普通哈希的区别就是安全性,一般原则是只要一种哈希算法出现过碰撞,就会不被推荐成为加密哈希了,只有安全度高的哈希算法才能用作加密哈希。
在密码学领域,有两个算法都是把数据做输入,而输出是一段谁也看不懂的数据。其中一个就是哈希算法,另外一个是加密算法。注意,哈希算法和加密算法是完全不同的。
哈希算法的输出长度是固定的,而加密算法的输出长度是跟数据本身长度直接相关的。
哈希是不可以逆向运算出数据的,而加密算法的输出是要能够逆向运算出数据的。
这里主要是强调加密哈希算法只是被用在加密过程中,但是它本身不是加密算法。
哈希算法的应用
主要应用大场景有两个:
1、网站注册
2、区块链和加密货币
哈希的基本作用就是提供一个数据的摘要或者指纹,通常的使用场景就是完整性校验。哈希算法有很多种,一般来讲哈希越长的算法,安全性也就越高,安全度足够高的哈希,或者说没有任何人能够成功实现碰撞的哈希,才有资格被考虑用在加密场合,而这类的哈希算法也被叫做加密哈希算法。