MD5消息摘要算法,属于Hash算法一类。MD5算法对输入任意长度的消息进行运行,产生一个128位的消息摘要。
算法原理:
1、数据填充
对消息进行数据填充,使消息的长度对512取模得448,设消息的长度为X,即满足X mod 512 = 448。根据此公式得到需要填充的数据长度。
填充的方法:在消息后面进行填充,填充的第一位是1,其余为0。
2、添加消息长度
在第一步结果之后再填充上原消息的长度,可用来进行的存储长度为64位。如果消息长度大于264,则只使用其低64位的值,即(消息长度 对 264取模)。
在此步骤进行完毕后,最终消息长度就是512的整数倍。
3、数据处理
需要准备用到的数据:
- 4个常数:A = 0x67452301, B = 0x0EFCDAB89, C = 0x98BADCFE, D = 0x10325476;
- 4个函数:F(X,Y,Z)=(X & Y) | ((~X) & Z); G(X,Y,Z)=(X & Z) | (Y & (~Z)); H(X,Y,Z)=X ^ Y ^ Z; I(X,Y,Z)=Y ^ (X | (~Z));
把消息分以512位为一分组进行处理,每一个分组进行4轮变换,以上面所说4个常数为起始变量进行计算,重新输出4个变量,以这4个变量再进行下一分组的运算,如果已经是最后一个分组,则这4个变量为最后的结果,即MD5值。
图中,A,B,C,D就是哈希值的四个分组。每一次循环都会让旧的ABCD产生新的ABCD.一共进行了多少次循环?由处理后的原文长度决定。
假设处理后的原文长度为M
主循环次数为M
每个主循环中包含了512/32 * 4 = 64次子循环。
下面对图中的其他元素解释:
1、绿色F
在主循环下面64次子循环中,F、G、H、I 交替使用,第一个16次使用F,第二个16次使用G,第三个16次使用H,第四个16次使用I。
2、红色田字
很简单,红色的田字代表相加的意思。
3、Mi
Mi是第一步处理后的原文。在第一步中,处理后原文的长度是512的整数倍。把原文的每512位再分成16等份,命名为M0~M15,每一等份长度32。在64次子循环中,每16次循环,都会交替用到M1~M16之一。
4、Ki
一个常量,在64次子循环中,每一次用到的常量都是不同的。