参考:
Comparing floating point numbers
总结几点:
0. float占4byte,精度是6~7位;double占8byte,精度是15~16位。
1. C/C++的浮点数据类型有float和double两种。它们在内存中是以科学计数法的结果来存储的。
类型float大小为4字节,即32位,内存中的存储方式如下:
符号位(1 bit) |
指数(8 bit) |
尾数(23 bit) |
类型double大小为8字节,即64位,内存布局如下:
符号位(1 bit) |
指数(11 bit) |
尾数(52 bit) |
符号位决定浮点数的正负,0正1负。
指数和尾数均从浮点数的二进制科学计数形式中获取。
2. 关于比较大小
一般情况下用一个absolute epsilon value来比较(if (fabs(result - expectedResult) < 0.00001))就够了。但是在某些对数字精度有特殊要求的domain,比如graphic,需要用更合理的方法。具体,参见引用文献2.
Comparing for equality
Comparing with epsilon – absolute error
Comparing with epsilon – relative error