基础学习:C#中float的取值范围和精度

zoukankan html css js c++ java

基础学习:C#中float的取值范围和精度

float类型的表现形式：

默认情况下，赋值运算符右侧的实数被视为 double。因此，应使用后缀 f 或 F 初始化浮点型变量，如以下示例中所示：

float x = 3.5F;

如果在以上声明中不使用后缀，则会因为您尝试将一个 double值存储到 float 变量中而发生编译错误。

float的取值范围

float占用4个字节,和int是一样,也就是32bit.

1bit（符号位） 8bits（指数位） 23bits（尾数位）

存储方式如下图：

取值范围基本表达法

（浮点）数值 = 尾数 × 底数 ^ 指数，（附加正负号）----------------

于是，float的指数范围为-127~128，而double的指数范围为-1023~1024，并且指数位是按补码的形式来划分的。其中负指数决定了浮点数所能表达的绝对值最小的数；而正指数决定了浮点数所能表达的绝对值最大的数，也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128，也即-3.40E+38 ~ +3.40E+38；double的范围为-2^1024 ~ +2^1024，也即-1.79E+308 ~ +1.79E+308。

其他特殊表示

1.当指数部分和小数部分全为0时,表示0值,有+0和-0之分(符号位决定),0x00000000表示正0,0x80000000表示负0. 2.指数部分全1,小数部分全0时,表示无穷大,有正无穷和负无穷,0x7f800000表示正无穷,0xff800000表示负无穷. 3.指数部分全1,小数部分不全0时,表示NaN,分为QNaN和SNaN,Java中都是NaN.

结论: 可以看出浮点数的取值范围是:2^(-149)~~(2-2^(-23))*2^127,也就是Float.MIN_VALUE和Float.MAX_VALUE.

精度

float和double的精度是由尾数的位数来决定的。浮点数在内存中是按科学计数法来存储的，其整数部分始终是一个隐含着的“1”，由于它是不变的，故不能对精度造成影响。

float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字；

查看全文

相关阅读:
GithubPlus+PicGo + Typora 一键式图床
 快速掌握Linux这篇文章就够了。
跨行程序员Java进阶--基础语法
 Prometheus(普罗米修斯)
【学习记录】Golang
服务器Docker-Compose 安装 Anaconda
Kubernetes集群部署
 Jenkins部署
 Harbor部署
 Docker、Docker-Compose的安装以及相关使用

原文地址：https://www.cnblogs.com/gc2013/p/4078498.html