zoukankan      html  css  js  c++  java
  • 笔试题引出float数据的存储方式的深究

    笔试题:

    #include <iostream>
    #include <stdio.h>
    #include <string.h>
    #include <conio.h>
    using namespace std;

    int main()
    {
     float a = 1.0f;

     cout << sizeof(int) <<endl;//4
     cout << sizeof(float) <<endl;//4

     cout << (int)a << endl;//1
     cout << &a << endl; /*取a的地址十六进制0012FF7C*/
     cout << (int)&a << endl;/*(int)&a:把a的地址强制转换成十进制的整型1245052*/
     cout << (int&)a << endl;
     /*(int&)a:将a的引用强制转换为整型,意思是a所在的内存,本来定义的时候为float类型,并初始为1.0f,
     但现在我要按int类型解释这段内存(也就是说a所在的内存地址中的数据本来是按float型存储表示的,你非要按int型来解释不可)。
     1.0f   在内存中的存储为
     0   011   1111   1   000   0000   0000   0000   0000   0000.
     把他按整型数解释为2^29+2^28+2^27+2^26+2^25+2^24+2^23=1065353216

     (int&)a 相当于
        *(int*)&a

        *(int*)(&a)

        *((int*)&a)

     */     
     
     cout << boolalpha << ((int)a == (int&)a ) << endl;//   输出false.因为1!=1065353216.

     float b = 0.0f;
     cout << (int)b << endl;//0
     cout << &b << endl;/*取b的地址十六进制0012FF78*/
     cout << (int&)b << endl;//0
     cout << boolalpha << ((int)b == (int&)b ) << endl;//   输出true,因为0==0;

    /*
      (int&)a   不经过转换,   直接得到a在内存单元(就是地址)的值   
      (int)a     a在内存中的值转换成int类型   
        
      float类型在内存中存储的形式是   ,符号位   指数   尾数   
      由754标准:阶码采用增码(该数补码的反符号),尾数采用原码   
      所以1.0f   在内存中的形式为   
      0011   1111   1000   0000   0000   0000   0000   0000   
      所以输出的是   0x3f800000   
      0   在内存中的的存储形式   
      0000   0000   0000   0000   0000   0000   0000   0000 
    */

     return 0;
    }

    ========================c语言中FLOAT 是如何表示的====================

    c语言中FLOAT 是如何表示的?尾数,阶码是如何在32位上安排的,即哪几位是 
    尾数,哪几位是阶码,那一位是符号位。听说与CPU有关,是真的吗?

        在C++里,实数(float)是用四个字节即三十二位二进制位来存储的。其中
    有1位符号位,8位指数位和23位有效数字位。实际上有效数字位是24位,因为第
    一位有效数字总是“1”,不必存储。 
        有效数字位是一个二进制纯小数。8位指数位中第一位是符号位,这符号位和
    一般的符号位不同,它用“1”代表正,用”0“代表负。整个实数的符号位用“
    1”代表负,“0”代表正。 
        在这存储实数的四个字节中,将最高地址字节的最高位编号为31,最低地址
    字节的最低位编号为0,则实数各个部分在这32个二进制位中的分布是这样的:3
    1位是实数符号位,30位是指数符号位,29---23是指数位,22---0位是有效数字
    位。注意第一位有效数字是不出现在内存中的,它总是“1”。 
         
        将一个实数转化为C++实数存储格式的步骤为: 
        (1)先将这个实数的绝对值化为二进制格式,注意实数的整数部分和小数部
    分化为二进制的方法是不同的。 
        (2)将这个二进制格式实数的小数点左移或右移n位,直到小数点移动到第
    一个有效数字的右边。 
        (3)从小数点右边第一位开始数出二十三位数字放入第22到第0位。 
        (4)如果实数是正的,则在第31位放入“0”,否则放入“1”。 
        (5)如果n 是左移得到的,说明指数是正的,第30位放入“1”。如果n是右
    移得到的或n=0,则第30位放入“0”。 
        (6)如果n是左移得到的,则将n减去一然后化为二进制,并在左边加“0”
    补足七位,放入第29到第23位。如果n是右移得到的或n=0,则将n化为二进制后在
    左边加“0”补足七位,再各位求反,再放入第29到第23位。 
         
        将一个计算机里存储的实数格式转化为通常的十进制的格式的方法如下: 
        (1)将第22位到第0位的二进制数写出来,在最左边补一位“1”,得到二十
    四位有效数字。将小数点点在最左边那个“1”的右边。 
        (2)取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30
    位是“1”时将n增1。 
        (3)将小数点左移n位(当30位是“0”时)或右移n位(当30位是“1”时)
    ,得到一个二进制表示的实数。 
        (4)将这个二进制实数化为十进制,并根据第31位是“0”还是“1”加上正
    号或负号即可。

        特别地,实数0用C++的float格式表示是0000000000000000000000000000000
    0。 


    如果还不太明白,这里举几个例子。 
        一。将23.56化为C++的float格式。 
        (1)将23.56化为二进制后大约是“10111.1000111101011100001”。 
        (2)将小数点左移四位,得到“1.01111000111101011100001”。 
        (3)这已经有了二十四位有效数字,将最左边一位“1”去掉,得到“0111
    1000111101011100001”。将它放入第22到第0位。 
        (4)因为23.56是正数,因此在第31位放入“0”。 
        (5)由于我们把小数点左移,因此在第30位放入“1”。 
        (6)因为我们是把小数点左移4位,因此将4减去1得3,化为二进制,并补足
    七位得到0000011,放入第29到第23位。 
        完毕。 
        如果把最左边定为第31位,最右边定为第0位,那么在C++里,float格式的2
    3.56是这样表示的:01000001101111000111101011100001。相应地-23.56就是这
    样表示的:11000001101111000111101011100001。

        二。将实数0.2356化为C++的float格式。 
        (1)将0.2356化为二进制后大约是0.00111100010100000100100000。 
        (2)将小数点右移三位得到1.11100010100000100100000。 
        (3)从小数点右边数出二十三位有效数字,即11100010100000100100000放
    入第22到第0位。 
        (4)由于0.2356是正的,所以在第31位放入“0”。 
        (5)由于我们把小数点右移了,所以在第30位放入“0”。 
        (6)因为小数点被右移了3位,所以将3化为二进制,在左边补“0”补足七
    位,得到0000011,各位取反,得到1111100,放入第29到第23位。 
        完毕。因此0.2356用C++的float格式表示是:00111110011100010100000100
    100000。其中最左边一位是第31位,最右边一位是第0位。

        三。将实数1.0化为C++的float格式。 
        (1)将1.0化为二进制后是1.00000000000000000000000。 
        (2)这时不用移动小数点了,这就是我们在转化方法里说的n=0的情况。 
        (3)将小数点右边的二十三位有效数字00000000000000000000000放入第22
    到第0位。 
        (4)因为1.0是正的,所以在第31位里放入“0”。 
        (5)因为n=0,所以在第30位里放入“0”。 
        (6)因为n=0,所以将0补足七位得到0000000,各位求反得到1111111,放入
    第29到第23位。 
        完毕。所以实数1.0用C++的float格式表示是:0011111110000000000000000
    0000000。其中最左边一位是第31位,最右边一位是第0位。


        这是IEEE短实数格式,适合X86cpu。 

    补充其他:

    原码:

     
    如果机器字长为n,那么一个数的原码就是用一个n位的二进制数,其中最高位为符号位:正数为0,负数为1。剩下的n-1位表示概数的绝对值。
     
    例如: X=+101011 , [X]原= 00101011    X=-101011 , [X]原= 10101011 
    位数不够的用0补全。
     
    PS:正数的原、反、补码都一样:0的原码跟反码都有两个,因为这里0被分为+0和-0。
     
    反码:

    知道了什么是原码,那反码就更是张飞吃豆芽——小菜一碟了。知道了原码,那么你只需要具备区分0跟1的能力就可以轻松求出反码,为什么呢?因为反码就是在原码的基础上,符号位不变其他位按位取反(就是0变1,1变0)就可以了。

     

    例如:X=-101011 , [X]原= 10101011 ,[X]反=11010100

     

    补码:

     

    补码也非常的简单就是在反码的基础上按照正常的加法运算加1。

     

    例如:X=-101011 , [X]原= 10101011 ,[X]反=11010100,[X]补=11010101

     

    PS:0的补码是唯一的,如果机器字长为8那么[0]补=00000000。

     

    移码:

     

    移码最简单了,不管正负数,只要将其补码的符号位取反即可。

     

    例如:X=-101011 , [X]原= 10101011 ,[X]反=11010100,[X]补=11010101,[X]移=01010101

    ===================================================================

     在二进制科学表示法中,S=M*2^N 主要由三部分构成:符号位+阶码(N)+尾数(M)。对于float型数据,其二进制有32位,其中符号位1位,阶码8位,尾数23位;对于double型数据,其二进制为64位,符号位1位,阶码11位,尾数52位。

                    31        30-23       22-0

    float       符号位     阶码        尾数

                    63        62-52       51-0

    double    符号位     阶码        尾数

    符号位:0表示正,1表示负

    阶码:这里阶码采用移码表示,对于float型数据其规定偏置量为127,阶码有正有负,对于8位二进制,则其表示范围为-128-127,double型规定为1023,其表示范围为-1024-1023。比如对于float型数据,若阶码的真实值为2,则加上127后为129,其阶码表示形式为10000010

    尾数:有效数字位,即部分二进制位(小数点后面的二进制位),因为规定M的整数部分恒为1,所以这个1就不进行存储了。

    下面举例说明:

    float型数据125.5转换为标准浮点格式

    125二进制表示形式为1111101,小数部分表示为二进制为 1,则125.5二进制表示为1111101.1,由于规定尾数的整数部分恒为1,则表示为1.1111011*2^6,阶码为6,加上127为133,则表示为10000101,而对于尾数将整数部分1去掉,为1111011,在其后面补0使其位数达到23位,则为11110110000000000000000

    则其二进制表示形式为

    0 10000101 11110110000000000000000,则在内存中存放方式为:

    00000000   低地址

    00000000

    11111011

    01000010   高地址

    而反过来若要根据二进制形式求算浮点数如0 10000101 11110110000000000000000

    由于符号为为0,则为正数。阶码为133-127=6,尾数为11110110000000000000000,则其真实尾数为1.1111011。所以其大小为

    1.1111011*2^6,将小数点右移6位,得到1111101.1,而1111101的十进制为125,0.1的十进制为1*2^(-1)=0.5,所以其大小为125.5。

    同理若将float型数据0.5转换为二进制形式

    0.5的二进制形式为0.1,由于规定正数部分必须为1,将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为

    0 01111110 00000000000000000000000

    由上分析可知float型数据最大表示范围为1.11111111111111111111111*2^127=3.4*10^38

    对于double型数据情况类似,只不过其阶码为11位,偏置量为1023,尾数为52位。

  • 相关阅读:
    Flink SQL Client初探
    ansible快速部署cassandra3集群
    利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料)
    spark读取HDFS目录时报错Failed on local exception: com.google.protobuf.InvalidProtocolBufferException
    Spark学习进度-Spark环境搭建&Spark shell
    jquery获取select选中的值
    java零基础到架构师学习线路(附视频教程)
    plsql连接远程oracle数据库
    如何在通用异常处理时获取到方法名称(获取注解参数JoinPoint)
    java:找不到符号(使用lombok)
  • 原文地址:https://www.cnblogs.com/sunrunzhi/p/3640105.html
Copyright © 2011-2022 走看看