zoukankan      html  css  js  c++  java
  • [转载]浅析为什么char类型的范围是 —128~+127

    http://blog.csdn.net/daiyutage/article/details/8575248

         在C语言中, signed char 类型的范围为-128~127,每本教科书上也这么写,但是没有哪一本书上(包括老师)也不会给你为什么是-128~127,这个问题貌似看起来也很简单容易, 以至于不用去思考为什么,不是有一个整型范围的公式吗:  -2^(n-1)~2^(n-1)-1   n为整型的内存占用位数,所以int类型32位 那么就是 -(2^31)~2^31 -1 即

       -2147483648~2147483647,但是为什么最小负数绝对值总比最大正数多1 ,这个问题甚至有的工作几年的程序员都模棱两可,因为没有深入思考过,只知道书上这么写。。于是,我不得不深入思考一下这个被许多人忽视的问题。。

        对于无符号整数,很简单,全部位都表示数值,比如 char型,8位,用二进制表示为0000 0000 ~ 1111 1111

      1111 1111 最大即为十进制255,所以 unsigned char 的范围为0~ 255,在这里普及一下2进制转十进制的方法, 二进制每一位的数值乘以它的位权(2^(n-1),n为自右向左的位),再相加,可得到十进制数,比如 :

    1111 1111 =1*2^7+1*2^6+1*2^5+1*2^4+1*2^3+1*2^2+1*2^1+1*2^0=127  。

       但是对于有符号整数,二进制的最高位表示正负,不表示数值,最高位为0时表示正数,为1时表示负数,这样一来,能表示数值的就剩下(n-1)位了,比如 char a= -1;   那么二进制表示就为 1 0000001,  1 表示为0 0000001 ,所以signed char 型除去符号位剩下的7位最大为1111 111 =127,再把符号加上,0 1111111=127 ,1 1111111= -127,范围应该为 -127~127 ,同理int类型也一样,但是问题出来了,教科书上是-128~127 啊,下面就剖析一下这个惊人的奇葩。。。

        再普及一下计算机内部整数存储形式,大家都知道计算机内部是以二进制来存贮数值的,无符号整数会用全部为来存储,有符号的整数,最高位当做符号位 ,其余为表示数值,这样貌似合理, 却带来一个麻烦,当进行加法时,1+1

           0000 0001

    +     0000 0001

    —————————

           0000  0010    ………………2 

    当相减时 1-1=?  由于计算机只会加法不会减法,它会转化为1+(-1) ,因此

          0000 0001

    +    1000 0001

    ____________________

              1000 0010     …………… -2    ,1-1= -2?  这显然是不对了,所以为了避免减法运算错误,计算机大神们发明出了反码,直接用最高位表示符号位的叫做原码, 上面提到的二进制都是原码形式,反码是原码除最高位其余位取反,规定:正数的反码和原码相同,负数的反码是原码除了符号位,其余为都取反,因此-1 的源码为 1 0000001 ,反码为 11111110, 现在再用反码来计算 1+(-1)

          0000 0001

    +    1111 1110

    ————————

          1111 1111       …………再转化为原码就是 1000 0000 = -0  ,虽然反码解决了相减的问题,却又带来一个问题,-0 ,既然0000 0000 表示 0,那么就没有 -0 的必要, 出现 +0= -0=0 ,一个0 就够了,为了避免两个0的问题,计算机大师们又发明了补码,补码规定: 整数的补码是其本身,负数的补码为其反码加一 ,所以,负数转化为反码需两个步骤, 第一,先转化为反码,第二: 把反码加一。。这样 -1 的补码为 1111 1111    ,1+(-1)

         0000 0001

    +   1111 1111

    ________________

      1  0000 0000  ……………………  这里变成了9位,由于char 为8位,最高位1 被丢弃 结果为0 ,运算正确

      再看, -0 :原码 1000 0000 的补码为1 0000 0000 ,由于char 是 八位 ,所以取低八位00000000,   +0 :原码为0000 00000 ,补码为也为 0000 0000 ,虽然补码0都是相同的,但是有两个0 ,既然有两个0 ,况且0既不是正数,也不是负数, 用原码为0000 0000表示就行了, 这样一来,有符号的char ,原码都用来表示-127~127 之间的数了,唯独剩下原码1000 0000 没有用,用排列组合也可以算出来,0???????,能表示2^7=128个数,刚好是0~127, 1???????,也能表示128个数,总共signed char 有256 个数,这与-127~127 中间是两个0 刚好吻合。。现在再来探讨一下关于剩下的那个1000 0000

    既然-127 ~0~ 127都有相应的原码与其对应,那么1000 0000 表示什么呢,当然是-128了,为什么是-128呢,网上有人说-0即1000 0000 与128的补码相同,所以用1000 0000表示-128,,这我实在是不敢苟同,或者说-128没有原码,只有补码1000 0000,胡扯,既然没有原码何来补码,还有说-128的原码与-0(1000 0000)的原码相同,所以可以用1000 0000表示-128,我只能说,回答的不要那么牵强, 原码1000 0000 与-128的原码实际上是不同的, 但为什么能用它表示-128进行运算,如果不要限制为char 型(即不要限定是8位),再来看,-128的原码:1 1000 0000 ,9位,最高位符号位,再算它的反码:10111 1111,进而,补码为: 1 1000 0000,这是-128的补码,发现和原码一样, 1 1000 00001000 0000 相同?如果说一样的人真是瞎了眼了,所以,-128的原码和-0(1000 000)的原码是不同的,但是在char 型中,是可以用1000 000 表示-128的,关键在于char 是8位,它把-128的最高位符号位1 丢弃了,截断后-128的原码为1000 000 和-0的原码相同,也就是说

    1000 0000  和-128丢弃最高位后余下的8位相同,所以才可以用-0 表示-128,这样,当初剩余的-0(1000 0000),被拿来表示截断后的-128,因为即使截断后的-128和char 型范围的其他数(-127~127)运算也不会影响结果, 所以才敢这么表示-128。

       比如 -128+(-1)

         1000 0000  ------------------丢弃最高位的-128

    +     1111  1111   -----------------   -1

    ________________

       10111  1111    ------------------char 取八位,这样结果不正确,不过没关系 ,结果-129本来就超出char型了,当然不能表示了。

        比如 -128+127

         1000 0000

      + 0111 1111

    ————————

         1111 1111 --------------  -1 结果正确, 所以,这就是为什么能用 1000 0000表示-128的原因。

      从而也是为什么char 是-128~127,而不是-127~127 ,short int 同样如此 -32768~32767  因为在16位中,-32768为原码为17位,丢弃最高位剩下的16为- 0 的原码相同。。。。

         还有一个问题:

         既然-128最高位丢弃了。那么

         char a=-128;  //在内存中以补码1 1000 0000 存储,但由于是char ,所以只存储 1000 0000

         printf("%d",a); //既然最高位丢弃了,输出时应该是1000 000 的原码的十进制数-0 ,但为什么能输出-128呢。

         还能打印出-128;

         我猜想是计算机内部的一个约定,就像float一样 ,能用23位表示24位的精度 ,因为最高位默认为1,到时候把23位取出再加 1便可。

        -128也是同样的原理,当数据总线从内存中取出的是1000 000 ,CPU会给它再添最高一位,变为1 1000 0000 这样才能转化为

       -128输出,不然1000 0000 如何输出?这当然是我的一种推断,具体怎么实现还得问CPU的设计者了。。。。

         再看一个例子:

          char a=-129;

          printf("%d",a)  ;    会输入多少??    结果为127 ,为什么呢? 

          -129在补码为10 0111 1111 只取后八位存储,即 0111 111 这个值刚好是127了,同理-130 截断后为126.....

    如此按模轮回,关于模就先不探讨了。。

          那么

          unsigned  char a=  -1;

         if( 1>a)   printf("大于");

          else  

              printf("小于");

          结果是什么呢?  出人意料的是:  小于,而不是大于,猫腻在你哪呢,还是存储问题:

         a为unsigned 无符号, 它的八位都用来存储数值, 没有符号位,编译器把 -1 转换为补码为 1111 1111,但由于是无符号,计算机会把 1111 11111 当做是无符号来对待 ,自然就是 2^8 -1  = 255 了,所以相当于是if( 1>255) 肯定是

     printf("小于");了。

  • 相关阅读:
    hdu 5007 水题 (2014西安网赛A题)
    hdu 1698 线段树(成段替换 区间求和)
    poj 3468 线段树 成段增减 区间求和
    hdu 2795 公告板 (单点最值)
    UVaLive 6833 Miscalculation (表达式计算)
    UVaLive 6832 Bit String Reordering (模拟)
    CodeForces 124C Prime Permutation (数论+贪心)
    SPOJ BALNUM (数位DP)
    CodeForces 628D Magic Numbers (数位DP)
    POJ 3252 Round Numbers (数位DP)
  • 原文地址:https://www.cnblogs.com/Benoly/p/3807173.html
Copyright © 2011-2022 走看看