zoukankan      html  css  js  c++  java
  • 理解有符号数和无符号数

    http://www.cnblogs.com/lazycoding/archive/2011/03/21/unsigned-signed.html

    声明网上看到的文章,原文找不到了,原文被转载的不成样子,重复很多,整理花了很长时间,在翻看了维基百科后发现,原文中对于负数原码和补码存在一些问题,修改了一部分,原作者看到后可以联系我。

    1、你自已决定是否需要有正负。 

    就像我们必须决定某个量使用整数还是实数,使用多大的范围数一样,我们必须自已决定某个量是否需要正负。如果这个量不会有负值,那么我们可以定它为带正负的类型。 

    在计算机中,可以区分正负的类型,称为有符类型(signed),无正负的类型(只有正值),称为无符类型。 (unsigned)数值类型分为整型或实型,其中整型又分为无符类型或有符类型,而实型则只有符类型。 字符类型也分为有符和无符类型。 比如有两个量,年龄和库存,我们可以定前者为无符的字符类型,后者定为有符的整数类型。 

    2、使用二制数中的最高位表示正负。 

    首先得知道最高位是哪一位?1个字节的类型,如字符类型,最高位是第7位,2个字节的数,最高位是第15位,4个字节的数,最高位是第31位。不同长度的数值类型,其最高位也就不同,但总是最左边的那位(如下示意)。字符类型固定是1个字节,所以最高位总是第7位。 

    (红色为最高位) 

    单字节数: 11111111 

    双字节数: 11111111 11111111 

    四字节数: 11111111 11111111 11111111 11111111 

      当我们指定一个数量是无符号类型时,那么其最高位的1或0,和其它位一样,用来表示该数的大小。 

    当我们指定一个数量是无符号类型时,此时,最高数称为“符号位”。为1时,表示该数为负值,为0时表示为正值。 

      3、无符号数和有符号数的范围区别。 

    无符号数中,所有的位都用于直接表示该值的大小。有符号数中最高位用于表示正负,所以,当为正值时,该数的最大值就会变小。我们举一个字节的数值对比: 

    无符号数: 11111111    值:255

    1* 27 + 1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

    有符号数: 01111111    值:127         

    1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

     同样是一个字节,无符号数的最大值是255,而有符号数的最大值是127。原因是有符号数中的最高位被挪去表示符号了。并且,我们知道,最高位的权值也是最高的(对于1字节数来说是2的7次方=128),所以仅仅少于一位,最大值一下子减半。 

    不过,有符号数的长处是它可以表示负数。因此,虽然它的在最大值缩水了,却在负值的方向出现了伸展。我们仍一个字节的数值对比: 

    无符号数:                        0 ----------------- 255 

    有符号数:         -128 --------- 0 ---------- 127 

    同样是一个字节,无符号的最小值是 0 ,而有符号数的最小值是-128。所以二者能表达的不同的数值的个数都一样是256个。只不过前者表达的是0到255这256个数,后者表达的是-128到+127这256个数。 

    一个有符号的数据类型的最小值是如何计算出来的呢? 

    有符号的数据类型的最大值的计算方法完全和无符号一样,只不过它少了一个最高位(见第3点)。但在负值范围内,数值的计算方法不能直接使用1* 26 + 1* 25 的公式进行转换。在计算机中,负数除为最高位为1以外,还采用补码形式进行表达。所以在计算其值前,需要对补码进行还原。
    这里,先直观地看一眼补码的形式: 

    在10进制中:1 表示正1,而加上负号:-1 表示和1相对的负值。 

    那么,我们会很容易认为在2进制中(1个字节): 0000 0001 表示正1,则高位为1后:1000 0001应该表示-1。 

    然而,事实上计算机中的规定有些相反,请看下表: 

    二进制值(1字节)

    十进制值 

    10000000

    -128 

    10000001

     -127 

    10000010

    -126 

    10000011

     -125 

    ……

    ……

    11111110

    -2 

    11111111

    -1 


    首先我们看到,从-1到-128,其二进制的最高位都是1,正如我们前面的学。 负数最高为为1

    然后我们有些奇怪地发现,1000 0000 并没有拿来表示 -0;而1000 0001也不是拿来直观地表示-1。事实上,-1 用1111 1111来表示。 

    怎么理解这个问题呢?先得问一句是-1大还是-128大? 

    当然是 -1 大。-1是最大的负整数。以此对应,计算机中无论是字符类型,或者是整数类型,也无论这个整数是几个字节。它都用全1来表示 -1。比如一个字节的数值中:1111 1111表示-1,那么,1111 1111 - 1 是什么呢?和现实中的计算结果完全一致。1111 1111 - 1 = 1111 1110,而1111 1110就是-2。这样一直减下去,当减到只剩最高位用于表示符号的1以外,其它低位全为0时,就是最小的负值了,在一字节中,最小的负值是1000 0000,也就是-128。 

    我们以-1为例,来看看不同字节数的整数中,如何表达-1这个数: 

    字节数

    二进制值

     十进制值 

    单字节数

    11111111

     -1 

    双字节数

     11111111 11111111

     -1 

    四字节数

    11111111 11111111 11111111 11111111

     -1 


    可能有同学这时会混了:为什么 1111 1111 有时表示255,有时又表示-1?所以我再强调一下前面所说的第2点:你自已决定一个数是有符号还是无符号的。写程序时,指定一个量是有符号的,那么当这个量的二进制各位上都是1时,它表示的数就是-1;相反,如果事选声明这个量是无符号的,此时它表示的就是该量允许的最大值,对于一个字节的数来说,最大值就是255。 

     我们已经知道计算机中,所有数据最终都是使用二进制数表达。 也已经学会如何将一个10进制数如何转换为二进制数。 不过,我们仍然没有学习一个负数如何用二进制表达。 
    比如,假设有一 int 类型的数,值为5,那么,我们知道它在计算机中表示为: 

        00000000 00000000 00000000 00000101 

    5转换成二制是101,不过int类型的数占用4字节(32位),所以前面填了一堆0。 现在想知道,-5在计算机中如何表示? 在计算机中,负数以其正值的补码形式表达。 

    什么叫补码呢?这得从原码,反码说起。 

    原码:一个整数,按照绝对值大小转换成的二进制数,最高为为符号位,称为原码。 红色为符号位

    比如 00000000 00000000 00000000 00000101 是 5的 原码。 
          10000000 00000000 00000000 00000101  是-5的原码

     反码:将二进制除符号位数按位取反,所得的新二进制数称为原二进制数的反码。 正数的反码为原码,负数的反码是原码符号位外按位取反。 
     取反操作指:原为1,得0;原为0,得1。(1变0; 0变1) 

    正数:正数的反码与原码相同。

    负数:负数的反码,符号位为“1”,数值部分按位取反。

    比如:将10000000 00000000 00000000 00000101除符号位每一位取反,

            得11111111 11111111 11111111 11111010。 

    称:11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101 的反码。 

    反码是相互的,所以也可称: 

    11111111 11111111 11111111 11111010 和 10000000 00000000 00000000 00000101 互为反码。 

    补码:反码加1称为补码。 
    正数:正数的补码和原码相同。

    负数:按照规则来
    也就是说,要得到一个数的补码,先得到反码,然后将反码加上1,所得数称为补码。 

    11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101(-5) 的反码。 
    加1得11111111 11111111 11111111 11111011

    所以,-5 在计算机中表达为:11111111 11111111 11111111 11111011。转换为十六进制:0xFFFFFFFB。 

    再举一例,我们来看整数-1在计算机中如何表示。 

    假设这也是一个int类型,那么: 

    1、先取-1的原码:        10000000 00000000 00000000 00000001 

    2、除符号位取反得反码:11111111 11111111 11111111 11111110 

    3、加1得补码:            11111111 11111111 11111111 11111111 

    可见,-1在计算机里用二进制表达就是全1。16进制为:0xFFFFFF。 

    计算机中的带符号数用补码表示的优点: 

    1、负数的补码与对应正数的补码之间的转换可以用同一种方法——求补运算完成,可以简化硬件; 
    2、可将减法变为加法,省去减法器; 
    3、无符号数及带符号数的加法运算可以用同一电路完成。 

    可得出一种心算求补的方法——从最低位开始至找到的第一个1均不变,符号位不变,这之间的各位“求反”(该方法仅用于做题)。

    方法

    例1

    例2

    1. 从右边开始,找到第一个'1'

    10101001

    10101100

    2. 反转从这个'1'之后开始到最左边(不包括符号位)的所有位

    11010111

    11010100

     
     
    http://www.360doc.com/content/12/0907/00/495229_234737943.shtml
     
     
     

    1           无符号和有符号

    计算机中用补码表示负数,并且有一定的计算方式;另外,用二进制的最高位表示符号,0表示正数、1表示负数。这种说法本身没错,可是要有一定的解释,不然它就是错的,至少不能解释,为什么字符类型的-1二进制表示是“1111 111116进制表示为FF,而不是1000 0001

     

    在计算机中,可以区分正负的类型,称为有符号类型,无正负的类型,称为无符号类型。

     

    使用二进制中的最高位表示正负

    一个字节为8位,按0开始记,那它的最高位就是第7位,2个字节,最高位就是15位,4个字节,最高位是31位,不同长度的类型,最高为业不同,但总是最左边那位。

     
     
     

     

    无符号和有符号数的范围的区别

    无符号数中,所有的位都用于直接表示该值的大小;有符号数中最高位用于表示正负,所以,正值时,该数的最大值就会变小:

    无符号数:1111 1111 值:255=1*2^7+1*2^6+.....=2^n-1

    有符号数:0111 1111 值:127

     

    同样一个字节,无符号的最大值是255,有符号的最大值是127,下图是无符号数和有符号数的范围:

     

     
     
     

    一个由符号的数据类型的最大值的计算方法完全和无符号一样,只不过它少了一个最高位,但是在负数范围内,数值的计算方法不能直接使用前面的公式,在计算机种,负数除了最高位为1以外,还采用补码的形式,所以在计算前,需要对补码进行还原。

     

    10进制的计算经验,1表示正1-1表示和1相对的负值。那么很容易想到在二进制中,0000 0001表示正1,则高位为1后:1000 0001应该表示-1,不过实际上,计算机中的规定有些相反:

     
     

    可以发现,1000 0000没有拿来表示-0,而1000 0001也不能拿来直观地表示-1,事实上,-11111 1111来表示。从一个角度来理解,-1大还是-128大,当然是-1大,-1是最大的负整数,所以,无论是字符类型或整数类型,也无论这个整数是几个字节,从计算结果上来看也是对的:1111 1111-1=1111 1110,表示-2,这样一直减下去,当减到只身最高位用于表示符号的1以外,其他低位全为0,就是最小的负值,也就是-128

     

     

     

     

    2           Java基本数据类型 

     

     

     

     

     

     

     

     

    3           Java符号类型

    Java的原始类型里没有无符号类型,如果需要某个宽度的无符号类型,可以用>>>,这个是java的无符号右移操作符,或者使用下一个宽度的带符号类型来模拟,例如,需无符号的short,就用int来模拟:

     

    1         int toUnsigned(short s) { 

    2             return s & 0x0FFFF; 

    3         

     

     

    十进制的字面常理只有一个特性,就是所有的十进制字面常量都是正数,如果想写一个负的十进制,则需要在正的十进制字面常量前面加上“-”就好了。

     

    十六进制或者八进制的字面常量就不一定是正数或者负数,如果最高位是1,那么就是负数:

    1         System.out.println(0x80);//128   

    2         //0x81看作是int型,最高位(32)0,所以是正数 

    3         System.out.println(0x81);//129   

    4         System.out.println(0x8001);//32769 

    5         System.out.println(0x70000001);//1879048193   

    6         //字面量0x80000001int型,最高位(32)1,所以是负数 

    7         System.out.println(0x80000001);//-2147483647 

    8         //字面量0x80000001L强制转为long型,最高位(第64位)为0,所以是正数 

    9         System.out.println(0x80000001L);//2147483649 

    10     //最小int 

    11     System.out.println(0x80000000);//-2147483648 

    12     //只要超过32位,就需要在字面常量后加L强转long,否则编译时出错 

    13     System.out.println(0x8000000000000000L);//-922337203685477

     

    4           有符号扩展和无符号扩展

    System.out.println(Long.toHexString(0x100000000L + 0xcafebabe));// cafebabe

    结果为什么不是0x1cafebabe?该程序执行的加法是一个混合类型的计算:左操作数是long型,而右操作数是int类型。为了执行该计算,Javaint类型的数值用拓宽原生类型转换提升为long类型,然后对两个long类型数值相加。因为int是有符号的整数类型,所以这个转换执行的是符号扩展


    这个加法的右操作数0xcafebabe32位,将被提升为long类型的数值0xffffffffcafebabeL,之后这个数值加上了左操作0x100000000L。当视为int类型时,经过符号扩展之后的右操作数的高32位是-1,而左操作数的第32位是1,两个数

    值相加得到了0
      0x ffffffffcafebabeL
    +0x 0000000100000000L
    -----------------------------
     0x 00000000cafebabeL

    如果要得到正确的结果0x1cafebabe,则需在第二个操作数组后加上“L”明确看作是正的long型即可,此时相加时拓

    展符号位就为0

    Java代码

    1         System.out.println(Long.toHexString(0x100000000L + 0xcafebabeL));// 1cafebabe

     

    5           窄数字类型提升至宽类型时使用符号位扩展还是零扩展

    System.out.println((int)(char)(byte)-1);// 65535 

    结果为什么是65535而不是-1

     

    窄的整型转换成较宽的整型时符号扩展规则:如果最初的数值类型是有符号的,那么就执行符号扩展(即如果符号位为1,则扩展为1,如果为零,则扩展为0);如果它是char,那么不管它将要被提升成什么类型,都执行零扩展

     

    了解上面的规则后,我们再来看看迷题:因为byte是有符号的类型,所以在将byte数值-1(二进制为:11111111)提升到char时,会发生符号位扩展,又符号位为1,所以就补81,最后为161;然后从charint的提升时,由于是char型提升到其他类型,所以采用零扩展而不是符号扩展,结果int数值就成了65535

     

    如果将一个char数值c转型为一个宽度更宽的类型时,只是以零来扩展,但如果清晰表达以零扩展的意图,则可以考虑

    使用一个位掩码:

    Java代码

    1         int i = c & 0xffff;//实质上等同于:int i = c ; 

    说明:

    至于0xff,这属于java的字面常量,他已经是int了,ff表示为11111111java对这种字面常量,不把他前面的1看做符号位,虽然也是有符号扩展,但是,扩展成的是00...ff.

    数字字面常量的类型都是int型,而不管他们是几进制,所以“2147483648”“0x180000000(十六进制,共33位,所以超过了整数的取值范围)字面常量是错误的,编译时会报超过int的取值范围了,所以要确定以long来表示“2147483648L”“0x180000000L”

     

     System.out.println(0x80000001);//-2147483647 ,已经是32位,最高位是符号位

    System.out.println(0xcafebabe);//-889275714

    System.out.println(0xffff);     //65535 int是32位的,最高位已经是0,相当于0X0000ffff

    System.out.println(0xff);       //255

     

    如果将一个char数值c转型为一个宽度更宽的整型,并且希望有符号扩展,那么就先将char转型为一个short,它与char上个具有同样的宽度,但是它是有符号的:

    2         int i = (short)c; 

     

    如果将一个byte数值b转型为一个char,并且不希望有符号扩展,那么必须使用一个位掩码来限制它:

    3         char c = (char)(b & 0xff);// char c = (char) b;为有符号扩展 

     

    ((byte)0x90 == 0x90)?

    答案是不等的,尽管外表看起来是成立的,但是它却等于false。为了比较byte数值(byte)0x90int数值0x90Java

    通过拓宽原生类型将byte提升为int,然后比较这两个int数值。因为byte是一个有符号类型,所以这个转换执行的是符号扩展,将负的byte数值提升为了在数字上相等的int值(10010000?111111111111111111111111 10010000)。在本例中,该转换将(byte)0x90提升为int数值-112,它不等于int数值的0x90,即+144


    解决办法:使用一个屏蔽码来消除符号扩展的影响,从而将byte转型为int

    Java代码

    1         ((byte)0x90 & 0xff)== 0x90 

     

    6           Javabyte转换int时与0xff进行与运算的原因

    javabyte转换int时为何与0xff进行与运算

    在剖析该问题前请看如下代码
     public static String bytes2HexString(byte[] b) {
      String ret = "";
      for (int i = 0; i < b.length; i++) {
       String hex = Integer.toHexString(b[i] & 0xFF);
       if (hex.length() == 1) {
        hex = '0' + hex;
       }
       ret += hex.toUpperCase();
      }
      return ret;
     }
    上面是将byte[]转化十六进制的字符串,注意这里b[i] & 0xFF将一个byte 0xFF进行了与运算,然后使用Integer.toHexString取得了十六进制字符串,可以看出
    b[i] & 0xFF运算后得出的仍然是个int,那么为何要和 0xFF进行与运算呢?直接Integer.toHexString(b[i]);,byte强转为int不行吗?答案是不行的.

    其原因在于:
    1.byte
    的大小为8bitsint的大小为32bits
    2.java
    的二进制采用的是补码形式

    在这里先温习下计算机基础理论

    byte是一个字节保存的,有8个位,即801
    8
    位的第一个位是符号位, 
    也就是说0000 0001代表的是数字
    1000 0000
    代表的就是-1 
    所以正数最大位0111 1111,也就是数字127 
    负数最大为1111 1111,也就是数字-128

    上面说的是二进制原码,但是在java中采用的是补码的形式,下面介绍下什么是补码

    Integer.toHexString的参数是int,如果不进行&0xff,那么当一个byte会转换成int时,由于int32位,而byte只有8位这时会进行补位,例如补码11111111的十进制数为-1转换为int时变为11111111111111111111111111111111好多1啊,呵呵!即0xffffffff但是这个数是不对的,这种补位就会造成误差。和0xff相与后,高24比特就会被清0了,结果就对了。

     

    补码是有符号数,所以从8位变为int需要有符号扩展,变为11111111111111111111111111111111(最终的值为-1)。

    至于0xff,这属于java的字面常量,他已经是int了,ff表示为11111111java对这种字面常量,不把他前面的1看做符号位,虽然也是有符号扩展,但是,扩展成的是00...ff.

    一般在有些编译器重,写ff,会把第一位1认为是符号位,所以可以这么写:0x0ff

     

    7          DataInputStream

     

    DataInputStream in = new DataInputStream(

                                    new BufferedInputStream(fileInputStream));

     

  • 相关阅读:
    数据库版本管理工具flyway
    spring webapp的配置文件放置在项目外的方法
    logback
    linux as4 bind9 设置进程中的一些小效果
    设置/勾销Debian的屏保
    Linux内存:内存管理的天禀
    用YUM晋级CentOS体系中PHP和MySQL
    solaris的故事
    Solaris 的防火墙ipfilter设置
    mysql安置设置文件的成绩
  • 原文地址:https://www.cnblogs.com/123ing/p/4135229.html
Copyright © 2011-2022 走看看