zoukankan      html  css  js  c++  java
  • c语言中 char* 和 unsigned char* 的区别浅析(转)

    原文:https://blog.csdn.net/guotianqing/article/details/77341657

    背景
    最近在项目中遇到了一个编译警告,是因为定义的变量为char[],而在使用时作为函数的unsigned char*类型的参数调用。这个警告很容易避免,但是char*和unsigned char*到底有什么区别呢,本文作一个简单的探讨。

    char 和 unsigned char 的区别
    在C中,默认的基础数据类型均为signed,如定义变量为int,long等,都为有符号的。如果要定义无符号类型,必须显式地在变量类型前加unsigned。

    char vs unsigned char
    相同点:在内存中都是一个字节,8位(2^8=256),都能表示256个数字
    不同点:char的最高位为符号位,因此char能表示的数据范围是-128~127,unsigned char没有符号位,因此能表示的数据范围是0~255

    实际使用中,如普通的赋值,读写文件和网络字节流都没有区别,不管最高位是什么,最终的读取结果都一样,在屏幕上面的显示可能不一样。

    但是要把一个char类型的变量赋值给int、long等数据类型或进行类似的强制类型转换时时,系统会进行类型扩展,这时区别就大了。对于char类型的变量,系统会认为最高位为符号位,然后对最高位进行扩展,即符号扩展。若最高位为1,则扩展到int时高位都以1填充。对于unsigned char类型的变量,系统会直接进行无符号扩展,即0扩展。扩展的高位都以0填充。所以在进行类似的操作时,如果char和unsigned char最高位都是0,则结果是一样的,若char最高位为1,则结果会大相径庭。

    可以使用的下面的小程序验证一下:

    #include <stdio.h>
    
    static void func(unsigned char uc)
    {
        char c;
        int i, j;
        unsigned int ui, uj;
    
        c = uc;
        i = (int)c;
        j = (int)uc;
        ui = (unsigned int)c;
        uj =(unsigned int)uc;
        printf("%%c: %c, %c
    ", c, uc);
        printf("%%x: %x, %x
    ", c, uc);
        printf("%%u: %u, %u
    ", ui, uj);
        printf("%%d: %d, %d
    ", i, j);
    }
    
    int main(int argc, char *argv[])
    {
        func(0x80);
        func(0x7f);
    
        return 0;
    }
    

      

    运行结果如下:

    %c: �, �
    %x: ffffff80, 80
    %u: 4294967168, 128
    %d: -128, 128
    ---------------------------
    %c:,
    %x: 7f, 7f
    %u: 127, 127
    %d: 127, 127


    对于char来说,0x80用二进制表示为1000 0000,当它作为char赋值给unsigned int或 int 时,系统认为最高位是符号位,会对最高位进行扩展。而0x7F用二进制表示为0111 1111,最高位为0,不会扩展。对于unsigned char来说,不管最高位是0,还是1,都不会做扩展。

    char* 和 unsigned char*的区别
    char* 和 unsigned char* 也具有类似的区别,如下面测试程序所示:

    char*是有符号的,如果大于127即0x7F的数就是负数了,使用%x格式化输出,系统自动进行了符号扩展,就会产生变化。

    所以在涉及到类型提升的上下文中,要注意使用char*和unsinged char*的区别。

    #include <stdio.h>
    
    int main(int argc, char *argv[])
    {
        unsigned char k = 0;
        int i = -1;
        short a = -12345;
        char *p;
        unsigned char *q;
    
        printf("sizeof(i) = %d
    ",sizeof(i));
        printf("sizeof(a) = %d
    ",sizeof(a));
        printf("-----------------------------
    ");
        printf("begin p(char):
    ");
        p = (char*)&a;
        printf("a = %u | %d
    ",a,a);
        for(k=0;k<sizeof(a);k++)
        {
            printf("0x%x ",*(p++));
        }
        printf("
    ");
        p = (char*)&i;
        printf("i = %u | %d
    ",i,i);
        for(k=0;k<sizeof(i);k++)
        {
            printf("0x%x ",*(p++));
        }
        printf("
    ");
        printf("-1 > 0u: %s
    ",(-1>0u ? "true":"false"));
    
        printf("-----------------------------
    ");
        printf("begin q(unsigned char):
    ");
        q = (unsigned char*)&a;
        printf("a = %u | %d
    ",a,a);
        for(k=0;k<sizeof(a);k++)
        {
            printf("0x%x ",*(q++));
        }
        printf("
    ");
        q = (unsigned char*)&i;
        printf("i = %u | %d
    ",i,i);
        for(k=0;k<sizeof(i);k++)
        {
            printf("0x%x ",*(q++));
        }
        printf("
    ");
        printf("-1 > 0u: %s
    ",(-1>0u ? "true":"false"));
    
        return 0;
    }
    

      

  • 相关阅读:
    Url中文传值乱码、编码转码问题总结
    简单介绍下我使用了一年多还不知道的Sql server 2005 组件知识
    一次管理项目小组网络的经历(使用RouterOS与Wireshark破解adsl上网密码,使用isa与Bandwidth Splitter来协调带宽)
    asp.net异步处理机制研究
    注释的力量
    AutoMapper简明教程(学习笔记)
    seajs学习笔记
    Hifi入门
    fxcop使用DataFlowRules规则集
    Visual Studio编译选项简介
  • 原文地址:https://www.cnblogs.com/lemaden/p/10427943.html
Copyright © 2011-2022 走看看