zoukankan      html  css  js  c++  java
  • C语言中的宽字符

    宽字符库函数 我们都知道如何找出一个字符串的长度。例如,如果我们定义了一个指向字符串的指针:

    char * pc = "Hello!";

    我们可以调用

    iLength = strlen(pc);

    变量iLength会被设成6,也就是字符串中字符的个数。 好极了!现在让我们尝试定义一个指向宽字符串的指针:

    wchar_t * pw = L"Hello!"; 

    而且现在我们再次调用strlen:

    iLength = strlen(pw); 

    现在问题出现了。首先,C编译器会给你一个警告消息,大概是下面这个意思:

    'function' : incompatible types - from 
    'unsigned short *' to 'const char *' 

    这是在告诉你strlen函数被定义为接受一个指向char的指针,但这里收到的是一个指向无符号短整型的指针。仍然可以编译运行程序,但你会发现iLength变成了1。发生了什么呢? 字符串"Hello!"中的6个字符包含的16位值如下:

    0x0048 0x0065 0x006C 0x006C 0x006F 0x0021 
    

    这些值被Intel处理器以下面这种方式存储在内存中:

    48 00 65 00 6C 00 6C 00 6F 00 21 00 
    

    strlen函数,假设它试图找到字符串的长度,计算第一个字节为字符,但然后会认为第二字节是一个表明字符串结尾的零字节。 这个小小的实验清楚地表明了C语言自身和运行库函数的细微差别。编译器将字符串L"Hello! "解释为一个16位短整型的集合并把它们存储在wchar_t数组。编译器还会处理所有数组索引和sizeof操作符,因此这些都会正常工作。但是,程序运行时,运行库函数(如strlen)是在链接时被增加进去的。这些函数期望收到由单字节字符构成的字符串。因此在遇到宽字符串时,它们不会像我们预期那样执行。 你说,哦,太倒霉了,现在每一个C库函数都要被重写,以接受宽字符。嗯,并非每一个C库函数。只有那些有字符串参数的。而且你并不需要重写它们,因为重写已经完成了。 宽字符版本的strlen函数被称为wcslen("宽字符字符串长度"),并定义在STRING.H(也就是strlen被定义的地方)和WCHAR.H中。strlen函数的声明如下:

    size_t __cdecl strlen(const char*); 

    而wcslen函数的声明如下:

    size_t __cdecl wcslen(const wchar_t*); 

    所以现在我们知道了一点:在需要确定一个宽字符串的长度时,我们可以调用以下函数:

    iLength = wcslen(pw); 

    该函数返回的结果是6,也就是字符串中的字符个数。

    请记住,在使用宽字符的时候,字符串的字符长度并没有改变,改变的只是字节长度。

    所有你喜爱的C语言中那些使用字符串参数的运行库函数都有宽字符的版本。

    例如,wprintf是宽字符版本的printf。这些函数都被定义在WCHAR.H和定义正常函数的头文件中。

  • 相关阅读:
    OpenDaylight及Postman实现VxLAN网络实验
    OpenDaylight的C/S模式实验
    OpenFlow1.3协议基于Mininet部署与验证
    Open vSwitch流表应用实战
    Open vSwitch的VxLAN隧道网络实验
    Open vSwitch的GRE隧道实验网络
    Open vSwitch使用案例扩展实验
    Beta 冲刺(1/7)
    福大软工 · 第十次作业
    福大软工 · BETA 版冲刺前准备(团队)
  • 原文地址:https://www.cnblogs.com/trying/p/2863761.html
Copyright © 2011-2022 走看看