zoukankan      html  css  js  c++  java
  • 宽字符与窄字符

    <一>什么是宽字符与窄字符

    (1) 一个ANSI字符占一个字节共8位,一个UNICODE字符占两个字节共16位;ANSI字符串以’’结束,0x00。
    #Q: UNICODE字符串以什么结束??
    #A: UNICODE字符串以L””结束,0x0000。

    (2)UNICODE和ANSI字符的相关定义及应用在各种运行库中的体现如下:

    1) 在C标准库中
    i. UNICODE在C标准库下编译的宏定义为_UNICODE
    ii. 宽字符的数据类型为wchar_t,窄字符的数据类型为char。数据类型的定义在头文件string.h中,对wchar_t的定义为:
    {{{
    typedef unsigned short wchar_t;
    }}}
    iii. 在头文件string.h中,定义了分别对宽字符和窄字符的操作函数,如wcscpy和strcpy等。对宽字符的操作函数和对窄字符的操作函数的对照见:
    http://blog.csdn.net/typecool/article/details/5877458
     
    iv. 而在头文件tchar.h中,定义了tchar宏,该文件模块功能实现了”双重功能”。
    即例如_tcscpy方法宏,当编译环境定义了UNICODE宏,则此方法宏为wcscpy,不然则为strcpy。等等。。。。
    v. #Q: 对于对宽字符和窄字符的处理函数带后缀_s,如wcscpy_s,strcpy_s,此类方法与wcscpy和strcpy等的区别在哪里?
    #A: http://technet.microsoft.com/zh-cn/subscriptions/td1esda9(v=vs.80).aspx
    wcscpy_s方法定义如下:
    {{{
    errno_t wcscpy_s(
       wchar_t *strDestination,
       size_t sizeInWords,
       const wchar_t *strSource 
    );
    }}}
    wcscpy方法定义如下:
    {{{
    wchar_t* wcscpy_s(
       wchar_t *strDestination,
       const wchar_t *strSource 
    );
    }}}
    wcscpy_s方法多了一项参数size_t sizeInWords,即要拷贝的字符的个数。这样就可避免strDestination空间分配不足。
    2) 在windows中
    i. UNICODE在windows下编译的宏定义为UNICODE
    ii.
    3) 在C++标准库中
    4) 在MFC中

    <二>宽字符与窄字符之间的转换

    有wcsXXX的函数专门处理宽字节的,就是strXXX一样好使。呵呵,我不再惧怕了,就试着自己写了一下,还是学了蛮多东西的:
    1.有wcsXXX的函数和strXXX的函数对应处理宽字节,wcslen就是求长度的,wcscmp就是比较两个字符串的。
    2. 输出也有相关的操作,wprintf(L”%s%s”);这样的操作,对文件也可以用fwprintf函数来输出。不过我发现貌似cout << wchar;不成功。也发现了一个问题,就是我输出”相等”这样一个字符串的时候,发现居然输出不正确,无论是控制台和文件都有错误。可见,这个还是有点 小问题的。输出其他的例如”12345”等都是正常的。哎,这个函数并不可靠啊。

    3.宽字节和普通串的转换问题,学了两个函数,一个是:
    wcstombs(char* strDes, const wchar*, size_t nMax);这个函数的作用是把wchar转换为char。
    char* strDes 为保存转换后的普通字符串,wchar* 要被转换的宽字符串。转换的最大长度。这里的长度是转换的个数,而不是字节长度。
    mbstowcs() 就是一个相反的过程了,参数就不说了。

    另一套转换的函数是:
    int WideCharToMultiByte(
      UINT CodePage,
      DWORD dwFlags,
      LPCWSTR lpWideCharStr,
      int cchWideChar,
      LPSTR lpMultiByteStr,
      int cbMultiByte,
      LPCSTR lpDefaultChar,    
      LPBOOL lpUsedDefaultChar
    );
    他的参数很多,上面的连接有介绍,这里就不怎么细说了。

    第 一个是编码的方式,我一般用CP_ACP。第二个是转换标志,MSDN上说什么都不设置更快,然后我就什么都不管了就用NULL了。具体作用不知道,等遇 到了再学。第三个参数就是被转换的字符串,第四个参数是该字符串的长度,-1表示自动算长度,如果是手动给出,一定要把最后的终结符长度也算上。我觉得还 是-1来的实际。第五个参数就是保存转换串的指针,第六个参数就是保存串的长度,这里是单位字符的个数。如果转换的时候没有终结符,那么结果也没有终结 符,要注意下。最后两个参数就是默认的填充字符和是否使用了默认填充字符,我一般就用NULL代替。

    普通串转宽字节也是类似。
    这 里有几个注意的,一定要保证空间足够。还有就是那个长度是单位字符个数,而不是字节数,在转换时,推荐被转换的字符串长度设置为-1,因为这样他会自动算 出终结符结束。返回值也是转换的单位字符个数。例如”相等”有普通串转换为宽字节串,返回结果是3,(有终结符),而反过来就是5。如果返回时0 说明转换失败。

    心得:虽然WideCharToMultiByte的参数要多,感觉用的没有wcstombs爽,可是他的准确好高一些, 要转换的话,还用用WideCharToMultiByte比较合适,还有就是虽然有一套wcsXXX的库函数,可惜输出还是出现问题的。如果全都用宽字 节,那没有关系wcsxxx的函数还是蛮好用的。还有一个疑惑我明明查字典multi是多的意思也就是说multibyte是多字节,我的中文版 VS2005配置里面也是说的多字节。搞不懂为什么要用宽字节呢?可能是多字节编码不好用吧。呵呵。 废话也说完了,奉上源代码:

    int main()
    {
        FILE* fp ;
        WCHAR wchar[5] = L"相等相等";        //定义一个宽字节的变量,初始为"相等"
        fp = fopen("1.txt", "w+");        //打开文件称奥做
        fwprintf(fp, L"%s
    ", wchar);    //输出到文件
        fclose(fp);                        //关闭文件
        WCHAR wc2[5];                    //定义第二个宽字节变量
        
        //wc开始的有很多宽字节的操作。都和str相对应。
        wcscpy(wc2, wchar);                //复制。
        int n = wcscmp(wc2, wchar);        //比较
        if (n == 0)
        {
            wprintf(L"相等
    ");            //这里是否注意到没有wprintf有问题的。
        }
    
        char str[10];                    //定义char字符。
        n = wcstombs(str, wc2, 9);        //宽字节转换为muiltychar
        printf("%s
    ", str);            //输出结果
    
        for (int i = 0; i < 5; ++i)
        {
            wc2[i] = L'1' + i;
        }
        wc2[4] = 0;
    
        n = wcstombs(str, wc2, 9);        //宽字节转换为muiltychar
        printf("%s
    ", str);            //输出结果
        //另外的方式转换
        n = WideCharToMultiByte(CP_ACP, NULL, wchar, wcslen(wchar) + 1, str, 10, 0, 0);
        printf("%s
    ", str);
        char str2[10] = "加一";
        WCHAR wc3[10];
        n = MultiByteToWideChar(CP_ACP, NULL, str2, strlen(str2) + 1, wc3, 10);    //char到宽字节。
    
        system("pause");
        return 0;
    }
  • 相关阅读:
    模板——二分法
    Trie Tree(静态数组写法,好写)
    欧拉路径 基础题 hiho第49周
    Fleury算法求欧拉路径 hiho第50周
    hdu 5266 pog loves szh III 在线lca+线段树区间优化
    hdu 5269 字典树
    hdu 5265 pog loves szh II
    poj 3678 2-sat(强连通)
    lca 在线,离线 poj 1330
    lca 在线算法 zoj 3195
  • 原文地址:https://www.cnblogs.com/tibetanmastiff/p/3621994.html
Copyright © 2011-2022 走看看