zoukankan      html  css  js  c++  java
  • gcc编译器对宽字符的识别

           最早是使用VC++工具来学习C++,学的越多就越对VC挡住的我看不见的东西好奇,总想多接触一些开发环境,今日抽空摸索了一下CodeBlocks这个开源的IDE使用方法,配置的编译器是MinGW的gcc编译器,gcc编译多字节集的字符还没什么问题,但遇到宽字符,发现编译不通过,经过多方查找,发现gcc对宽字符的支持分规则同我用熟了的cl编译器有一些区别,具体用法如下:

            GNU   C/C++编译器gcc也可以正确支持wchar_t字符和字符串,但是源代码的保存格式必须符合下面条件:
            一:源代码文件的保存编码必须是UTF-8;
            二:UTF-8编码格式的源代码文件,不能有BOM标志头.
            只有源代码文件符合上面两个条件,gcc才会正确支持wchar_t字符和字符串.如果不符合上面两个条件的话,有可能会编译出错,有可能会产生错误的wchar_t字符和字符串.
            gcc在Windows平台下,wchar_t是16位类型,在Linux平台下,wchar_t是32位类型.
           
            另外,GCC提供了以下的参数开关来支持其它文字编码的源文件:
            a)-finput-charset=charset
                gcc在默认情况下,总是假设源代码的编码是UTF-8,如果是其它编码的源代码文件,源代码里面又用到了wchar_t的类型,则可以使用-finput-charset=charset这个参数来实现.例如通常使用GBK编码的源代码可以假如参数:-finput-charset=GBK
             b)-fwide-exec-charset=charset
                默认情况下,gcc在Windows平台下,宽字符串串常量的每个字符是16位UTF-16类型,在Linux平台下,宽字符串串常量的每个字符是32位UTF-32类型,            使用这个参数,可以改变宽字符串串常量的类型.例如在x86的机器环境,Linux操作系统下,要使例如 L"汉字" 编译后保存为UTF-16的字符串,则可以使用 -fwide-exec-charset=UTF-16LE

    备注:我后来的解决方法过程,是直接用记事本重新打开另存为UTF-8格式,编译通过,不过这样感觉好麻烦,我还得再试试其它方法,最后不理会源代码文件保存格式,只是在编译选项那里设置-finput-charset=GBK,这样也是可以的(Windows上的字符编码貌似总是GBK的).

    1 TCHAR szMsgText[ ] = TEXT("大家好!");
    2 TCHAR szMsgTitle[ ] = TEXT("提示!");
  • 相关阅读:
    寒假刷题之2——Decoder
    寒假刷题之5——竹简文
    一位ACMer的心得,,,
    OD使用教程22 调试篇22
    OD使用教程22 调试篇22
    递归和分治思想4|八皇后问题 数据结构和算法34
    递归和分治思想4|八皇后问题 数据结构和算法34
    字符串 数据结构和算法35
    KMP算法(养成篇) 数据结构和算法36
    OD使用教程23 调试篇23
  • 原文地址:https://www.cnblogs.com/guobbs/p/3654317.html
Copyright © 2011-2022 走看看