zoukankan      html  css  js  c++  java
  • C++ 字符串UTF8与GBK转化

           第一次写博客,有时候在工作中遇到解析XML文件,节点属性值为中文的情况,需要转换编码,VC默认是的是GB2312,遇到中文就出现乱码,下面是UTF-8和GBK2312的互相转换,有画蛇添足的地方,希望各位大神指出:

    #include "windows.h"

    // UTF-8转为GBK2312 [1/18/2017/shike]
     std::string UtfToGbk(const char* utf8)
     {
       int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);
       wchar_t* wstr = new wchar_t[len+1];
       memset(wstr, 0, len+1);
       MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);
       len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL);
       char* str = new char[len+1];
       memset(str, 0, len+1);
       WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);
       if(wstr) delete[] wstr;
       return str;
     }

    //GBK转化为UTF8格式
     void ConvertGBKToUtf8(CString &strGBK)
     {
      int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
      wchar_t * wszUtf8 = new wchar_t [len];
      memset(wszUtf8, 0, len);
      MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);
      len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
      char *szUtf8=new char[len + 1];
      memset(szUtf8, 0, len + 1);
      WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);
      strGBK = szUtf8;
      delete[] szUtf8;
      delete[] wszUtf8;
     }

    爬坑的路上要越怕越勇.....
  • 相关阅读:
    另一种保证单次插入回文自动机复杂度的做法
    loj #6070. 「2017 山东一轮集训 Day4」基因
    求第一类斯特林数的一行
    NOIP2018游记
    HDU3377 Plan
    【BZOJ】1830: [AHOI2008]Y型项链
    【BZOJ】1832: [AHOI2008]聚会
    【BZOJ】1831: [AHOI2008]逆序对
    【BZOJ】1085: [SCOI2005]骑士精神
    【BZOJ】1798: [Ahoi2009]Seq 维护序列seq
  • 原文地址:https://www.cnblogs.com/shike8080/p/6297210.html
Copyright © 2011-2022 走看看