1.ASC - 7位代表一个字符,128个
2.ASCII - 8位代表一个字符,256个
3.MBCS编码族
DBCS - 单双字节混合编码方式(计算机的主流编码方式):英文占1个字节,中文占2个字节。
例如:A 我 是 程 序 员
01 0203 0405 0607 0809 0A0B
这种方式有缺陷:
因为解析时可能为:0102 0304 0506 0708 090A 0B,就会出现乱码。
4.UNICODE编码族
所有的字符都占2个字节,解决了DBCS的缺陷。
例如: A 我 是 程 序 员
0001 0203 0405 0607 0809 0A0B
不存在解析问题
宽字节字符
wchar_t:每个字符占2个字节,实际是unsigned short类型,定义的时候需要增加"L",通知编译器按照双字节编译字符串,采用UNICODE编码。
需要使用支持wchar_t函数操作宽字符串,例如:
wchar_t* pwszText = L"Hello World";
wprintf(L"%s ", pwszText);