时间紧张,先记一笔,后续优化与完善。
ASCII-----单字节编码
GB2312-----中国人的简体字编码
GBK----中国人的简繁编码
GBK编码(Chinese Internal Code Specification)是中国大陆订制的、等同于UCS的新的中文编码展扩国家标准。gbk编码可以用来同时表现
繁体字
和简体字,而gb2312只能表现简体字,gbk是兼容gb2312编码的。
GBK 采用了
单双字节合混
的式方。
它兼容ASCII,因些0x~07F 分部的义定和ASCII 一样。对其他符字,G
BK中个每汉字仍然包括两个字节,第一个字节的范围是0x81-0xFE(即129-254)-----最高位必须是 1
,第二个字节的范围是0x40-0xFE(即64-254)。
2.如果字节范围 0x80~0xFF,即
最高位为 1
时,还要需再取下一个字节,两个字节合起来才表现一个符字。
Unicode----一统码、万国码,java、python
UTF-8-----国际编码,通用性好,前缀码,从第一个字节能就道知这是个几字节字
U+
0
800 - U+
F
FFF 1110
****
10** **** 10** ****(0xE
0
~0xE
F
) 字节最高四位是 1110, 则这是三字节编码,用于其他符字,如中文简繁等
文章结束给大家分享下程序员的一些笑话语录:
联想——对内高价,补贴对外倾销的伟大“民族”企业。