1. 计算机存的是二进制,我们平时使用的汉字都不是二进制,存在计算机里用的是字符编码。
2. 字符集就是一套文字符号及其编码的描述。字符集有很多种。
3. 概念:
A. 位:计算机中的最小单位,二进制中的一位,用0/1表示。(比特)
B. 字节:八位组成一个字节。(一个汉字可以是两个或三个字节)
C. 字符:我们肉眼可见的文字或符号。(一个汉字是一个字符,一个英文字母是一个字符)
D. 字符集:字符的集合。
E. 编码:将字符转换成计算机可以识别的0/1代码。
F. 解码:将计算机表示的0/1编码转换成肉眼可见的字符。
4. 编码:
ASCII:
GB2312:收录7千多简体汉字
GBK:收录2万多汉字(流行)
GB18030:另加了少数民族的文字
UCS:所有字符采用四个字节进行编码,
UTF-8:对不同范围的字符使用不同长度的编码
UFT-16:以16位无符号整型数据为单位的