初识编码:
电脑的传输,还是储存的实际上都是00001010101 8位一个字节
美国:最早的密码本“ASCII”,涵盖了英文字母大小写,特殊字符,数字,
ASCII 只能表示256种可能,太少。
为了解决这个全球化的文字问题,创建了一个万国码:unicode
最开始
1个字节,表示所有的英文,特殊字符,数字等等
2个字节,16位表示 一个中文,不够,unicode一个中文用四个字节表示,0000 0000 0000 0000
升级版:uft-8 ,uft-16 uft-32
utf-8 :一个字符最少用8位去表示,英文用8位
欧洲文字用16位去表示
,一个中文用3个字节24位去表示。
( 中文 9万多字,)
gbk 码,只是国内使用,一个中文用两个字节16位表示。