最早的计算机编码是ASCII码,有英文+数字+特殊字符,8位=1个字节
中文进行编码,对ASCII码进行扩充,扩充到2**16(65536)个字符,两个字节------》GBK(国标)--包含中文+日文+韩文+英文(兼容ASCII码)
UNICODE(32bit)兼容各个国家的编码-万国码----造成严重的空间浪费
UTF-8:可变长度的UNICODE,本质是UNICODE---
英文占用1个字节,即8位
欧洲文字,占用2个字节,16位
中文,占用3个字节,24位
UTF-16
UTF-32
8bit=1byte
1024bytb=1MB
1024MB=1G
1024G=1TB
1024TB=1PB
1024PB=1EB
1024EB=1ZB
1024ZB=1YB
1024YB=1NB
https://www.bilibili.com/video/av45510186/?p=13