python基础之编码的定义和种类

zoukankan html css js c++ java

python基础之编码的定义和种类
- 电脑将人类的语言转换成机器特有的语言，即编码进行存取，二进制数字。
- 电脑将人类的语言转换成机器特有的语言，即编码进行存取，二进制数字。 1. **ASCII 英文**，8个数字表示1个单位，一共有2**8个，可以表示所有的英文、数字及符号，8个数字为1个字节 2. **unicode 万国语**，32个数字表示1个单位，共计有2**32个，目前还有很多空缺，32个数字为4个字节 3. **utf-8**, unicode的缩减版，unicode相比于ASCII优点是每个国家的文字都可以直接转译成编码，缺点是由于32个数字（即4个字节）表示1个单位，比较占用空间，在这个基础上，utf-8可以将unicode中未使用的0进行省略，但是只会每8位省略，中文3个字节 # -*- coding:utf-8 -*- # 使用这组编码可以让python2使用utf-8进行编码 print（"你好世界"）

　　
print（"你好世界"）

编码种类:

ASCII 英文位数少只有8位

unicode 万国码可以统计世界上的所有语言,但是32位为一个单位, 由于较规整,一般用于内存计算

utf-8 万国码的压缩版,对万国码未用到的位数进行省略, 跟万国码比较节省空间,一般用于通信传输,节省流量 3个字节可以表示一个汉字

gb2312

gbk 两个字节,16个数字表示一个汉字

字符串"中国人" 一个字符串= 三个字符= 9个字节(utf-8)=6个字节(GBK) (在没有定义编码的前提下,字节与字符没有关系)

单位换算:

1byte = 8 bit 任何编码 ,1个字节等于8个数字,数字指基本的二进制数字

1KB = 1024byte

1MB = 1024KB

1GB = 1024 MB

1TB = 1024 GB

1PB = 1024 TB
查看全文

相关阅读:
[转载]c,c++及数据结构笔试题2（转）
[转载]C,C++及数据结构笔试题1（转）
C++指针详细解析
 [转载]转载一篇好文章:《海量数据处理常用思路和方法》
[转载]c,c++及数据结构笔试题2（转）
[转载]C++ 面试
 [转载]转载一篇好文章:《海量数据处理常用思路和方法》
[转载]C,C++及数据结构笔试题1（转）
BizTalk手动清除MessageBox数据库
 Linux中的时间和时间管理

原文地址：https://www.cnblogs.com/sundy08/p/11792316.html

python基础之编码的定义和种类

- 电脑将人类的语言转换成机器特有的语言，即编码进行存取，二进制数字。