字符编码 python2与python3的区别

zoukankan html css js c++ java

字符编码 python2与python3的区别
目录
1. 字符编码
2. 文本编辑器存储信息的过程
3. 编码：
1. 编码的历史
2. gb2312和gbk的区别
3. 编码和解码
4. python解释器解释代码的流程
1. 读取文本到解释器
2. 识别代码（检查语法问题）
3. 往终端打印
1. 字符编码

字符：就是存储了信息的东西

键盘发送等等是电流——》主机（内存）接收到电流（当做010101011101）——》显示屏接收电流（当做010101010——》键盘）

2. 文本编辑器存储信息的过程
- 文本编辑器——》写文本 ——》存储信息
- 显示器（内存）——》（转换）硬盘
3. 编码：

1. 编码的历史

美国：ASCII

中国：gb2312

等等。。。但这样会妨碍信息文化的交流

然后出现了Unicode编码（一种对应关系）

Unicode可以认识万国编码

现在所有的电脑都是这样的：内存中用Unicode读取硬盘内容，存用utf8存（硬盘）。

内存中不用utf8，是因为utf8和其他编码没有转换关系

注意：虽然说utf是为了使用更少的空间而使用的，但那只是相对于unicode编码来说，如果已经知道是汉字，则使用GB2312/GBK无疑是最节省的。不过另一方面，值得说明的是，虽然utf-8编码对汉字使用3个字节，但即使对于汉字网页，utf-8编码也会比unicode编码节省，因为网页中包含了很多的英文字符。

2. gb2312和gbk的区别

gb2312 只支持常用的字词

gbk 支持几乎全部

windows系统的记事本默认是 gbk编码（未来可能会变成utf8的编码），除此之外都是 utf8

3. 编码和解码

Unicode编码——》（编码）utf8 从内存到硬盘

utf8 ——》（解码）Unicode 从硬盘到内存

4. python解释器解释代码的流程

1. 读取文本到解释器

python2默认是使用ASCII编码读取

python3默认使用 utf8编码读取

（当有coding头时，他们都使用coding中设定的编码进行读取）

2. 识别代码（检查语法问题）

3. 往终端打印

存储变量：
- python2中存储变量用Unicode/coding指定的编码存储变量
```
print u'中国' #表示用unicode存储变量
```
- python3中默认使用Unicode存储变量
假设1：python2用coding指定的gbk存储变量，终端支持的编码是utf8，打印结果：乱码

假设2：python2用Unicode（u'中文'）来存储变量，终端支持的编码是utf8/gbk，打印结果：都不会乱码

假设3：python3用Unicode存储变量，终端支持的编码是utf8/gbk，打印结果：都不会乱码
查看全文

相关阅读:
vue简单的富文本实现（亲测可以）
做手机兼容性看友盟手机统计
 压测并发数上不去的原因分析(泽嵩大佬说的)
跨域问题解决
 jmeter压力测试报Address already in use: connect错误
 选择器(可搜索)+气泡提示组件
 2020
Redis集群搭建采坑总结
 echarts自定义背景图片
 百度ECharts地图Json数据在线下载（geoJson）

原文地址：https://www.cnblogs.com/Mcoming/p/11534558.html

字符编码 python2与python3的区别

1. 字符编码

2. 文本编辑器存储信息的过程

3. 编码：

1. 编码的历史

2. gb2312和gbk的区别

3. 编码和解码

4. python解释器 解释代码的流程

1. 读取文本到解释器

2. 识别代码（检查语法问题）

3. 往终端打印

4. python解释器解释代码的流程