字符问题
把码位转化成字节序列的过程是编码,把字节序列转化成码位的过程是解码
把unicode字符串当成人类可读的文本,码位当成机器可读的,
将字节序列编程人类可读是解码,把字符串编码成字节序列是编码
字节概要
python内置了两种基本的二进制序列类型,python3引入的不可变的bytes类型和python2.6添加的可变bytearray类型
基本的编解码器
别依赖默认值
python2的默认编码是ascii而python3是utf-8
这章内容主要讨论unicode编码,其实觉得没什么很大的用途。就省略了,现在python3的默认编码utf-8可以支持绝大部分的编码问题,以后有遇到再说