内容编码
字码发展
1.ascii(只识别英文)
8位就可以表示所有英文,字符数字,1个字节就可以
2.unicode(万国码)
最少两个字节
中文三个字节
3.utf-8
万国码存在空间浪费
英文8位
中文24位
PYTHON 3默认就是UTF-8编码 不需加#coding:utf-8
编程和解码
utf-8或者gbk等编码都是,由万国码编码而来的这个过程叫做(编码),将utf-8在还原成万国码这个过程叫做(解码)
decode() 函数 为解码 函数值:为要解码的编码(原本编码)
使用方法:要解码的字符串变量.decode(要解码的编码)
如:jiem = zifu.decode("utf-8")
encode() 函数 为编码 函数值:为要编的码(编码)
使用方法:要编码的解码变量.decode(要编的码)
注意:如果是python3.5或者以上版本,可以省略解码的环境,直接第二步重新编码就可以,也就是可以直接将utf-8直接编码成gbk,(解码的过程解释器会自动完成)