1.ASCII 一个英文字母占用一个字节 无法表示汉字
2unicode 编码 每个字符占用两个字节,可以表示汉字,但对于英文字母来说会造成存储空间的浪费
3 utf-8可变长度的编码 对于英文占用一个字节 汉字占用三个字节 其它生僻的字符占用4-6个字节
把一个文件中的内容读取到内存最好转化为unicode编码 保存文件的时候把它转化为utf-8编码
4python3在内存当中将所有字符以unicode编码保存
python2在linux下字符默认编码asci
用python2编写python文件 文件中的内容如果有中文 需要在文件开头写上 #_*_coding:utf-8_*_ 在python3中则不需要