zoukankan html css js c++ java

编码

acsii：只有英文
　　　　字符：00000000  8位  1个字节表示1个字符

unicode：一个字符都是32位
　　　　英文字符：00000000 00000000 00000000 00000000  32位  4个字节表示1个字符
　　　　中文字符：00000000 00000000 00000000 00000000  32位  4个字节表示1个字符

utf-8：
　　　　英文字符：00000000  8位  1个字节表示1个字符
　　　　中文字符：00000000 00000000 00000000  24位  3个字节表示1个字符

gbk：
　　　　英文字符：00000000  8位  1个字节表示1个字符
　　　　中文字符：00000000 00000000   16位  2个字节表示1个字符

①各个编码之间的二进制，是不能互相识别的，会产生乱码

②文件的储存，传输，不能是unicode（只能是utf-8,utf-16,gbk,gb2312,asciid等）

③在python3中：

str在内存中是用unicode编码，不能直接传输和存储，需经过bytes类型才能完成
      对于英文：
　　　　　　str ：表现形式：s = "ppd"    print(s,type(s))    #ppd <class 'str'>
　　　　　　编码方式： 010101010 unicode
　　　　　　bytes ：表现形式：s1 = b"ppd" print(s1,type(s1))    #b'ppd' <class 'bytes'>
　　　　　　编码方式： 000101010 utf-8 gbk...

　　　　对于中文：
　　　　　　str ：表现形式：s2 = "中国" print(s2,type(s2))    #中国 <class 'str'>
　　　　　　编码方式： 010101010 unicode
　　　　　　bytes ：表现形式：s3 = b"xe91e91e01e21e31e32" print(s3,type(s3))    #SyntaxError: bytes can only contain ASCII literal characters.（报错）
　　　　　　编码方式： 000101010 utf-8 gbk...

④encode()：如何将str转换成bytes类型

s = "ppd"
s1 = s.encode("utf-8")    
print(s1)    #b'ppd'
s2 = s2.encode("gbk")    
print(s2)    #b'ppd'

s = '中国'
s1 = s.encode("utf-8")    
print(s1)    #b'xe4xb8xadxe5x9bxbd'
s2 = s.encode("gbk")    
print(s2)    #b'xd6xd0xb9xfa'

查看全文

相关阅读:
【html5构建触屏网站】之touch事件
 优化网站加载速度的14个技巧
 存储
 [概念] javascript构造函数和普通函数的
 nodejs中的 Cannot read property'text' of undefined 问题
 整理js继承
 清除浮动的五种方法
 用canvas绘制一个时钟
 javascript运动框架
 $(document).ready()与window.onload的区别（转发）

原文地址：https://www.cnblogs.com/believepd/p/10169292.html