总的来说,bytes和string的关系是:
(bytesxrightarrow{decode}string)
(bytesxleftarrow{encode}string)
常见的几种编码及格式
- utf8:形如xe4xbbx8axe5xa4
- unicode:形如u4ecau5929u5929u6c14u4e0du9519
- 注意:如果变成了\说明,原字符串是编码后的格式,变成\是因为转换成了bytes
下面是几种常见的功能
- string转bytes
s = "abc" #string
s = "abc".encode() #bytes,encode默认编码方式是utf-8
s = b"abc" #bytes
- bytes转string
s = b"abc" #bytes
s = b"abc".decode() #string,encode默认编码方式是utf-8
s = str(b"") #string
- bytes类型的unicode(中文)输出
s = '\u4eca\u5929\u5929\u6c14\u4e0d\u9519' #中文是:今天天气真不错
new_s = s.encode().decode('unicode_escape') #输出为:今天天气真不错