python默认的是不支持中文的,要想让python识别中文,就必须在文件头加上
#-*-coding:UTF-8-*-
这样,python默认的编码格式就会采用utf-8的格式了。
实际工作中,我们可能会遇到需要将unicode编码形式转换到其他编码形式的问题,解决方法如下:
#-*-coding:UTF-8-*- a_string='深入python' by=a_string.decode('utf-8') #因为python的编码格式已经改成了utf-8,所以,第一步就是要解码,得到解码后的对象 a=by.encode('gb18030') #解码后,我们就可以用其他的编码格式进行编码了,编码得到一个str对象 a=a.decode('gb18030') a=a.encode('big5') a=a.decode('big5')
python内部用unicode对象来表示字符串,和人交互的时候用str对象,str对象是经过了编码的对象。所以,在改变字符串编码时,必须先解码。