python2.x的中文编码真是令人头痛,简单写下自己的一点python编码转换的体会。
windows平台用的默认编码格式为gbk
>>> s = raw_input() #在windows平台下 s 的字符编码就是gbk,若要转换为utf-8,则必须借助python内建对象Unicode作为中介 u = s.encode('gbk') #把把原编码为gbk的字符转换为unicode对象 utfString = u.decode('utf-8') #把decode是unicode的方法,把unicode字符的编码格式转换为utf-8