、Python中文字符有两种表示形式:一种是如a='巩庆奎',另一种是b=u'巩庆奎'。前者表示的是字符的编码字节序列,是Str类型,
值根据采用的编码(utf、gbk)不同而不同,如GBK编码字节序列为'xb9xaexc7xecxbfxfc',
UTF8编码字节序列为'xe5xb7xa9xe5xbax86xe5xa5x8e'。后者是表示汉字字符在unicode表中的位置,是unicode类型,值是固定的,本例为u'u5de9u5e86u594e'。
!
utf8:
>>> print 'xe5xb7xa9xe5xbax86xe5xa5x8e'
巩庆奎
gbk:
>>> print 'xb9xaexc7xecxbfxfc'
巩庆奎
>>>