zoukankan      html  css  js  c++  java
  • python2中将Unicode编码的中文和str相互转换

    在python2x版本中 关于中文汉字转换

    1.中文------字符串格式

    >>> s = '汉字'
    >>> type(s)
    <type 'str'>

    默认汉字类型是:str

    打印 s 时会显示如下内容:反斜杠和字母组合,一个汉字对应两组这样的组合 

    'xbaxba 对应 ‘汉’
    >>> s
    'xbaxbaxd7xd6'

    2.中文------汉字Unicode编码格式

    >>> s1 = u'汉字'
    >>> type(s1)
    <type 'unicode'>

    打印s1时:

    >>> s1
    u'u6c49u5b57'

    3.将Unicode编码的 s1字符串(u'u6c49u5b57')---》变换成str格式('xbaxbaxd7xd6')

    >>> s2 = s1.encode('cp936')
    >>> s2
    'xbaxbaxd7xd6'

    4.将str编码的 s字符串('xbaxbaxd7xd6')---》变换成Unicode格式(u'u6c49u5b57')

    >>> s3 = s.decode('gbk')
    >>> s3
    u'u6c49u5b57'
  • 相关阅读:
    Python之sys & os
    1161
    1142
    P1599 货币
    P1547逆转,然后再见
    P1629八
    P1753HackSon的趣味题
    Problem 2233 ~APTX4869
    1269
    1091. Tmutarakan Exams
  • 原文地址:https://www.cnblogs.com/chillytao-suiyuan/p/9825627.html
Copyright © 2011-2022 走看看