zoukankan      html  css  js  c++  java
  • python中的字符问题

    unicode/unicodebig/utf8 在python上默认情况下都解析不了
    
    window系统中
    
    ASCLL对应的是GBK
    unicode|unicodebigendian 对应 utf-16
    utf-8 对应 utf-8
    
    字符串在Python内部的表示是unicode编码。
    因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。  decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。  encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。
    因此,转码的时候一定要先搞明白,字符串
    str是什么编码,然后decode成unicode,然后再encode成其他编码
    
    #!/usr/bin/env python  
    #coding=utf-8  
    s="中文" 
    if isinstance(s, unicode):  
    #s=u"中文"   
    print s.encode('gb2312')  
    else:  
    #s="中文"   
    print s.decode('utf-8').encode('gb2312') 
  • 相关阅读:
    171. Excel Sheet Column Number (Easy)
    349. Intersection of Two Arrays (Easy)
    453. Minimum Moves to Equal Array Elements (Easy)
    657. Judge Route Circle (Easy)
    CSS笔记
    保存页面状态
    UI开发总结
    ubuntu 下配置munin
    反向代理配置
    JavaScript 高级程序设计第二版
  • 原文地址:https://www.cnblogs.com/lgjbky/p/5827153.html
Copyright © 2011-2022 走看看