zoukankan      html  css  js  c++  java
  • Python3的unicode编码转换成中文问题

    Python3的unicode编码转换成中文问题

    9102年,大部分人已经受尽了python2里面unicode的折磨,转向了python3。
    python3似乎对一切的unicode都那么的友好,当一个字符串里存在unicode的时候,只要字符串是硬编码的,就可以转换成中文打印在控制台上,如:

    s = ‘u7b14u8bb0’
    print(s)

    你得到的就是中文汉字。
    但是,假如你。。的这段含有‘u’的unicode编码不是硬编码进脚本的,而是通过requests在网上爬的。。。那么你会发现,你打印出来的,还是长这样的unicode编码,换句话说,解释器这个时候根本就没认出这东西原来是unicode编码,当成普通的字符序列了。
    百度找到了最好的解决方法:在这个unicode串后面加上:

    s = s.decode().encode(‘unicode_escape’)
    print(s)

    它就打印出汉字了

    python3中没有这种问题,所以最简单的方法是引入__future__模块,把新版本的特性导入到当前版本

    from __future__ import unicode_literals
    
    print json.dumps(m,ensure_ascii=False)
    
    =>{"a": "你好"}
    在写入文件的时候出现了Python2.7的UnicodeEncodeError: ‘ascii’ codec can’t encode异常错误
    
    大神的解决方法: 
    不使用open打开文件,而使用codecs:
    from __future__ import unicode_literals
    import codecs
    fp = codecs.open('output.txt', 'a+', 'utf-8')
    fp.write(json.dumps(m,ensure_ascii=False))
    fp.close()
  • 相关阅读:
    LaTeX中表格多行显示的最简单设置方法
    获取Google音乐的具体信息(方便对Google音乐批量下载)
    移动硬盘提示格式化解决的方法,未正确删除导致不能读取文件提示格式化解决方式
    Android Service 服务(一)—— Service
    华为C8816电信版ROOT过程
    Linux crontab 命令格式与具体样例
    Python用subprocess的Popen来调用系统命令
    我的EJB学习历程
    接口和逻辑--多进程或单一进程
    uva 11354
  • 原文地址:https://www.cnblogs.com/tangxiaosheng/p/12015847.html
Copyright © 2011-2022 走看看