zoukankan      html  css  js  c++  java
  • python解决处理中文的问题

    脚本开头添加默认编码

    python源码中出现了中文字符或要处理中文字符,运行时会出现错误,解决方法是,开头加入字符编码声明:

    #! /usr/bin/env python
    # -*- coding:utf-8 -*-
    

     处理时可能会出现问题:

    UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-15: ordinal not in range(128)

    这需要在开始位置加入代码

    import sys
    reload(sys)
    sys.setdefaultencoding('utf8')
    

     比如读入一行中文代码,要写入另一个文件时,需要解码与编码的变换:

    p = "我在博客园“ 
    w.write(p.decode('utf-8').encode('utf-8') + '
    ') 
    

    csv中文编码乱码

    往文件中如果存储方式是utf-8,打开csv文件时就是乱码,如果考出来重新存储为gbk格式就可以正常显示了。但是可以存储的时候就直接存储为gb2312

    #! coding:utf-8
    f = file('ss.csv', 'w')
    f.write('你好'.decode('utf-8').encode('gb2312'))
    f.close()

    这样用excel打开就不是乱码。

  • 相关阅读:
    线程循环的故事
    代码质量
    代码质量控制之异常控制
    面对象静态结构描述方法
    解决maven下载依赖包,pom文件错误问题
    Spring学习笔记
    java编程命名规范
    powershell使用
    vert.x中future的简单使用
    idea调整import包的顺序
  • 原文地址:https://www.cnblogs.com/kaituorensheng/p/3375075.html
Copyright © 2011-2022 走看看