zoukankan      html  css  js  c++  java
  • UnicodeDecodeError: 'utf-8' codec can't decode byte..问题

    解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题

    • 问题描述:

    • 问题分析:

      该情况是由于出现了无法进行转换的 二进制数据 造成的,可以写一个小的脚本来判断下,是整体的字符集参数选择上出现了问题,还是出现了部分的无法转换的二进制块:

    • 问题解决

      法一:将gbk编码数据decode('gbk')得到utf8编码的数据

      法二:修改字符集参数,一般这种情况出现得较多是在国标码(GBK)和utf8之间选择出现了问题。 ​ 出现异常报错是由于设置了decode()方法的第二个参数errors为严格(strict)形式造成的,因为默认就是这个参数,将其更改为ignore等即可。例如:

      line.decode("utf8","ignore")

      法三:在网上搜了很多人的处理方法是在程序的顶部加

      import sys
      reload( sys )
      sys.setdefaultencoding('gbk')

    可是我自己试一了,程序错是不报了,但是实际没有运行

    最后,我在程度的顶部加了下面两行就好了,中文也可以正常显示了

      # !/usr/bin/env Python
     # coding=utf-8

     还有一种情况就是如果你用pyhton IO读取一个文件,那么要求将文件的编码方式转换成UTF-8。

  • 相关阅读:
    【t090】吉祥数
    【u221】分数
    【u212】&&【t036】最大和
    【u125】最大子树和
    【u124】环状最大两段子段和
    【u123】最大子段和
    【u122】迎接仪式
    【u121】教主的花园
    【u118】日志分析
    【u117】队列安排
  • 原文地址:https://www.cnblogs.com/zyh19980816/p/11830065.html
Copyright © 2011-2022 走看看