zoukankan
html css js c++ java
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 344: invalid start byte报错解决方案
一、问题描述
使用python爬虫爬取某网页的内容时,代码中因为这行代码报错:cont = rep.read().decode()
二、出现原因
你请求获取到的内容不是utf-8编码,如果是utf-8编码可以在decode()中不写,默认utf-8
三、解决方案
1、首先查看你要爬取网页的内容的编码格式,如下图
2、如果非utf-8编码,就需要在decode()函数中标明,比如我应该写为:cont = rep.read().decode('gb2312'),问题解决。
查看全文
相关阅读:
长篇专访科比:成功没秘诀 只有不断努力
生活哲理
8个让程序员追悔莫及的职业建议
优秀程序员必备十大习惯
回顾马云屌丝岁月的惨状:多次被拒失声痛哭
程序员,究竟该怎么赚钱?
洛杉矶凌晨4点-------启航
iOS越狱开发
iOS越狱开发中遇到的坑
macOS上搭建RabbitMQ+MQTT服务器
原文地址:https://www.cnblogs.com/lxmtx/p/12651922.html
最新文章
微信支付开发h5调用
微信js sdk分享开发摘记java版
hibernate并发时的事务处理
java中对象的初始化问题
Spring Log4jConfigListener部署多个项目是出错的问题
Python中通过open()操作文件时的文件中文名乱码问题
python中用ElementTree.iterparse()读取xml文件中的多层节点
基于HTML+CSS+Javascript开发窗口应用
人生哲理
穷?富?
热门文章
为了家,该更加沉稳。
怎样度过人生的低潮期?
20部经济类纪录片
24个关键词致敬科比系列之——凌晨四点
2016年国家公务员考试公告
作为一个有技术背景的你(转载)
高效程序员的 7 个共同特征
智力题--逻辑题
为什么你宁愿每周工作90小时,也不做任何改变?(转载)
35岁前成功的12条黄金法则
Copyright © 2011-2022 走看看