爬虫之urllib.error模块

zoukankan html css js c++ java

爬虫之urllib.error模块
error模块简介

我们在爬虫的时候发请求的时候难免出现错误，如访问不到服务器或者访问被禁止等等，

出错了之后urllib将错误信息封装成了一个模块对象中，这个模块就叫error模块

error的分类

分为URLError和HTTPError。

URLError是OSError的一个子类

有以下错误的时候错误信息就会被封装在URLError里：
1. 无网络
2. 有网络但是由于种种原因导致服务器连接失败
而如果能够连接服务器但是服务器返回了错误代码如404，403等等（400以上），那么催无信息就会被封装在HTTPError里

URLError与HttpError的区别和关系

区别：
- URLError封装的错误信息一般是由网络引起的，包括url错误
- HTTPError封装的错误信息一般是服务器返回了错误状态码
关系：
- URLError是OSERROR的子类，HTTPError是URLError的子类
使用方法

error类是在捕获错误信息的时候使用，而且一般我们也需要进行捕获，因为你很难确定访问请求一定不会出现错误
from urllib import request from urllib import error url = 'http://baiduuuu.com' try: res = request.Request(url) response = request.urlopen(res) print(response.read().decode()) except error.HTTPError as he: print(he) # print(he.reason) except error.URLError as ue: print(ue) # print(ue.reason) except Exception as e: print(e)
注意：由于HTTPError是URLError的子类，所以捕获的时候HTTPError要放在URLError的上面
查看全文

相关阅读:
【转】安装VS2008:this application has requested the run
【转】开源史上的8大交易
 PowerDesigner属性设置笔记
 国外威客网站大盘点
 [Java]单项链表与双端链表[原]
Jenkins学习总结（3）——Jenkins+Maven+Git搭建持续集成和自动化部署的
 Jenkins学习总结（2）——Jenkins+Maven进行Java项目持续集成
 Jenkins学习总结（2）——Jenkins+Maven进行Java项目持续集成
 创业公司如何实施敏捷开发
 创业公司如何实施敏捷开发

原文地址：https://www.cnblogs.com/fu-yong/p/9017400.html

最新文章
查找最大元素
 首字母变大写
 统计元音
 Sky数
 分拆素数和
 整除的尾数
 小明A+B
ArrayList
ListIterator特有的方法
 List接口中特有方法

爬虫之urllib.error模块

error模块简介

error的分类

URLError与HttpError的区别和关系

使用方法