Python爬虫教程-09-error模块
今天的主角是error,爬取的时候,很容易出现错,所以我们要在代码里做一些,常见错误的处,关于urllib.error
URLError
- URLError 产生的原因:
- 1.无网络连接
- 2.服务器连接失败
- 3.找不到指定的服务器
- 4.URLError是OSError的子类
- 案例v9文件:https://xpwi.github.io/py/py爬虫/py09error.py
# 案例v9
# URLError的使用
from urllib import request,error
if __name__ == '__main__':
url = "http://www.baiiiiiiiiiiidu.com/"
try:
req = request.Request(url)
rsp = request.urlopen(req)
html = rsp.read().decode()
print(html)
except error.URLError as e:
print("URLError:{0}".format(e.reason))
print("URLError:{0}".format(e))
except Exception as e:
print(e)
HTTPError
- 1.是URLError的一个子类
URLError和HTTPError的区别:
- HTTPError是对应的HTTP请求的返回码错误,如果返回错误码是400以上的,则引发HTTPError
- URLError对应的一般是网络出现问题,包括url问题
更多文章链接:Python 爬虫随笔
- 本笔记不允许任何个人和组织转载