zoukankan      html  css  js  c++  java
  • 爬虫2

    爬取网页的通用代码框架

    异常 说明
    requests.ConnectionError 网络连接错误异常,比如DNS查询失败、拒绝连接等
    requests.HTTPError HTTP错误异常
    requests.URLRequired URL缺失异常
    requests.TooManyRedirects 超过最大重定向次数,产生重定向异常
    requests.ConnectTimeout 连接远程服务器超时异常
    requests.Timesout 请求URL超时,产生超时异常

    理解requests库的异常:

    r.raise_for_status() 如果不是200,产生异常requests.HTTPError

    示例:

    import requests
    def getHTMLText(url):
        try:
            r=requests.get(url,timeout=30)
            r.raise_for_status()#如果状态不是200,引发HTTPError异常
            r.encoding=r.apparent_encoding
            return r.text
        except:
            return '产生异常'

    结果:

  • 相关阅读:
    27.TreeMap
    26.HashCode
    25.HashTable
    myeclipse快捷键
    spring 配置
    jdbcType和javaType对应关系
    Ajax表单提交
    ajax
    JQuery及Form插件使用
    jsp标准数据库
  • 原文地址:https://www.cnblogs.com/rayshaw/p/8559733.html
Copyright © 2011-2022 走看看