zoukankan      html  css  js  c++  java
  • python爬取文件时,内容为空

    解决方式:

    img_res = requests.get(src,headers=header)
    在header中加上referer防盗链
    加上防盗链header的例子:
        header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
    "Referer":"https://www.mzitu.com/",}






    还有关于header的问题,
    如果进不去网址,说明浏览器防火墙给阻断了,这时候要加入 虚拟浏览器头:例子如上
         header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
    "Referer":"https://www.mzitu.com/",}





    还有关于python进行一段时间便出现'NoneType' object has no attribute 'find'
    这是空类型的问题,即 <class 'NoneType'>

       用isinstance()函数将空类型过滤掉。

             例子:

                     源代码如下:

    max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
    

                解决方式:

    max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
         if isinstance(max_no,bs4.element.Tag):
                #后边的代码
    

      

      ************************************************************************************************************

  • 相关阅读:
    LeetCode: LRU Cache
    LeetCode: Reorder List
    LeetCode: Linked List Cycle I && II
    LeetCode: Word Break I && II
    LeetCode: Single Number I && II
    太坑了,mybatis注解一对多,id没了
    ajax请求参数的格式
    查询结果拼接
    id拼接保存到单个字段后作为表连接的查询条件
    seam的定时轮巡
  • 原文地址:https://www.cnblogs.com/xww115/p/11398635.html
Copyright © 2011-2022 走看看