zoukankan      html  css  js  c++  java
  • python爬取文件时,内容为空

    解决方式:

    img_res = requests.get(src,headers=header)
    在header中加上referer防盗链
    加上防盗链header的例子:
        header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
    "Referer":"https://www.mzitu.com/",}






    还有关于header的问题,
    如果进不去网址,说明浏览器防火墙给阻断了,这时候要加入 虚拟浏览器头:例子如上
         header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
    "Referer":"https://www.mzitu.com/",}





    还有关于python进行一段时间便出现'NoneType' object has no attribute 'find'
    这是空类型的问题,即 <class 'NoneType'>

       用isinstance()函数将空类型过滤掉。

             例子:

                     源代码如下:

    max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
    

                解决方式:

    max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
         if isinstance(max_no,bs4.element.Tag):
                #后边的代码
    

      

      ************************************************************************************************************

  • 相关阅读:
    自考新教材-p282
    p281
    自考新教材-p279_2
    用jmap分析java程序
    用jstack工具分析java程序
    java应用maven插件动态生成webservice代码
    Java对信号的处理
    【OracleDB】 01 概述和基本操作
    【Oracle】Windows-19C 下载安装
    【Hibernate】06 查询API
  • 原文地址:https://www.cnblogs.com/xww115/p/11398635.html
Copyright © 2011-2022 走看看