zoukankan      html  css  js  c++  java
  • selenium+requests爬取百度图片(基础篇)

     1 写着玩儿的
     2 # coding=utf-8
     3 from selenium import webdriver
     4 import requests,time,os
     5 d = webdriver.Chrome()
     6 d.maximize_window()
     7 d.get("https://www.baidu.com")
     8 d.find_element_by_id("kw").send_keys("吴彦祖")
     9 d.find_element_by_id("su").click()
    10 time.sleep(1)
    11 d.find_element_by_xpath("//div[@id='content_left']//a").click()
    12 time.sleep(1)
    13 handles = d.window_handles
    14 d.switch_to.window(handles[1])
    15 eles = d.find_elements_by_xpath("//div[@class='imgbox']//img")
    16 print(eles)
    17 urls=[]
    18 for ele in eles:
    19     url = ele.get_attribute("src")
    20     urls.append(url)
    21 print(urls)
    22 path =r"C:UsersshixiDesktop吴彦祖\"
    23 #如果路径不存在,则新建路径
    24 if os.path.isdir(path)!=True:
    25     os.mkdir(path)
    26 i = 0
    27 for url in urls:
    28     fname = url.split(",")[1].split("&")[0]+".jpg"
    29     resp = requests.get(url,timeout=30)
    30     data = resp.content
    31     with open(path+fname,'wb') as f:
    32         f.write(data)
    33     i+=1
    34     if i==9:
    35         break
    36 d.quit()
    37 ————————————————
    38 版权声明:本文为CSDN博主「Blackeggg」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
    39 原文链接:https://blog.csdn.net/qq_38928520/article/details/90295016
  • 相关阅读:
    思考:缓存的使用?灵活运用?
    线程和并发--基础
    java基础--方法
    java基础--数组
    数据结构复习笔记
    asp搭建网站
    转换磁盘格式
    cypress 与其他测试框架的区别
    cypress启动时报错file already exists,文件已经存在解决办法
    cypress的安装
  • 原文地址:https://www.cnblogs.com/mudingxi/p/12727055.html
Copyright © 2011-2022 走看看