zoukankan      html  css  js  c++  java
  • 测试开发Python培训:实现屌丝的图片收藏愿望(小插曲)

    测试开发Python培训:实现屌丝的图片收藏愿望(小插曲)

    男学员在学习python的自动化过程中对于爬虫很感兴趣,有些学员就想能收藏一些图片,供自己欣赏。作为讲师只能是满足愿望,帮助大家实现对美的追求,http://wanimal.lofter.com/?page=1,~_~

    第一步:分析请求页面

    我们在上课的时候教给大家firefox,来分析请求页的html源代码,我们请求页面发现规律页面是http://wanimal.lofter.com/?page=2,只要替换掉数字2,变成数字就可以翻页,然后每一个页面里的图片地址发现规律如下

            
            
            
       

    第二步:实现

     

    import requests#首先importrequests和shutils
    import shutil
    from bs4 import BeautifulSoup#再import我们刚才说的BS

    def download(page):#这个函数用来寻找,下载,保存图片
      url = "http://wanimal.lofter.com?page=%d" % page#这里是写好目标地址的url并方便后边循环page(把所有页面都下载了)

      html = requests.get(url).content#这里是通过requests来获得整个网页的源代码并整理
      photos = BeautifulSoup(html).find_all(class_="imgwrapper")#用BeautifulSoup解析html,然后使用BS自带的函数,找到所有class为imgwrapper的项存在一个list里面
      for photo in photos:
        img_url = photo.img["src"]#这里是获得上面每一条里面的img(有这个方法)的“src”里存储的字符串(也就是图片的真实地址)
        # print photo, img_url
        img_filename = "img/" + img_url.split("/")[-1]#使用切片工具切出每一个文件名
        img = requests.get(img_url, stream=True)#保存了
        if requests.get(img_url).status_code == 200:
          with open(img_filename, 'wb') as f:
            shutil.copyfileobj(img.raw, f)
          print img_filename,"saved."#完成了叫一声

    if __name__ == '__main__':
    for page in xrange(1,33):
    download(page)
    原文链接:http://www.cnblogs.com/laoli0201

  • 相关阅读:
    Extjs 动态改变列名
    ext+dwr DynamicGridPanel 封装 态创建ext grid
    extjs 动态表单模板二
    extjs 动态表单模板
    EXTJS 学习笔记(共17项,20090924更新)
    Ext核心API详解Ext.tree.TreePanel
    ExtJS GridPanel动态加载列
    ExtJs之combobox详解
    在 LotusScript 中为自定义对象模拟事件
    Firefox下如何将回车键转为Tab键
  • 原文地址:https://www.cnblogs.com/poptest/p/4881692.html
Copyright © 2011-2022 走看看