zoukankan      html  css  js  c++  java
  • python+requests抓取页面图片

    前言:     

    学完requests库后,想到可以利用python+requests爬取页面图片,想到实战一下。依照现在所学只能爬取图片在html页面的而不能爬取由JavaScript生成的图片,所以我选取饿了打开下面这个页面http://p.weather.com.cn/2017/06/2720826.shtml#p=7

    案例步骤:

    1.利用requests库,调用requests库中的get()方法,打开需要爬去的页面url,返回页面内容,下面是自定义的打开页面的方法

    def load_page(url):
        response=requests.get(url)
        data=response.content
        return data
    

    2.用正则表达式去匹配页面的图片链接,匹配成功后,把图片下载下来,保存到对应的文件位置,下面是自定义的保存图片方法

    def get_image(html):
        regx=r'http://[S]*jpg'
        pattern=re.compile(regx)
        get_images=re.findall(pattern,repr(html))
    
        num=1
        for img in  get_images:
            image=load_page(img)
            with open('./spider_picture/%s.jpg' % num,'wb') as fb:
                fb.write(image)
                print("正在下载第%s张图片" %num)
                num=num+1
        print("下载完成!")
    

      完整案例源码:

    # coding:utf-8
    # 引入requests包和正则表达式包re
    import requests
    import re
    
    # 自定义下载页面函数
    def load_page(url):
        response=requests.get(url)
        data=response.content
        return data
    
    # 自定义保存页面图片函数
    def get_image(html):
        regx=r'http://[S]*jpg'  # 定义图片正则表达式
        pattern=re.compile(regx) # 编译表达式构造匹配模式
        get_images=re.findall(pattern,repr(html)) # 在页面中匹配图片链接
    
        num=1
        # 遍历匹配成功的链接
        for img in  get_images:
            image=load_page(img) #根据图片链接,下载图片链接
            # 将下载的图片保存到对应的文件夹中
            with open('./spider_picture/%s.jpg' % num,'wb') as fb:
                fb.write(image)
                print("正在下载第%s张图片" %num)
                num=num+1
        print("下载完成!")
    
    # 定义爬取页面的链接
    url ='http://p.weather.com.cn/2017/06/2720826.shtml#p=7'
    # 调用load_page函数,下载页面内容
    html = load_page(url)
    # 在页面中,匹配图片链接,并将图片下载下来,保存到对应文件夹
    get_image(html)            

      

  • 相关阅读:
    典型的 C++ 程序员成长经历
    C语言中的常用文件操作
    sscanf与正则表达式
    黑莓8700 常用快捷键
    [分享]《张靓颖个人资源汇集.九月二日更新》
    [分享]【★超级女声★】【★张靓颖★】【推荐】
    [原创]根据TreeView中节点的不同,来绑定不同的dropdownlist
    [转贴]用Vs.net制作安装程序,在安装包中自动为客户创建数据库
    [转贴]在Asp.Net中的几种事务处理的方法
    冻结DataGrid中的列的比较简单的实现方法!
  • 原文地址:https://www.cnblogs.com/101718qiong/p/8192199.html
Copyright © 2011-2022 走看看