zoukankan      html  css  js  c++  java
  • Python爬取网络图片

    代码:

    import  urllib
    import  urllib.request
    import re
    #打开网页,下载器
    def open_html ( url):
        require=urllib.request.Request(url)
        reponse=urllib.request.urlopen(require)
        html=reponse.read()
        return html
    #下载图片
    def load_image(html):
        regx='http://[S]*jpg'
        pattern=re.compile(regx)
        get_image=re.findall(pattern,repr(html))
    
        num=1
        for img in get_image:
            photo=open_html(img)
            
            with open(r'E:Photo\%s.jpg'%num,'wb') as f:
                print('开始下载图片')
                f.write(photo)
                print('正在下载第%s张图片'%num)
                f.close()
            num=num+1
        if num>1:
            print('下载成功!!!')
        else:
            print('下载失败!!!')
    
    url='http://www.qiqipu.com/'
    html=open_html(url)
    load_image(html)

    执行结果:

     注意:

      在运行之前,必须要有路径(文件夹):E:Photo

      如果网站是HTTPS可以将正则中的http换为HTTPS,可以再定义一个下载图片的函数

      如果想要下载jpg、png、gif等多种格式的图片可以将正则中的jpg换为对应格式,也可以使用元组定义多种格式后遍历

    我这里只要jpg就可以,就不改了,大家可以自己改下

  • 相关阅读:
    学习进度笔记4
    学习进度笔记3
    学习进度笔记2
    学习进度笔记1
    《梦断代码》提及文献
    《梦断代码》阅读笔记6
    《梦断代码》阅读笔记5
    需求征集系统开发进度5
    《梦断代码》阅读笔记4
    spark filter
  • 原文地址:https://www.cnblogs.com/feiquan/p/8685835.html
Copyright © 2011-2022 走看看