zoukankan      html  css  js  c++  java
  • python抓取网站的图片并下载到本地

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
    import re
    import urllib,urllib2;
    
    
    #通过url获取网页
    def getHtml(url):
        # 要设置请求头,让服务器知道不是机器人
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    headers = {'User-Agent': user_agent}
    
        request=urllib2.Request(url,headers=headers);
        page = urllib2.urlopen(request);
        html = page.read()
        return html
    
    
    #通过正则表达式来获取图片地址,并下载到本地
    def getImg(html):
        reg = r'src="(.+?.jpg)"'
    imgre = re.compile(reg)
        imglist = imgre.findall(html)
        x = 0
        for imgurl in imglist:
            print imgurl;
            #通过urlretrieve函数把数据下载到本地的D:\images,所以你需要创建目录
    urllib.urlretrieve(imgurl, 'D:\images\%s.jpg' % x)
            x = x + 1
    
    
    html = getHtml("http://www.qiushibaike.com/imgrank/")
    getImg(html)
  • 相关阅读:
    ScrollView 字典
    centos 6.x 安装redis
    Linux 添加epel源
    Linux 关于解压
    Linux 删除文件夹
    Linux sz rz
    让div 实现 input效果
    解决js浮点数计算bug
    键盘绑定事件和焦点处理
    npm的镜像替换成淘宝
  • 原文地址:https://www.cnblogs.com/juanbai/p/6517925.html
Copyright © 2011-2022 走看看