zoukankan      html  css  js  c++  java
  • python抓取网站的图片并下载到本地

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
    import re
    import urllib,urllib2;
    
    
    #通过url获取网页
    def getHtml(url):
        # 要设置请求头,让服务器知道不是机器人
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    headers = {'User-Agent': user_agent}
    
        request=urllib2.Request(url,headers=headers);
        page = urllib2.urlopen(request);
        html = page.read()
        return html
    
    
    #通过正则表达式来获取图片地址,并下载到本地
    def getImg(html):
        reg = r'src="(.+?.jpg)"'
    imgre = re.compile(reg)
        imglist = imgre.findall(html)
        x = 0
        for imgurl in imglist:
            print imgurl;
            #通过urlretrieve函数把数据下载到本地的D:\images,所以你需要创建目录
    urllib.urlretrieve(imgurl, 'D:\images\%s.jpg' % x)
            x = x + 1
    
    
    html = getHtml("http://www.qiushibaike.com/imgrank/")
    getImg(html)
  • 相关阅读:
    03.yaml语法和playbook写法
    02.ansible的常用模块
    01.ansible基本配置与使用
    24.删除表名
    23.MySQL的备份与恢复
    22.更改表名
    MySQL的表操作
    MySQL的库操作
    MySQL的用户管理
    数据库及MySQL概述
  • 原文地址:https://www.cnblogs.com/juanbai/p/6517925.html
Copyright © 2011-2022 走看看