zoukankan      html  css  js  c++  java
  • python-一个小爬虫,爬取图片

    import re
    import urllib.request
    # 爬取网页
    def getHtml(url):
        page=urllib.request.urlopen(url)
        html=page.read()
        return html
    # 获取图片地址
    def getImg(html):
        rule=r'src="(.*?.jpg)" width'
        rule_compile=re.compile(rule)
        Img_list=re.findall(rule_compile,html.decode('GBK'))
        return Img_list
    url="http://desk.zol.com.cn/bizhi/7005_87014_2.html"
    html=getHtml(url)
    # print(getImg(html))
    #  下载图片到当前目录
    x=0
    for i in getImg(html):
        urllib.request.urlretrieve(i,'%s爬虫.jpg' % x)
        x+=1
     
  • 相关阅读:
    1月19日
    1月18日
    1月17日
    读后感(1)
    UIAlertView
    plist
    jQuery validation
    HTML <a href >标签的target属性
    HTML DOM
    .与..的区别
  • 原文地址:https://www.cnblogs.com/yangwujun/p/6598519.html
Copyright © 2011-2022 走看看