zoukankan      html  css  js  c++  java
  • python抓取网页图片

    本人比较喜欢海贼王漫画,所以特意选择了网站http://www.mmonly.cc/ktmh/hzw/list_34_2.html来抓取海贼王的图片。

    因为是刚刚学习python,代码写的不好,不要喷。

    功能主要抓取此网页的图片如下:

     贴代码:

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    import urllib2
    import re
    url1 = "http://www.mmonly.cc/ktmh/hzw/list_34_2.html"
    request = urllib2.Request(url1)
    req = urllib2.urlopen(request)
    buf = req.read()
    url_list = re.findall(r'src="http://t1.+?.png', buf)#正则表达式
    #for img_url in url_list:
    #    print img_url[5:]
    
    index = 1
    for img_url in url_list:
        f = open(str(index)+'.png','wb')
        img_req = urllib2.urlopen(img_url[5:])
        img_buf = img_req.read()
        f.write(img_buf)
        f.close()
        index +=1

    执行代码后的效果:

  • 相关阅读:
    常见HTTP状态码
    Spring MVC 原理小结
    RESTful API
    java:IO流学习小结
    理解 Statement 和 PreparedStatement
    Hibernate缓存原理与策略
    APP运营
    网站常见术语
    php常见术语
    运维------术语名词
  • 原文地址:https://www.cnblogs.com/nx520zj/p/5788528.html
Copyright © 2011-2022 走看看