zoukankan      html  css  js  c++  java
  • 爬取图片

    from urllib.request import urlopen, urlretrieve
    import re
    # 大部分网址都可以直击换网址
    url = "http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=%E9%BE%99%E5%8D%B7%E9%A3%8E"
    html = urlopen(url)
    obj = html.read().decode() # 得到网页HTML源码
    print(obj)
    urls = re.findall(r'"objURL":"(.*?)"', obj) # 在这一步,获取网页中的objURL部分,也就是真正的图片地址
    index = 0
    for u in urls:
    if index <= 1: # 控制下载10张
    try:
    print('Downloading...%d' % (index))
    urlretrieve(u, 'pic' + str(index) + '.png') # urlretrieve函数 下载图片
    index += 1
    except Exception: # 当由于网络原因或图片服务器出现问题时,捕获异常即可,不使程序退出
    print('Downloading Failed%d' % (index))
    finally:
    print('Downloading Complete')
    else:
    break
  • 相关阅读:
    软件设计文档
    java基础路线与详细知识点
    hdu 2203 亲和串 kmp
    UVALive 6915 J
    UVALive 6911 F
    UVALive 6906 A
    hdu 3746 Cyclic Nacklace KMP
    hdu 1686 Oulipo kmp算法
    hdu1711 Number Sequence kmp应用
    hdu4749 kmp应用
  • 原文地址:https://www.cnblogs.com/dujunjie/p/12066126.html
Copyright © 2011-2022 走看看