zoukankan      html  css  js  c++  java
  • 下载漫画网站图片示例

    import requests,bs4,os
    #利用 requests 模块下载页面
    url='http://xkcd.com'
    os.makedirs('xkcd', exist_ok=True) #创建一个文件夹xkcd
    
    
    while not url.endswith('#'):
        res=requests.get(url)
        res.raise_for_status() #没有下载到则报错
    
        #利用 Beautiful Soup 找到页面中漫画图像的 URL
        soup=bs4.BeautifulSoup(res.text,"html.parser")
        sel=soup.select('#comic img')
        if sel==[]:
            print('没有下载到图片哦!')
        else:
            imgurl='http:'+sel[0].get('src')
            if imgurl.startswith('http://imgs.xkcd.com'):
                print('Imgurl检查正常..')
            else:
                imgurl='http://xkcd.com'+sel[0].get('src')
                
            #利用 iter_content()下载漫画图像,并保存到硬盘
            print('下载图片: %s...' % (imgurl))
            res = requests.get(imgurl)
            res.raise_for_status()
            
            imgfile=open(os.path.join('xkcd',os.path.basename(imgurl)),'wb')
            for chunk in res.iter_content(100000):
                imgfile.write(chunk)
            imgfile.close
            
        #找到前一张漫画的链接 URL,然后重复
        prevlink=soup.select('a[rel="prev"]')[0]
        url='http://xkcd.com'+prevlink.get('href')
    print('完成!')
  • 相关阅读:
    DELPHI美化界面
    WebSevice相关
    Hotmail邮件接收
    DHTMLEdit
    Eclipse 基础
    POP3相关
    DELPHI中GIF的使用
    javaaop
    RAD Studio 2010 启动报错"displayNotification: 内存不够" 解决办法
    编程之道
  • 原文地址:https://www.cnblogs.com/chenxi188/p/10523950.html
Copyright © 2011-2022 走看看