zoukankan      html  css  js  c++  java
  • Python 豆瓣mv爬取

    爬取网址:https://www.dbmeinv.com/       豆瓣mv(现已更名)

    注:自制力不好的同学,先去准备营养快线!

    import requests
    from bs4 import BeautifulSoup
    import urllib.request
    
    # 按照序号命名
    x = 0
    
    #获取图片
    def getGrilsImg(page = 1):
    
        response = requests.get("https://www.dbmeinv.com/?pager_offset={}".format(page))
        # 获取网页
        html = response.text
    
        # 获取对象 解析网页 'html.parser'为解析方式,还有一种为lxml
        soup = BeautifulSoup(html, 'html.parser')
        # 找到img标签  返回一个列表
        girl = soup.find_all('img')
        global x
        for i in girl:
            # 通过提取img标签中的src属性值,获取src路径
            imgsrc = i.get('src')
            # 记得新建images文件夹
            urllib.request.urlretrieve(imgsrc, './images/%d.jpg'%x)
    
            x += 1
            print("正在下载第%d张"%x)
    
    # 1<= x < 11  下载前十页
    for i in range(1,11):
        print("正在下载第{}页图片".format(i))
        getGrilsImg(i)
  • 相关阅读:
    MySQL之force index和ignore index
    Linux中CPU性能分析工具perf简单使用(亲测可用)
    Linux之SeLinux
    Docker基础
    yum常用命令
    MySQL总结
    MySQL字符集详解
    MySQL5.6的4个自带库详解
    Python操作MySQL
    MySQL索引原理
  • 原文地址:https://www.cnblogs.com/tanrong/p/9346045.html
Copyright © 2011-2022 走看看