zoukankan      html  css  js  c++  java
  • 爬虫小程序

    爬虫小程序 - 王者荣耀全皮肤爬取

    • 代码如下所示(可直接复制使用):

    import requests
    import re
    import os
    '''
    ps: 出现 <Response [405]>  多运行几次就好了
    '''
    
    def Downloed_ksin(ename, **kwargs):
        # 英雄详情页
        url = 'https://pvp.qq.com/web201605/herodetail/' + ename + '.shtml'
        html = session.get(url=url, headers=header)
        html.encoding = html.apparent_encoding
        # 获取皮肤名称
        skin_name = re.search(r'data-imgname="(.*?)">', html.text).group(1).split('|')
        infor = {}
        for num in range(len(skin_name)):
            infor[skin_name[num]] = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + ename + '/' + ename + '-bigskin-' + str(num+1) + '.jpg'
        # 返回 {皮肤名称:链接} 形式
        return infor
    
    url_post = 'https://pvp.qq.com/web201605/js/herolist.json'
    header = {
        "User-Agent": "Mozilla/5.0 (Windows NT 6.6; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",
        "Referer": "https://pvp.qq.com/web201605/herolist.shtml",
    }
    session = requests.session()
    html = session.post(url=url_post, headers=header)
    print(html)
    for property in html.json():
        ename = str(property["ename"])  # 获取英雄编号
        cname = property['cname']  # 获取英雄名称
        print(cname)
        skin_url = Downloed_ksin(ename)  # 得到 {皮肤名称:链接} 形式
        os.makedirs('王者荣耀全皮肤' + '/' + str(cname))  # 创建目录
        for v, k in skin_url.items():
            img = requests.get(url=k, headers=header).content
            with open('王者荣耀全皮肤' + '/' + str(cname) + '/' + v + '.jpg', 'wb+') as imgfile:
                imgfile.write(img)
    
    
    • 运行代码后,就会生成高清图片,文件生成地在代码同级目录下.


    原皮+皮肤皆可保存,每个英雄都会以单独文件夹保存

  • 相关阅读:
    每日一题20201109(15. 三数之和)
    每日一题20201106(169. 多数元素)
    每日一题之20201103(941. 有效的山脉数组)
    每日一题之20201102(349. 两个数组的交集)
    【USACO4.4】追查坏牛奶
    【九省联考2018】一双木棋
    【NOI2013】向量内积
    【HNOI2013】游走
    【ZJOI2008】骑士
    【HEOI2014】大工程
  • 原文地址:https://www.cnblogs.com/chao460/p/12400739.html
Copyright © 2011-2022 走看看