zoukankan      html  css  js  c++  java
  • Python爬虫入门教程 45-100 Charles抓取兔儿故事-下载小猪佩奇故事-手机APP爬虫部分

    1. Charles抓取兔儿故事背景介绍

    之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事。
    爬虫编写起来核心的重点是分析到链接,只要把链接分析到,剩下的就好办了。
    python爬虫

    2. 待爬取APP链接分析

    夜神模拟器安装APP完毕,之后打开相应的软件,进去到小猪佩奇的分类清单,注意Charles,在里面尽量的去找到下图的链接,说白了就是在APP翻来翻去,看Charles的变化。

    python爬虫

    在分析中得到如下链接

    http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startKey=&x_api_appid=VcDRKTFwD4riHfUQ&x_api_nonce=a502c9aa0f598887fdef0636fc1f28f4&x_api_sign=f90b1e442038d825f0f1f4ea328cbfce&x_api_time=1547476580
    

    分析参数得到,数据只有3页,可以说是非常少了,当然,如果你去遍历分类页,那再多的故事也是可以得到的

    http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startKey=1
    http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startKey=2
    http://api.tuer123.com/app/android/v1.4/category/detail.html?sort=187&startKey=3 
    

    点击链接在右侧得到JSON数据
    python爬虫

    获取到URL

    http://res.tuer123.com/source/voice/1802/357_file_95e14b6690.mp3
    

    3. 编写MP3下载方法

    写一个单个音频下载的办法,你自行扩展吧

    import requests
    import time
    res = requests.get("http://res.tuer123.com/source/voice/1802/357_file_95e14b6690.mp3")
    content = res.content
    with open(str(int(time.time()))+".mp3","wb+") as f:
        f.write(content)
    

    打开默认播放器,当听到我是佩奇的声音传递而来,表示音频已经下载完毕啦~~

    python爬虫

  • 相关阅读:
    LAMP环境搭建
    Httpd
    MySQL常用配置和性能压力测试:MySQL系列之十五
    MySQL的高可用实现:MySQL系列之十四
    MySQL的复制:MySQL系列之十三
    备份与恢复:MySQL系列之十二
    日志记录:MySQL系列之十一
    事务隔离实现并发控制:MySQL系列之十
    SpringMVC上传文件(图片)并保存到本地
    W10如何开启LinuxBash及安装Ubuntu
  • 原文地址:https://www.cnblogs.com/happymeng/p/10481430.html
Copyright © 2011-2022 走看看