zoukankan      html  css  js  c++  java
  • Python实现超简单【抖音】无水印视频批量下载

    01 获取你喜欢的拍客的视频url

    很多人学习python,不知道从何学起。
    很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
    很多已经做案例的人,却不知道如何去学习更加高深的知识。
    那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
    QQ群:101677771

    抖音用户主页的url,我将以罗永浩的主页连接为例(本人第一次下载抖音就是冲着罗永浩去的,所以也只关注了他一个人)

    1. 获取主页链接

    打开抖音,点进用户的主页面,点击右上角的三个点:

    选择分享:

    再点击复制链接即可,我们可以获取如下url:

    https://v.douyin.com/JJ8b6Hq/

    2. 获取重定向链接

    我们只需要将上面这个链接粘贴到chrome浏览器,就可以获取到重定向链接

    重定向后的链接:

    https://www.iesdouyin.com/share/user/4195355415549012?u_code=c23d6456gli&sec_uid=MS4wLjABAAAAlwXCzzm7SmBfdZAsqQ_wVVUbpTvUSX1WC_x8HAjMa3gLb88-MwKL7s4OqlYntX4r&timestamp=1590603009&utm_source=copy&utm_campaign=client_share&utm_medium=android&share_app_name=douyin

    现在我们需要记住url中/user后面的一串数字,也就是4195355415549012,这是我们的用户id。以后只要有了这样的用户ID,直接替换进url即可(时间戳也需要修改一下)

    02 获取用户下面的所有的视频id

    我们刚刚获取了视频主页的链接,现在我们要通过主页链接来获取当前页面下的所有视频。为了方便我们观看和调试,我们将Chrome开成iPhone模式。

    1. 获取请求链接

    将Network设置成XHR,重新刷新一下页面,获取请求内容:

    我们可以看到上面选中的那个请求,返回的是一串json,我们将内容复制下来看看,搜索返回的json中有关video的字段,通过下图我们就可以看到video里面有个url_list,里面有两个不同的url,这两个url其实就是视频相关的地址了,但是还有点问题,这两个url点进去并不能直接看到视频。

    2. 获取视频链接

    这里我们需要将url做一点点修改。我们将/play修改成/playwm就可以了,这个时候我们发现,这两个视频地址被重定向成正常的视频地址了。(下面来说为什么要加wm,这个代表什么)

    这样我们就相当于顺利拿到视频的地址了,我们可以去json中获取所有的视频url链接:

    pattern = re.compile('"(https://aweme.snssdk.com/aweme/v1/play/.*?)"')
    result = pattern.findall(data)
    result = [i.replace("/play/", "/playwm/") for i in result]
    for i in result:
        print(i)

    3. 水印问题

    关于水印问题,看了简书上有篇文章有介绍,水印与无水印之间的区别,这边我就不作详细介绍了。其实我们一开始拿到的url就是无水印的,但是链接本身并没重定向到无水印的视频,加上wm之后,url会重定向到有水印的视频。

    简书参考链接

    https://www.jianshu.com/p/af02f00729c5

    水印链接:

    https://aweme.snssdk.com/aweme/v1/playwm/?video_id=v0200fc60000br74l173cp5c4comdoh0&line=0

    无水印链接:

    https://aweme.snssdk.com/aweme/v1/play/?video_id=v0200fc60000br74l173cp5c4comdoh0&line=0

    (多余的参数忽略,不管他)

    转存失败重新上传取消

    03 下载视频

    有了视频链接和获取有无水印的方法之后,我们就可以直接下载视频了。

    import json
    import re
    import requests
    import os
    data = json.dumps(data)
    pattern = re.compile('"(https://aweme.snssdk.com/aweme/v1/play/.*?)"')
    result = pattern.findall(data)
    result = [i.split("&ratio")[0] for i in result]
    result2 = [i.replace("/play/", "/playwm/") for i in result]
    
    for i in result:
        print(i)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36',
    }
    if not os.path.exists("无水印"):
        os.mkdir("无水印")
    if not os.path.exists("水印"):
        os.mkdir("水印")
    
    count = 0
    for res1 in result:
        count += 1
        videoBin = requests.get(res1, timeout=5, headers=headers)
        with open(f'无水印/{count}.mp4', 'wb') as fb:
            fb.write(videoBin.content)
    count = 0
    for res2 in result2:
        count += 1
        videoBin = requests.get(res2, timeout=5, headers=headers)
        with open(f'水印/{count}.mp4', 'wb') as fb:
            fb.write(videoBin.content)

    关于单个视频下载,如果你想下载某单个无水印视频,可以直接通过分享链接进行下载:

    url = "https://v.douyin.com/JJ8kVTc/"  # 分享链接
    session = requests.Session()
    req = session.get(url, timeout=5, headers=HEADERS)
    print(req.text)
    video = re.findall(r'playAddr: "([S]*?)"', req.text)[0]
    vid = re.findall(r'vid=([S]*?)&', video)[0]
    addr = video.replace("/playwm/", "/play/")  # 去除水印
    print(addr)
    headers = {
        'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36',
    }
    videoBin = session.get(addr, timeout=5, headers=headers)
    with open('test.mp4', 'wb') as fb:
        fb.write(videoBin.content)

     

    04 结语

    本文首先通过分享链接来获取接口数据,之后在接口数据中查找视频数据,找到视频内容之后再完成视频下载。爬取过程非常的简单,主要就是查找ID会比较吃力。适合爬虫的新手。

  • 相关阅读:
    oracle登录错误(ORA-01033:ORACLE initialization or shutdown in progress
    mssql 判断sql语句的执行效率语句
    关于 knockout js 学习中的疑问 (1)
    JS 根据Url参数名称来获取对应的值 方法封装
    账户
    windows库
    CentOS的Qt3和Qt4问题
    c/c++调用dll
    CentOS 安装g++
    输入法不见了
  • 原文地址:https://www.cnblogs.com/shann001/p/13471519.html
Copyright © 2011-2022 走看看