zoukankan      html  css  js  c++  java
  • 如何利用python爬虫爬取爱奇艺VIP电影?

    环境:windows    python3.7

    思路:

    1、先选取你要爬取的电影

    2、用vip解析工具解析,获取地址

    3、写好脚本,下载片断

    4、将片断利用电脑合成

    需要的python模块:

    ##第一个模块不要安装,第二个模块需要安装

    1、from multiprocessing import Pool

    2、import requests

    ##模块安装方法

    用windows命令行终端

    pip install requests

    一、先选取你要爬的电影,本例随便找了个VIP电影,复制地址

    二、用vip解析工具解析,获取地址

     (一)进行上网搜索,点击VIP解析

    (二)、粘贴电影地址,点击播放

     

    (三)、按下F12或者右击点检查,进入开发者工具界面,点击网络,复制地址

    三、写好脚本,利用爬虫下载片断

    复制代码
    ##描述:该脚本目前适合下载爱奇艺,腾迅视频VIP视频
    ##作者:小刘
    ##电话:有事请写评论
    ##注意:只适全python爬虫的学习者,不适合专门去看电影的爱好者
    ##导入的两个模块,其中requests模块需要自行下载
    from multiprocessing import Pool
    import requests
    ##定义一个涵数
    def demo(i):
        ##定义了一个url,后面%3d就是截取后面三位给他加0,以防止i的参数是1的时候参数对不上号,所以是1的时候就变成了001
        url="https://vip.okokbo.com/20180114/ArVcZXQd/1000kb/hls/phJ51837151%03d.ts"%i
        ##定义了请求头信息
        headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36"}
        ##构建自定义请求对象
        req=requests.get(url,headers=headers)
        ##将文件保存在当前目录的mp4文件中,名字以url后十位数起名
        with open('./mp4/ {}'.format(url[-10:]), 'wb') as f:
            f.write(req.content)
    
    ##程序代码的入口
    if __name__=='__main__':
        ##定义一个进程池,可以同时执行二十个任务,不然一个一个下载太慢
        pool = Pool(20)
        ##执行任务的代码
        for i in range(100):
            pool.apply_async(demo, (i,))
    
        
        pool.close()
        pool.join()
    复制代码

     四、将片断利用电脑合成

    (一)、复制电影存放的路径

     (二)、用进入windows命令行模式,粘贴地址

     

     (三)、复制该目录下所有以*.ts结尾的文件,复制成一个文件

     

     (四)、进行合并

     

    (五)、进行验证

  • 相关阅读:
    【每天半小时学框架】——React.js的模板语法与组件概念
    PHP中使用 $_GET 与$_POST 实现简单的前后台数据传输交互功能
    轻松几句搞定【Javascript中的this指向】问题
    跨平台移动端APP开发---简单高效的MUI框架
    JavaScript基本知识点整理(超实用)
    一款特好用的JavaScript框架——JQuery
    一个比较实用的商业级图表Echarts
    MUI顶部选项卡的用法(tab-top-webview-main)
    一个非常好用的前端JS框架-AngularJS(一)
    JavaScript面向对象中的继承
  • 原文地址:https://www.cnblogs.com/ouyang99-/p/11782683.html
Copyright © 2011-2022 走看看