zoukankan      html  css  js  c++  java
  • bibli直播弹幕实时爬取

    1 分析数据来源

    •    在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息
    •    在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图

    2 查看文件的请求信息

    3 查看请求头信息,构建请求头

    • 请求头;
    headers={
        'Content-Type':'application/x-www-form-urlencoded',
        'Origin': 'https://live.bilibili.com',
        'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36',
    }
    •  请求体数据
    data={ 
        'roomid': '7734200', #房间号
        'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a',
        'csrf': 'fa56950667934cf5a3479ca94abc1f9a',
        'visit_id': '',
    }

    4 代码

    import requests
    import time
    
    #请求头 headers
    ={ 'Content-Type':'application/x-www-form-urlencoded', 'Origin': 'https://live.bilibili.com', 'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36', }
    #请求体 data
    ={ 'roomid': '7734200', 'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a', 'csrf': 'fa56950667934cf5a3479ca94abc1f9a', 'visit_id': '', } url='https://api.live.bilibili.com/ajax/msg'

    #实时请求数据 while True: time.sleep(2) response=requests.post(url=url,headers=headers,data=data) dic_data=response.json() # print(type(dic_data)) content=[item['text'] for item in dic_data['data']['room']] print(content)

     5 效果

  • 相关阅读:
    MVC--全选反选
    文件上传(表单,Ajax)、文件下载
    Java的一些细节语法(不定时更新。。。)
    并发基础知识
    Linux基本命令操作
    Linux基本操作和自己动手组装服务器
    VMware虚拟机和CentOS系统的安装过程
    安装操作系统
    中间件介绍
    wifi破解
  • 原文地址:https://www.cnblogs.com/angle6-liu/p/10579983.html
Copyright © 2011-2022 走看看