zoukankan      html  css  js  c++  java
  • bibli直播弹幕实时爬取

    1 分析数据来源

    •    在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息
    •    在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图

    2 查看文件的请求信息

    3 查看请求头信息,构建请求头

    • 请求头;
    headers={
        'Content-Type':'application/x-www-form-urlencoded',
        'Origin': 'https://live.bilibili.com',
        'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36',
    }
    •  请求体数据
    data={ 
        'roomid': '7734200', #房间号
        'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a',
        'csrf': 'fa56950667934cf5a3479ca94abc1f9a',
        'visit_id': '',
    }

    4 代码

    import requests
    import time
    
    #请求头 headers
    ={ 'Content-Type':'application/x-www-form-urlencoded', 'Origin': 'https://live.bilibili.com', 'Referer':'https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36', }
    #请求体 data
    ={ 'roomid': '7734200', 'csrf_token': 'fa56950667934cf5a3479ca94abc1f9a', 'csrf': 'fa56950667934cf5a3479ca94abc1f9a', 'visit_id': '', } url='https://api.live.bilibili.com/ajax/msg'

    #实时请求数据 while True: time.sleep(2) response=requests.post(url=url,headers=headers,data=data) dic_data=response.json() # print(type(dic_data)) content=[item['text'] for item in dic_data['data']['room']] print(content)

     5 效果

  • 相关阅读:
    POJ 1795 DNA Laboratory
    CodeForces 303B Rectangle Puzzle II
    HDU 2197 本源串
    HDU 5965 扫雷
    POJ 3099 Go Go Gorelians
    CodeForces 762D Maximum path
    CodeForces 731C Socks
    HDU 1231 最大连续子序列
    HDU 5650 so easy
    大话接口隐私与安全 转载
  • 原文地址:https://www.cnblogs.com/angle6-liu/p/10579983.html
Copyright © 2011-2022 走看看