zoukankan      html  css  js  c++  java
  • 爬虫实战 如何爬取B站视频评论?

    步骤

    (本次爬虫仅以一个视频为示例:链接

    • 查找评论请求api
      在这里插入图片描述
    • 解析URL
      去掉第一个和最后一个参数可得评论URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp&pn=1&type=1&oid=585286365&sort=2
      【其中pn是页码;sort控制排序顺序,1按时间排序,2按热度排序;oid代码视频编号】
      在这里插入图片描述- 开始敲代码
    import requests
    
    header = {"User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0",
    		  "Cookie": ""}
    comments = []
    original_url = "https://api.bilibili.com/x/v2/reply?jsonp=jsonp&type=1&oid=585286365&sort=2&pn="
    
    for page in range(1, 39):   # 页码这里就简单处理了
        url = original_url + str(page)
        print(url)
        try:
            html = requests.get(url, headers=header)
            data = html.json()
            if data['data']['replies']:
                for i in data['data']['replies']:
                    comments.append(i['content']['message'])
        except Exception as err:
            print(url)
            print(err)
    
  • 相关阅读:
    PHP 之sha256 sha512封装
    PHP 之中文转为拼音
    Redis 之仿微博demo
    PHP操作Redis相关函数
    存储过程和变量
    视图
    查询
    约束
    基础一
    轮播图--JS手写
  • 原文地址:https://www.cnblogs.com/phyger/p/14026663.html
Copyright © 2011-2022 走看看