zoukankan      html  css  js  c++  java
  • 分析6万条评论,看网友们对新的电视剧《重启之极海听雷》的看法

    前言

    前些日子潘老师领衔主演的《鬼吹灯之龙岭迷窟》,让盗墓题材的影视剧再次热起来,这股热乎劲还没过去多久,紧接着,这些天,又另一盗墓小说《盗墓笔记》改编的电视剧《重启之极海听雷》又跟大家见面了。

    同样是盗墓题材类的影视剧,而且主角是当红演员朱一龙。豆瓣上给出了7.8分的评分,说明制作上和演员的表演也是过关的。今天小编就带领大家来爬取一下大家对这部剧的评论,看一下大家是如何看待这部电视剧的。

    PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取

     

    可以免费领取源码、项目实战视频、PDF文件等

     

    数据的抓取

    首先是对于数据的抓取,小编获取的是爱奇艺下每集电视剧中,观影者对于该集的评价,小编爬取了前五集的一共6万条评论。我们首先需要明确该去如何获取数据呢,如下所示:

     

    我们首先需要根据动态加载的评论,按键盘的F12,打开开发者模式,在开发者模式的network里找到评论的json数据,然后根据其请求的url链接来构建我们的爬虫程序。小编根据上述步骤,写出了对应的爬虫程序,其部分核心程序如下图所示:

     

    上述程序中,首先需要根据基础的url链接,构建实际的爬虫链接,然后获取返回的json数据,并对json数据进行解析,获取我们需要的数据。这里,小编获取到的是评论者的用户名、性别、评论内容,被点赞数和评论的时间等信息。一共有6万条数据。

    数据分析

    在获取到数据之后,接下来就是对于数据的分析了,从数据中,我们能够获取到非常多的有趣的内容。首先,由于朱一龙的存在,所以我们首先要看的就是评论者的性别分布,如下所示:

     

    可以看到,忽略0.8%的性别未知的观众,评论这部影视剧的女性远远超过了男性,女性评论者数量达到了男性的四倍以上,而这里里面的女性评论者绝大部分都是冲着男主朱一龙来的,这里我们在后面的词云分析中也能看出。

     

    对于每一位评语,我们可以看到,绝大多数人的评语都没有收获到点赞,这也符合我们的认知,因为爱奇艺只会将精彩的评论置顶,因此绝大部分评论都不会有观影者特地去点赞。收到0条点赞也是正常的。

     

    对于每集评论数量的分布,可以看到,随着剧集的发展,每一集的评论数量也随之缓慢的下降,当然,这也跟电视剧播出的时间是有很大的关系的,毕竟播出时间早的剧集,评论的人数概率上比后播放的人数自然要多。

    对于每天的评论数和点赞数,如下图所示:

     

    可以看到,从8月5日到8月9日的这五天时间里,评论数量发生了巨大的波动,从8月7日开始,评论数量出现了巨大的滑坡,但是点赞数量已经保持着稳定的水平。

    对于大家的评论,我们来看一下是如何大家的看法:

     

    对于这部电视剧,很大一部分观众是冲着男主角朱一龙来的,无论是他本人还是饰演的“吴邪”角色。这与前面关于观影者以女性居多相呼应。此外这部剧大家的评论也是不错的,认为比较好看,喜欢这部电视剧。

    本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。


    作者:菜鸟哥

  • 相关阅读:
    选择
    git使用笔记
    “子查询返回的值不止一个。当子查询跟随在 =、!=、<、<=、>、>= 之后,或子查询用作表达式时,这种情况是不允许的。”SQL查询错误解析
    sql学习笔记
    python爬虫
    线性代数知识点
    centos7 安装git
    感知机——学习笔记
    Logistic Regression学习笔记
    朴素贝叶斯分类--笔记
  • 原文地址:https://www.cnblogs.com/hhh188764/p/13498282.html
Copyright © 2011-2022 走看看