zoukankan      html  css  js  c++  java
  • 特朗普凉了,幸好我保存了他所有的推特数据

    美国时间1月8日,推特在官方博客发文称,在仔细审查了@realDonaldTrump 账户最近的推文及其相关背景后,由于存在进一步煽动暴力风险,推特已永久停用该账户。

    那个给我们带来许多快乐的男人可能要与我们渐行渐远了
    他为中华民族伟大复兴做出了巨大贡献,我们不会忘记这位战功卓著的同志。

    说回正事

    同学们学Python,玩数据分析往往需要一些有意思的数据练手,特朗普的推特数据就是一个非常合适的数据集!

    做总统这四年(2016-2020),特朗普一共发了26237个推特,如此丰富的数据可以给同学们足够的分析基础。大家可以练习数据清洗、数据可视化和进一步的数据分析

    甚至有人在Current Biology上发表了一篇论文:《用推特研究时间节律行为》,分析的也是特朗普的推特数据。推文数据中包括每条推文的发表时间、点赞数、转推数,以及推文的内容。我们从推文内容中可以进一步处理得到其中包含的关键词、提示用户(@user)、转推用户(RT: @retweet_user)和事件标签(#event_tag)

    虽然推特永久停用了特朗普的账户,但是有一个神奇的网站(thetrumparchive.com)爬取了2009年3月份特朗普开通账号,到2021年1月8日被停用这十年来特朗普所有的推文。

    完整数据我已经保存到云盘,感兴趣的同学可以公众号后台回复【数据集】获取下载链接。

  • 相关阅读:
    十、补充数据类型set
    MySQL-[--001--]-报错( (1292, u"Truncated incorrect DOUBLE value: '424a000000066'") result = self._query(query))
    四、robotframework生成几种随机数
    三、robotframework封装的关键字-数据库使用
    二、robotframework接口测试-常用关键字介绍
    五、python中MD5加密
    Redis系列
    MonkeyRunnermac
    akka
    Apache Spark 1.6 Hadoop 2.6 Mac下单机安装配置
  • 原文地址:https://www.cnblogs.com/jpld/p/14311043.html
Copyright © 2011-2022 走看看