zoukankan      html  css  js  c++  java
  • Python电影数据分析

    数据说明:MovieLens数据集,它包含来自于943个用户以及精选的1682部电影的100K个电影打分。每个用户至少为20部电影打分,数据类型user id | item id | rating | timestamp. 

    地址:https://grouplens.org/datasets/movielens/

    1、引入pandas,numpy包

    2、读取数据:首先,文件如果不在默认路径下,需要更改路径,使用下面两行命令,另外要注意正反斜杠的应用。

    os.getcwd()

    os.chdir("新的路径")

    3、由于数据包含了打分数据,用户数据,但在两个文件里,因此需要合并。首先,使用header=['l列名1','列名2'.....]格式给两个文件添加列名

    然后数据合并

    结果:

    将文件转换成字典类型,并按照列名读取两列

     数据统计分析,data.describe()

     

  • 相关阅读:
    监听器
    过滤器
    连接池与分页
    jdbc优化
    jdbc入门
    web开发mysql基础
    自定义标签
    jsp基础
    会话管理入门
    19. Remove Nth Node From End of List C++删除链表的倒数第N个节点
  • 原文地址:https://www.cnblogs.com/luban/p/8885121.html
Copyright © 2011-2022 走看看