pandas第一课
首先是数据的准备
movies.dat
user.dat
ratings.dat
注意,这些数据都是通过::来隔开每一列的,每一列有各自的含义
现在通过pandas来读入数据
首先是定义一个列表,列出每一列的名称
然后就用pd.read_table()函数来读入整个数据文件。
程序如下:
# -*- coding: utf-8 -*- """ Created on Wed Sep 5 11:09:33 2018 @author: user """ import pandas as pd unames = ['user_id', 'gender', 'age','occupation','zip'] users = pd.read_table('users.dat', sep='::',header=None, names=unames) rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] ratings = pd.read_table('ratings.dat', sep='::', header=None, names=rnames) mnames = ['movie_id', 'title', 'genres'] movies = pd.read_table('movies.dat', sep='::', header=None, names=mnames)
读入数据后,生成的结果为: