Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。简单易用,同时支持多种推荐算法。基础算法、协同过滤、矩阵分解等
Surprise使用
Surprise里有自带的Movielens数据集。
- 1、载入自带数据集
from surprise import Dataset,evaluate,print_perf #默认载入movielens数据集 data=Dataset.load_builtin('ml-100k') #k折交叉验证 data.split(n_folds=3) #假设使用SVD矩阵分解 algo=SVD() #在数据集上测试效果(评估) perf=evaluate(algo,data,measures=['RMSE','MAE']) print_perf(perf)
- 2、载入自己的数据集
#指定文件所在路径 file_path=os.path.expanduser('文件路径') #告诉文本阅读器,文本的格式是怎样的 reader=Reader(line_format=' ',seq=' ') #加载数据 data=DataSet.load_form_file(file_path,reader=reader)