1、题目:一种新的基于深度学习的协同过滤推荐系统
2、摘要:
以协同过滤(CF)为基础的模型主要获取用户和项目的交互或者相关性。然而,现有的基于CF的方法只能掌握单一类型的关系,如RBM,它只能获取用户-用户或项目-项目关系的相关性,而矩阵分解(MF)可以捕捉到用户-项目之间的相互作用。
为了克服基于CF方法的这些困难,我们提出了一种新的深层学习方法,主要分为两个阶段:①获取用户以及项目的预先表示②神经网络预测。
在初始阶段,对应的低维向量的用户和项目单独学习,获得用户–用户和项目–项目相关的语义信息。
在预测阶段,一个前馈神经网络来模拟用户和项目之间的相互作用,其中对应的表征向量(第一阶段得到的)作为神经网络的输入。
基于两个基准数据集的几个实验(MovieLens 1M MovieLens 10m)验证了所提出方法的有效性,结果表明我们的模型比以前的方法更有效。
3、引言:
现有的个性化推荐系统大致可以分为两类:(1)基于内容的模型(2)基于CF协同过滤的模型。
基于内容的模型:从用户轮廓或项目描述中提取特征来推荐
基于CF的模型:使用用户历史的行为来做未来的推荐,包括①MF②RBM
MF缺点:不能明确说明用户和项目内积之间的交互关系。
RBM缺点:只能单一获得用户与用户或项目与项目之间的关系。
捕捉复杂关系的最强大方法是使用深层的学习技术,然而,在基于CF的模型中采用深层神经网络的研究非常有限。
4、模型概述
阶段1:预学习表示(项目的表示、用户的表示) | |
阶段2:神经网络预测 |
阶段1:共现矩阵y和z:(U12表示给了项目2评分1的用户集合)
总体共现:y就是比较两列项目评分一样的个数,比如y21=1即项目t1和t2只用u1给了一样的分数1.
局部共现:z的加总为y,难以解释,请看图。
简单来说,就是用movielens数据中的评分进行统计获得项目的共现矩阵和用户的共现矩阵,分别通过总体(CM模型)和局部(RIM模型)来对用户和项目共现矩阵进行MF:得到分解的四个矩阵就是项目和用户的CM、RIM表示。
用户和项目的总体模型(CM)如下:
ei、ej为项目的嵌入表示,第一阶段的结果,bi、bj为偏正项,log是为了光滑,yi是总体的用户共现矩阵。
ri、rj为用户的嵌入表示,第一阶段的结果,^bi、^bj为偏正项,log是为了光滑,^yi是总体的用户共现矩阵。
用户和项目的局部模型(RIM)如下:
类似总体模型。
运用梯度下降求解。
阶段2:神经网络预测评分(5层)
红圈为阶段1的结果,作为神经网络的输入。
5、实验
数据集:MovieLens 1M和MovieLens 10M
(1)阶段1的评价用了聚类,结果通过聚类图分析。然后是相似性分析。
(2)阶段2的预测评价标准RMSE,比较方法:Bias Matrix Factorization (BMF)、 LLORMA、RBM-CF、 Autorec、CF-NADE、NNMF、Zanotti’s Methods、Multiview Neural Networks、Multiview Neural Networks+BiasMF、
阶段2的推荐Top-N的评价标准:recall(评分5的项目作为喜欢项目)
(3)神经网络的各层的影响。
6、总结
未来:时序、文本信息等都可以考虑