zoukankan html css js c++ java

矩阵分解在协同过滤推荐算法中的应用

https://www.cnblogs.com/pinard/p/6351319.html

　在协同过滤推荐算法总结中，我们讲到了用矩阵分解做协同过滤是广泛使用的方法，这里就对矩阵分解在协同过滤推荐算法中的应用做一个总结。(过年前最后一篇！祝大家新年快乐！明年的目标是写120篇机器学习，深度学习和NLP相关的文章)

1. 矩阵分解用于推荐算法要解决的问题

　　　　在推荐系统中，我们常常遇到的问题是这样的，我们有很多用户和物品，也有少部分用户对少部分物品的评分，我们希望预测目标用户对其他未评分物品的评分，进而将评分高的物品推荐给目标用户。比如下面的用户物品评分表：

用户物品	物品1	物品2	物品3	物品4	物品5	物品6	物品7
用户1	3		5			1
用户2		2					4
用户3				4
用户4			2				1
用户5	1				4

　　　　对于每个用户，我们希望较准确的预测出用户对未评分物品的评分。对于这个问题我们有很多解决方法，本文我们关注于用矩阵分解的方法来做。如果将m个用户和n个物品对应的评分看做一个矩阵 $M$

2. 传统的奇异值分解SVD用于推荐

　　　　说道矩阵分解，我们首先想到的就是奇异值分解SVD。在奇异值分解(SVD)原理与在降维中的应用中，我们对SVD原理做了总结。如果大家对SVD不熟悉的话，可以翻看该文。

　　　　此时可以将这个用户物品对应的 $m \times n$

M m \times n = U m \times k Σ k \times k V T k \times n

　　　　其中k是矩阵 $M$

　　　　可以看出这种方法简单直接，似乎很有吸引力。但是有一个很大的问题我们忽略了，就是SVD分解要求矩阵是稠密的，也就是说矩阵的所有位置不能有空白。有空白时我们的 $M$

　　　　虽然有了上面的补全策略，我们的传统SVD在推荐算法上还是较难使用。因为我们的用户数和物品一般都是超级大，随便就成千上万了。这么大一个矩阵做SVD分解是非常耗时的。那么有没有简化版的矩阵分解可以用呢？我们下面来看看实际可以用于推荐系统的矩阵分解。

3. FunkSVD算法用于推荐

　　　　FunkSVD是在传统SVD面临计算效率问题时提出来的，既然将一个矩阵做SVD分解成3个矩阵很耗时，同时还面临稀疏的问题，那么我们能不能避开稀疏问题，同时只分解成两个矩阵呢？也就是说，现在期望我们的矩阵 $M$

M m \times n = P T m \times k Q k \times n

　　　　我们知道SVD分解已经很成熟了，但是FunkSVD如何将矩阵 $M$

　　　　对于某一个用户评分 $m_{i j}$

\sum i, j (m i j - q T j p i) 2

　　　　只要我们能够最小化上面的式子，并求出极值所对应的 $p_{i}, q_{j}$

　　　　当然，在实际应用中，我们为了防止过拟合，会加入一个L2的正则化项，因此正式的FunkSVD的优化目标函数 $J (p, q)$

underbrace{arg;min}_{p_i,q_j};sumlimits_{i,j}(m_{ij}-q_j^Tp_i)^2 + lambda(||p_i||_2^2 + ||q_j||_2^2 )

　　　　其中 $λ$

　　　　将上式分别对 $p_{i}, q_{j}$

\partial J \partial p i = - 2 ( m i j - q T j p i ) q j + 2 λ p i

\partial J \partial q j = - 2 ( m i j - q T j p i ) p i + 2 λ q j

　　　　则在梯度下降法迭代时， $p_{i}, q_{j}$

p i = p i + α ((m i j - q T j p i) q j - λ p i)

q j = q j + α ((m i j - q T j p i) p i - λ q j)

　　　　通过迭代我们最终可以得到 $P$

4. BiasSVD算法用于推荐

　　　　在FunkSVD算法火爆之后，出现了很多FunkSVD的改进版算法。其中BiasSVD算是改进的比较成功的一种算法。BiasSVD假设评分系统包括三部分的偏置因素：一些和用户物品无关的评分因素，用户有一些和物品无关的评分因素，称为用户偏置项。而物品也有一些和用户无关的评分因素，称为物品偏置项。这其实很好理解。比如一个垃圾山寨货评分不可能高，自带这种烂属性的物品由于这个因素会直接导致用户评分低，与用户无关。

　　　　假设评分系统平均分为 $μ$

a r g

　　　　这个优化目标也可以采用梯度下降法求解。和FunkSVD不同的是，此时我们多了两个偏执项 $b_{i}, b_{j}$

b i = b i + α (m i j - μ - b i - b j - q T j p i - λ b i)

b j = b j + α (m i j - μ - b i - b j - q T j p i - λ b j)

　　　　通过迭代我们最终可以得到 $P$

5. SVD++算法用于推荐

　　　　SVD++算法在BiasSVD算法上进一步做了增强，这里它增加考虑用户的隐式反馈。好吧，一个简单漂亮的FunkSVD硬是被越改越复杂。

　　　　对于某一个用户i，它提供了隐式反馈的物品集合定义为 $N (i)$

a r g

　　　　其中，引入 $| N (i) |^{- 1 / 2}$

6. 矩阵分解推荐方法小结

　　　　FunkSVD将矩阵分解用于推荐方法推到了新的高度，在实际应用中使用也是非常广泛。当然矩阵分解方法也在不停的进步，目前张量分解和分解机方法是矩阵分解推荐方法今后的一个趋势。

　　　　对于矩阵分解用于推荐方法本身来说，它容易编程实现，实现复杂度低，预测效果也好，同时还能保持扩展性。这些都是它宝贵的优点。当然，矩阵分解方法有时候解释性还是没有基于概率的逻辑回归之类的推荐算法好，不过这也不影响它的流形程度。小的推荐系统用矩阵分解应该是一个不错的选择。大型的话，则矩阵分解比起现在的深度学习的一些方法不占优势。

查看全文

相关阅读:
进制转换
 BZOJ 1232 安慰奶牛题解
 [BeiJing wc2012]冻结题解
 the Captain题解；
最佳贸易
 第二短路
 街道赛跑
 图论基础知识.
Tkinter 之事件绑定
 Tkinter 之TopLevel顶级窗口

原文地址：https://www.cnblogs.com/bnuvincent/p/9397905.html