FM-分解机模型详解

zoukankan html css js c++ java

FM-分解机模型详解

https://blog.csdn.net/zynash2/article/details/80029969

FM论文地址：https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf

工业界传统的LR，由于简单且可解释被广泛使用，但人工特征工程的繁琐操作也是阻碍模型真正效果的主要原因，各类的特征组合需要大量的人工挖掘实验。鉴于此，基于矩阵分解的FM模型被人熟知，它的目标就是解决在稀疏数据的条件下特征组合的问题。本文将详细分析下FM模型的原理。

首先给出FM的目标函数（这里的模型特指二阶的分解模型）：

可能有读者会有问题，既然目的是为了组合二阶或者高阶的特征，那为什么模型不直接表达成如下的形式：

既直接学习二阶特征的参数。原因其实很简单，这其实也是分解机模型存在的原因。假设模型中第m维的特征和第n维的特征在样本中（one-hot之后）从未同时为1过，则很明显其交叉特征的参数值必然为0，也就失去了二阶特征的意义。为了克服这种现象，FM是采用了矩阵分解的方式来重新解释交叉特征的关系，如下图所示：

向量v就是每个特征对应的特征向量，其维数由自己确定，真正的二阶参数如公式，就是两个向量的点积。因此，FM也经常被用来作为降维或者是深度神经网络embedding的一种方式，例如FNN、DeepFM等DNN模型，都是采用了FM作为embedding的方式，具体可参考笔者之前的博客。v的值由模型训练本身产生，特征向量的点积就是两个特征的融合参数。为了简化计算（比如用tensorflow搭建FM网络），可以对二阶项做如下的计算：

综上所述，我们可以给出FM在使用sigmod激活，随机梯度下降优化（去掉求和），考虑L2正则且为二分类问题时的训练伪代码：

FM理论上可以学习出n阶特征的关系，但由于2阶以上计算过于复杂，本文只针对二阶FM情况，事实上大部分工业级引用也是二阶为主。而FM也有进阶的模型，像FFM，就是针对field，简单说就是根据加上了slot的条件来做矩阵分解，因此二阶参数会比FM更多，稍显复杂，笔者有时间也会做相应的分析。

---------------------
作者：zynash2
来源：CSDN
原文：https://blog.csdn.net/zynash2/article/details/80029969
版权声明：本文为博主原创文章，转载请附上博文链接！

查看全文

相关阅读:
使用分析函数进行行列转换
 SQL模糊查询
 Web服務器的配置方法
 oracle基礎知識2
oracle基礎知識9
在客户端脚本中获取Session的方法
 推荐litianping的几篇文章，包括owc统计图，rss技术，项目常用类，petshop架构分析
 Asp.net生成工作流、审批流的解决方案(asp.net workflow svg)
DiscuzNT 1.0正式版推出了
 web.config中的特殊字符串xml中的非法字符串

原文地址：https://www.cnblogs.com/zhangbojiangfeng/p/9984062.html