word2vec改进之Negative Sampling

zoukankan html css js c++ java

word2vec改进之Negative Sampling

训练网络时往往会对全部的神经元参数进行微调，从而让训练结果更加准确。但在这个网络中，训练参数很多，每次微调上百万的数据是很浪费计算资源的。那么Negative Sampling方法可以通过每次调整很小的一部分权重参数，从而代替全部参数微调的庞大计算量。

词典D中的词在语料C中出现的次数有高有低，对于那些高频词，我们希望它被选为负样本的概率比较大，对于那些低频词，我们希望它被选中的概率比较小，这是我们对于负采样过程的一个大致要求，本质上可以认为是一个带权采样的问题。

一、基于Negative Sampling的CBOW模型

输入：基于CBOW的语料训练样本，词向量的维度大小 $M c o u n t$

输出：词汇表每个词对应的模型参数 $θ$

1. 随机初始化所有的模型参数 $θ$

2. 对于每个训练样本 $(c o n t e x t (w_{0}), w_{0})$

3. 进行梯度上升迭代过程，对于训练集中的每一个样本 $(c o n t e x t (w_{0}), w_{0}, w_{1}, . . . w_{n e g})$

$(c o n t e x t (w_{0}), w_{0}, w_{1}, . . . w_{n e g})$

d) 如果梯度收敛，则结束梯度迭代，否则回到步骤3继续迭代。

二、基于Negative Sampling的Skip-Gram模型

输入：基于Skip-Gram的语料训练样本，词向量的维度大小 $M c o u n t$

输出：词汇表每个词对应的模型参数 $θ$

1. 随机初始化所有的模型参数 $θ$

2. 对于每个训练样本 $(c o n t e x t (w_{0}), w_{0})$

3. 进行梯度上升迭代过程，对于训练集中的每一个样本 $(c o n t e x t (w_{0}), w_{0}, w_{1}, . . . w_{n e g})$

b)如果梯度收敛，则结束梯度迭代，算法结束，否则回到步骤a继续迭代。

参考内容：

https://www.cnblogs.com/pinard/p/7249903.html

查看全文

相关阅读:
mysql关联更新表
 List Slider
mysql同步复制报Slave can not handle replication events with the checksum that master 错误
 ie11 .pac代理脚本无法使用的问题2
centos6.5安装配置nginx+php+mysql+httpsqs+ttserver+redis
Linux 磁盘坏道检测和修复
 ie11 .pac代理脚本无法使用的问题
 javascript取前n天的日期两种方法
 javascript位操作符右移>>>的妙用
 Angular表单验证

原文地址：https://www.cnblogs.com/r0825/p/10990724.html

word2vec改进之Negative Sampling

一、基于Negative Sampling的CBOW模型

二、基于Negative Sampling的Skip-Gram模型