(转载)NNLM(Neural Network Language Model) - 走看看

zoukankan html css js c++ java

(转载)NNLM(Neural Network Language Model)

https://www.cnblogs.com/xmeo/p/7463946.html

神经网络语言模型对理解word2vec模型有很大的帮助, 包括对后期理解CNN,LSTM进行文本分析时有很大的帮助.

模型训练数据

是一组词序列w1…wT,wt∈V。其中 V 是所有单词的集合（即训练预料中的词构成的词典）, 词向量把n-gram的离散空间转换为连续空间.

概率函数

在这个模型中，可分为特征映射和计算条件概率分布两部分：

1. 一个 |V|×m映射矩阵C，每一行表示某个单词的特征向量，是m维，共|V|列，即|V|个单词都有对应的特征向量在C中

2.通过一个函数 g （g 是前馈或递归神经网络）将输入的词向量序列(C(wt−n+1),...,C(wt−1)) 转化为一个概率分布,即该函数

目标函数:

神经网络语言模型的网络结构图:

网络结构:

从下往上依次是:

输入层:window窗口中上下文的每个词one-hot向量

投影矩阵: 紫色虚线表示词语通过投影矩阵Matrix C对词进行映射

投影矩阵也是稠密词向量, 词典维数V，稠密词向量表示维数D

1*|V|*|V|*m = 1*m

神经网络输入层: 为经过投影矩阵映射后的词向量的拼接, 输入向量大小为窗口上下文词的数量乘以定义的词向量的长度

神经网络隐藏层: 加激活函数tanh等进行非线性映射

输出层:softmax做归一化，保证概率和为1.

　

查看全文

相关阅读:
如何定时备份Mysql数据库
 Mysql如何分析慢查询及优化（一）--- EXPLAIN详解
 Mysql如何分析慢查询日志--MysqlDumpSlow详解
 Mysql添加用户及用户权限管理
 Mysql表的横向拆分与纵向拆分及简单案例
 Mysql触发器详解以及简单的案例
 Mysql存储过程详解及案例
 Mysql中如何查看线程
 Nginx命令与配置详解
 SQLSERVER 2008 技术内幕 T-SQL查询笔记1: SQL 执行顺序

原文地址：https://www.cnblogs.com/liweikuan/p/14226641.html

Copyright © 2011-2022 走看看