NLP related basic knowledge with deep learning methods

zoukankan html css js c++ java

NLP related basic knowledge with deep learning methods

NLP related basic knowledge with deep learning methods

2017-06-22

　　First things first >>>>>>>>>>>>>>>>>>>>>>>> Some great blogs:

　　1. https://github.com/udacity/deep-learning/blob/master/embeddings/Skip-Gram_word2vec.ipynb

　　2. http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/

　　3. http://www.thushv.com/natural_language_processing/word2vec-part-1-nlp-with-deep-learning-with-tensorflow-skip-gram/

　　4. https://github.com/udacity/deep-learning/blob/master/sentiment-rnn/Sentiment_RNN.ipynb

　　5. https://github.com/mchablani/deep-learning

　　Second >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> Skip-Thought Vectors:

　　1. 无监督的表示模型，做 sentence-level，seq2seq model ... 该方法的能够 work 的原因在于下面的这幅图：

　　

　　该方法的两个主要部分：encoder-decoder，不同的是这里有两个 decoder，分别用于解码当前句子的前一句和后一句。网络的训练 loss 的定义就是两个 decoder 部分 loss 的叠加：

　　

　　该方法的另一个问题在于：如何处理网络并未见过的 word ？因为该网络的 encoder 部分可以将文本转化为 feature，但是可能有些 words 并未见过，如何编码这些 words 呢？本文利用 word2vector 的方法，将该机制中的 word 通过一个映射函数 W 来进行转移，利用 L2 线性逻辑回归损失函数来学习该 matrix W。

　　reference paper:

　　　　(1). http://papers.nips.cc/paper/5950-skip-thought-vectors.pdf

　　　　(2). blog: http://chuansong.me/n/478040352820

　　

　　2.

　　

　　

　　

查看全文

相关阅读:
log4j（七）——log4j.xml简单配置样例说明
 log4j（六）——log4j.properties简单配置样例说明
 三元运算符注意事项
 单精度浮点数操作
 反转链表算法Java实现
 VBS计时器2
肖申克的救赎影评
 计算机中K到底是1000还是1024？
二进制补码除法——计算机底层整数除法模拟之Java实现
 VBS计时器

原文地址：https://www.cnblogs.com/wangxiaocvpr/p/7064378.html