pointer-net - 走看看

zoukankan html css js c++ java

pointer-net

Pointer network 主要用在解决组合优化类问题(TSP, Convex Hull等等)，实际上是Sequence to Sequence learning中encoder RNN和decoder RNN的扩展，主要解决的问题是输出的字典长度不固定问题（输出字典的长度等于输入序列的长度）。

在传统的NLP问题中，采用Sequence to Sequence learning的方式去解决翻译问题，其输出向量的长度往往是字典的长度，而字典长度是事先已经订好了的（比如英语单词字典就定n=8000个单词）。而在组合优化类问题中，比如TSP问题，输入是城市的坐标序列，输出也是城市的坐标序列，而每次求解的TSP问题城市规模n是不固定的。每次decoder的输出实际上是每个城市这次可能被选择的概率向量，其维度为n，和encoder输入的序列向量长度一致。如何解决输出字典维度可变的问题？Pointer network的关键点在如下公式:

其中 $e_j$ 是encoder的在时间序列j次的隐藏层输出， $d_i$ 是decoder在时间序列i次的隐藏状态输出，这里的 $u^i = [u^i_1,u^i_2, ... u^i_j]$ 其维度为n维和输入保持一致，对 $u^i$ 直接求softmax就可以得到输出字典的概率向量，其输出的向量维度和输入保持一致。其中 $v^T, W_1,W_2$ 均为固定维度的参数，可被训练出来。

感觉知乎上写的这个解释解释的很不错。所以就搬过来了。链接https://www.zhihu.com/question/59480186

还有另外一个链接也很有意义： https://cloud.tencent.com/developer/news/125169

查看全文

相关阅读:
MFC编程入门之二十八（常用控件：列表视图控件List Control上）
Discuz X1.5 利用添加好友处存储xss进行蠕虫worm扩散
 全民wifi钓鱼来临----agnes安卓wifi钓鱼神器介绍
 自改xss小平台上线
 谈网页游戏外挂之用python模拟游戏(热血三国2)登陆
 thinkpad t440p 解决无线网卡驱动
 编写php拓展实例--slime项目（用户登录会话类）
用Tupper自我指涉公式造图
 一首歌
 rtx信息泄漏利结合弱口令导致被批量社工思路

原文地址：https://www.cnblogs.com/www-caiyin-com/p/9967544.html