RNN 权重共享 - 走看看

zoukankan html css js c++ java

RNN 权重共享

之前在几篇博客中说到了权重共享，但都觉得不够全面，这里做个专题，以后有新的理解都在此更新。

1. 减少运算只是锦上添花
之前说到权重共享可以减少运算，是的，但这样说好像是可有可无，只是运算量大小的问题，其实不是可有可无的。

2. 权重共享的本质是特征提取
之前说到权重就是模板，我们按照一定的模板来与样本进行比对，看看有没有与模板一致的外在表现（特征）

3. 权重共享使得模型泛化
普通的神经网络输入是固定的，而权重共享可以使得输入不固定。
比如很多张图像，每张图像上有个人脸，但是人脸在图像的不同位置，或者图像的大小也不相同，此时权重共享可以全图扫描，搜索人脸，进而把特征提取出来。
再如RNN做语义分析，两句话：我去年去了北京；去年我和父母去了北京，这其实意思差不多，但文字位置不同，句子长度也不同。

权重共享使得模型能够处理一个连续序列的特征，而不管输入的序列总长度是多少。
当这个连续序列在样本的不同位置时，依然能够识别，而不是学习每个位置的规则，这不仅抓住了不同特征之间的连续性，也减少了学习规则

所以权重共享是必须的。

查看全文

相关阅读:
windows下Mysql免安装版，修改my_default.ini配置文件无效的解决办法
 下压桟（LIFO）
Dijkstra的双栈算术表达式求值算法
 获取中文的完整拼音并输出
 解析一个文件夹所有文件的中文，并输出到某一文本文档中
 在含有中英文字符串的信息中，提出中文的方法
 创建计算字段
 Docker 常用命令
 mqtt常用命令及配置
 LOG4J

原文地址：https://www.cnblogs.com/lvdongjie/p/11864321.html

Copyright © 2011-2022 走看看