论文阅读 | Spatial Transformer Networks

zoukankan html css js c++ java

论文阅读 | Spatial Transformer Networks

max-pooling作用　在一定程度上帮助ＣＮＮ处理空间不变性

Spatial Transformers

Spatial Transformers 机制分为三个部分:
１．localisational network,输入特征映射，输出Spatial Transformation 参数，
２．用这些参数创造sampling grid,将输入映射通过转化变为transformed map

Localisation Network

Localisation Network将输入特征(Uin R^{H*W*C}) ,( heta)是输出，transformation　( au_{ heta})是变换参数应用在feature map 上,( heta=f_{loc}(U)),( heta)根据转换类型是可变的，
Localisation Network　(f_{loc}(U)),可以是全连接，也可以是ＣＮＮ，但都必须有a final regression layer　来产生transformation parameter ( heta)

Parameterised Sampling Grid

每个输出像素通过应用一个中心输入feature map的一个特定的位置的采样kernel，
output pixels依赖于一个grid G,形成输出(Vin R^{H^{'}*W{'}*C})

a 是 regular grid，(I)是单位转移参数，ｂ是an affine transformation

与图形学位置纹理变换相同，将原始坐标经过变换矩阵处理后，转换为目标坐标

用于attention的变换矩阵

Differentiable Image Sampling

(Phi_{x}),(Phi_{y})是用于图像插值基本sampling kernel (k())的参数，(V_{i}^{c})是输出值channel c 像素i在((x_{i}^{t},y_{i}^{t})),对每个通道的采样是一致的
height and width normalised coordinates

理论上，任何满足对ｘ，ｙ可导的

上式求偏导：

Spatial Transformer Networks

combination of the localisation network, grid generator, and sampler form a spatial transformer 这个组合可以被用在CNN结构的任何一个地方
可以用多个STN

查看全文

相关阅读:
文件操作
 验证进程及jion方法
 进程笔记
 网络通信名词总结
 网络QQ聊天代码实例
 网络通信粘包和缓冲器
 udp
UVALive 3983 Robotruck （单调队列，dp）
UVA 10891 Game of Sum (决策优化)
Uva 10635 Prince and Princess （LCS变形LIS）

原文地址：https://www.cnblogs.com/Zak-NoS/p/10941776.html

论文阅读 | Spatial Transformer Networks

Spatial Transformers

Localisation Network

Parameterised Sampling Grid

Differentiable Image Sampling

Spatial Transformer Networks