Scaled Exponential Linear Unit

zoukankan html css js c++ java

Scaled Exponential Linear Unit

https://www.bilibili.com/video/av9770302/?p=11

Relu

Leaky Relu

Parametric Relu就是把leaky部分的斜率学出来，而不是指定

还有一种变体是，Randomized Relu，就是说这个斜率是每次随机的

Exponential Linear Unit (ELU)

Scaled ELU

Scaled就是都乘上一个lamda

并且这里给出了alpha和lamda的取值，

这个是推导出来的

这里如果我们假设所有输入的a的分布为，mean=0， variance=1

所有参数w的分为也是，mean=0， variance=1/K (这个取值上面算出来的，为了保证z的variance为1)

就能得到z的分布也符合mean=0，variance=1

虽然这里对于a1...aK的分布没有假设，但是我们可以假设z的分布式是符合高斯分布的，根据中心极限定理

现在的问题是对于z经过SELU得到a，如果还要保证mean=0，variance=1，求alpha，lamda参数，求出来的值就是上面给出的

看这个推导有两个用处，

1. 知道使用Selu的前提假设，是有假设的，视频里面demo，在不满足假设的情况下，Selu没效果的

假设就是输入和参数的初始化必须要满足前面的分布假设

这里参数的初始化可以用lecun_normal，虽然参数后面会不断调整，但初始化还是很关键

2. 可以看出SELU让输出的分布满足mean=0， variance=1，这就可以达到BathNormalization的效果

可以看到作者的比较，SELU NN比用BatchNorm的效果要好，loss更低，而且也更平滑

因为BatchNorm，每次是用batch的mean和var，所以用局部代表全局，会有波动，因为每个batch可能有较大的差异

查看全文

相关阅读:
同一个硬盘安装win10+ubuntu双系统
 Bundle
layout_weight属性
 Java反射机制
 Android——Widget实现
 Android——悬浮窗+侧边弹框+淡入淡出+背景shape+SeekBar调节手机亮度
 Android权限总结
 Android——窗口层控制WindowManager.LayoutParams.type
Android——getSystemService
Eclipse UML插件——AmaterasUML

原文地址：https://www.cnblogs.com/fxjwind/p/9230963.html

热门文章
spring-data-jpa
jquery学习
 js学习笔记知识点
 Rest学习
 mysql安装优化
 nginx初步尝试
 毕业实习
 随笔
 杂记
 A a= new B();

Scaled Exponential Linear Unit

Relu

Leaky Relu

Exponential Linear Unit (ELU)

Scaled ELU