Torch笔记

zoukankan html css js c++ java

Torch笔记
Torch笔记
- 初始化很重要切记！不同的初始化产生的结果完全不同
- relu函数可以解决sigmod函数梯度弥散的问题
- tanh函数在卷积用的比较多
- Leaky Relu 泄露的relu函数使x<0时仍然具有梯度
- SELU函数时两个函数的concat（不常用）
- softplus同样是relu函数平滑的版本在0处平滑（不常用）
如何防止Over fitting
- 使用更多的数据
- 控制模型复杂度
  
  使用更浅的模型
  
  正则化
  
  L1 L2正则 lambda参数
  
  使用正则的前提是模型已经over fitting了
  
  optimizer = optim.SGD(net.parameters(),lr = learning_rate,weight_decay = 0.01)
- Dropout
  
  torch.nn.Dropout(0.5) 将上一层数据减少一半传播
- Data argumentation 数据增强
- Early Stopping
优化器
- momentum 动量使用只需在优化器中添加momentum参数即可
  
  Adam优化器不需要添加动量因为他自带
- learnning rate decay 动态LR ReduceLROnPlateau（optimzer,'min')
代码笔记
```
device = torch.device('cuda:0')

net = MLP().to(device)  # 将网络切换到GPU上  原地更新
```
底层实现全连接
```
import torch
import troch.nn.Function as F
w1,b1 = torch.randn(200,784,requires_grad=True)，torch.zeros(200,requires_grad=True)
w2,b2 = torch.randn(200,200,requires_grad=True)，torch.zeros(200,requires_grad=True)
w3,b3 = torch.randn(200,784,requires_grad=True)，torch.zeros(200,requires_grad=True)
def forward(x):
    x = x@w1.t()+b1
    x = F.relu(x)
    x = x@w2.t()+b2
    x = F.relu(x)
    x = x@w3.t()+b3
    x = F.relu(x)
    return x

    
```
查看全文

相关阅读:
idea最新注册码
 pycharm中可以运行脚本(只在控制台运行,Debugger不运行,设置的断点没用)但是不能debug脚本
 VSCode 云同步扩展设置 Settings Sync 插件
 gist.github.com 无法访问解决办法,亲测永远有效！
C# HttpWebRequest httpclient
C# 图片处理
 powerdesigner逆向工程生成PDM时的列注释
 Ocelot网关治理
 Consul服务注册与发现
 CentOS 使用DVD1_DVD2作为本地离线的更新源

原文地址：https://www.cnblogs.com/rise0111/p/11360982.html

Torch笔记

如何防止Over fitting

优化器

代码笔记

底层实现全连接