zoukankan html css js c++ java

深度学习: 学习率 (learning rate)

Introduction

学习率 (learning rate)，控制模型的 学习进度 ：

lr 即 stride (步长) ，即反向传播算法中的 ηη ：

ωn←ωn−η∂L∂ωnωn←ωn−η∂L∂ωn

在训练过程中，一般根据训练轮数设置动态变化的学习率。

Note：
如果是 迁移学习 ，由于模型已在原始数据上收敛，此时应设置较小学习率 (≤10−4≤10−4) 在新数据上进行微调。

理想情况下曲线应该是 滑梯式下降 [绿线]：

1. 曲线初始时上扬 [红线]： Solution：初始学习率过大导致振荡，应减小学习率，并从头开始训练。
2. 曲线初始时强势下降没多久归于水平 [紫线]： Solution：后期学习率过大导致无法拟合，应减小学习率，并重新训练后几轮。

3. 曲线全程缓慢 [黄线]： Solution：初始学习率过小导致收敛慢，应增大学习率，并从头开始训练。

查看全文

相关阅读:
C# 消息队列 RabbitMQ
C# webapi简单学习
 Navicat Premium 12注册机使用教程
 .net WCF简单练习
 MSDN 我告诉你（资源库）
Dapper查询返回Datatable
day55 无连接，无状态，会话跟踪、cookie、django中操作cookie、session、django中操作session
day54 锁和事务、ajax、中间件
 day53 url别名反向解析、ORM多表操作、聚合查询、分组查询、F查询、Q查询
 day52