smooth L1损失函数 - 走看看

zoukankan html css js c++ java

smooth L1损失函数

当预测值与目标值相差很大时，L2 Loss的梯度为(x-t)，容易产生梯度爆炸，L1 Loss的梯度为常数，通过使用Smooth L1 Loss，在预测值与目标值相差较大时，由L2 Loss转为L1 Loss可以防止梯度爆炸。

L2 loss的导数（梯度）中包含预测值与目标值的差值，当预测值和目标值相差很大，L2就会梯度爆炸。说明L2对异常点更敏感。L1 对噪声更加鲁棒。

当差值太大时, loss在|x|>1的部分采用了 l1 loss，避免梯度爆炸。原先L2梯度里的x−t被替换成了±1, 这样就避免了梯度爆炸, 也就是它更加健壮。

总的来说：相比于L2损失函数，其对离群点、异常值（outlier）不敏感，可控制梯度的量级使训练时不容易跑飞。

查看全文

相关阅读:
MySQL5.7 容器化安装
 什么是架构？——软件系统架构的定义
 服务端高并发分布式架构演进之路（转）
CentOS7 增加回环地址
 三句话看明白jdk收费吗
 【转载】C#里怎么把string类型转换成double
【转载】如何查看自己网站的搜索引擎收录量和索引量
 【转载】c# datatable 判断值是否存在
 【转载】C#中Datatable修改列名
 【转载】C#使用typeof运算符获取对象变量的具体类型Type

原文地址：https://www.cnblogs.com/pacino12134/p/11407897.html

Copyright © 2011-2022 走看看