zoukankan      html  css  js  c++  java
  • Pytorch的19种损失函数

    基本用法

    1
    2
    criterion = LossCriterion()  
    loss = criterion(x, y) # 调用标准时也有参数

    损失函数

    L1范数损失:L1Loss

    计算 output 和 target 之差的绝对值。

    1
    torch.nn.L1Loss(reduction='mean')

    参数:reduction-三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    均方误差损失:MSELoss

    计算 output 和 target 之差的均方差。

    1
    torch.nn.MSELoss(reduction='mean')

    参数:reduction-三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    交叉熵损失:CrossEntropyLoss

    当训练有 C 个类别的分类问题时很有效. 可选参数 weight 必须是一个1维 Tensor, 权重将被分配给各个类别. 对于不平衡的训练集非常有效。
    在多分类任务中,经常采用 softmax 激活函数+交叉熵损失函数,因为交叉熵描述了两个概率分布的差异,然而神经网络输出的是向量,并不是概率分布的形式。所以需要 softmax激活函数将一个向量进行“归一化”成概率分布的形式,再采用交叉熵损失函数计算 loss。

    1
    torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')

    参数:weight (Tensor, optional) – 自定义的每个类别的权重. 必须是一个长度为 C 的 Tensor。ignore_index (int, optional) – 设置一个目标值, 该目标值会被忽略, 从而不会影响到 输入的梯度。reduction-三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    KL散度损失:KLDivLoss

    计算 input 和 target 之间的 KL 散度。KL散度可用于衡量不同的连续分布之间的距离, 在连续的输出分布的空间上(离散采样)上进行直接回归时,很有效。

    1
    torch.nn.KLDivLoss(reduction='mean')

    参数:reduction-三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    二进制交叉熵损失:BCELoss

    二分类任务时的交叉熵计算函数。用于测量重构的误差,例如自动编码机。注意目标的值 t[i] 的范围为0到1之间。

    1
    torch.nn.BCELoss(weight=None, reduction='mean')

    参数:weight(Tensor, optional) – 自定义的每个 batch 元素的 loss 的权重。必须是一个长度为 “nbatch” 的 Tensor。

    BCEWithLogitsLoss

    BCEWithLogitsLoss损失函数把 Sigmoid 层集成到了 BCELoss 类中。该版比用一个简单的 Sigmoid 层和 BCELoss 在数值上更稳定, 因为把这两个操作合并为一个层之后, 可以利用 log-sum-exp 的技巧来实现数值稳定。

    1
    torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)

    参数:weight(Tensor, optional) – 自定义的每个 batch 元素的 loss 的权重。必须是一个长度为 “nbatch” 的 Tensor。

    MarginRankingLoss

    1
    torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')

    对于 mini-batch(小批量) 中每个实例的损失函数如下:

    参数:margin:默认值 0。

    HingeEmbeddingLoss

    1
    torch.nn.HingeEmbeddingLoss(margin=1.0,  reduction='mean')

    对于 mini-batch(小批量) 中每个实例的损失函数如下:

    参数:margin:默认值 1。

    多标签分类损失:MultiLabelMarginLoss

    1
    torch.nn.MultiLabelMarginLoss(reduction='mean')

    对于mini-batch(小批量) 中的每个样本按如下公式计算损失:

    大专栏  Pytorch的19种损失函数 class="headerlink" title="平滑版L1损失:SmoothL1Loss">平滑版L1损失:SmoothL1Loss

    也被称为 Huber 损失函数。

    1
    torch.nn.SmoothL1Loss(reduction='mean')


    其中,

    2分类的logistic损失:SoftMarginLoss

    1
    torch.nn.SoftMarginLoss(reduction='mean')

    多标签 one-versus-all 损失:MultiLabelSoftMarginLoss

    1
    torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')

    cosine 损失:CosineEmbeddingLoss

    1
    torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')


    参数:margin:默认值 0。

    多类别分类的hinge损失:MultiMarginLoss

    1
    torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None, reduction='mean')


    参数:p=1 或者 2,默认值:1。margin:默认值为 1。

    三元组损失:TripletMarginLoss

    和孪生网络相似,具体例子:给一个A,然后再给B、C,看看B、C谁和A更像。

    1
    torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')


    其中,

    连接时序分类损失:CTCLoss

    CTC连接时序分类损失,可以对没有对齐的数据进行自动对齐,主要用在没有事先对齐的序列化数据训练上。比如语音识别、ocr识别等等。

    1
    torch.nn.CTCLoss(blank=0, reduction='mean')

    参数:reduction-三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    负对数似然损失:NLLLoss

    负对数似然损失。用于训练 C 个类别的分类问题。

    1
    torch.nn.NLLLoss(weight=None, ignore_index=-100, reduction='mean')

    参数:weight (Tensor, optional) – 自定义的每个类别的权重. 必须是一个长度为 C 的 Tensor。ignore_index (int, optional) – 设置一个目标值, 该目标值会被忽略, 从而不会影响到 输入的梯度。

    NLLLoss2d

    对于图片输入的负对数似然损失。它计算每个像素的负对数似然损失。

    1
    torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')

    参数:
    weight(Tensor, optional) – 自定义的每个类别的权重。必须是一个长度为 C 的 Tensor。
    reduction – 三个值,none: 不使用约简;mean:返回loss和的平均值;sum:返回loss的和。默认:mean。

    PoissonNLLLoss

    目标值为泊松分布的负对数似然损失。

    1
    torch.nn.PoissonNLLLoss(log_input=True, full=False,  eps=1e-08,  reduction='mean')

    参数:
    log_input (bool, optional) – 如果设置为 True , loss 将会按照公 式 exp(input) - target input 来计算, 如果设置为 False , loss 将会按照 input - target log(input+eps) 计算。
    full (bool, optional) – 是否计算全部的 loss, i. e. 加上 Stirling 近似项 target log(target) - target + 0.5 log(2 pi target)。
    eps (float, optional) – 默认值: 1e-8。

  • 相关阅读:
    js:通过正则匹配获取页面的url中的参数
    BZOJ 4873 寿司餐厅 网络流
    BZOJ 3308 毒瘤结论 网络流
    BZOJ3451 CDOJ1562点分治+FFT
    P3731 二分图匹配必经边
    Hdu 6268 点分治 树上背包 bitset 优化
    Hdu 1517 巴什博奕变形
    dsu on tree
    CF #546 D.E
    HNOI 世界树 虚树
  • 原文地址:https://www.cnblogs.com/lijianming180/p/12376301.html
Copyright © 2011-2022 走看看