zoukankan      html  css  js  c++  java
  • pytorch 查看中间变量的梯度

    pytorch 为了节省显存,在反向传播的过程中只针对计算图中的叶子结点(leaf variable)保留了梯度值(gradient)。但对于开发者来说,有时我们希望探测某些中间变量(intermediate variable) 的梯度来验证我们的实现是否有误,这个过程就需要用到 tensor的register_hook接口。一段简单的示例代码如下,代码主要来自pytorch开发者的回答,笔者稍作修改使其更符合最新版的pytorch 语法(v1.2.0)。

    grads = {}
    
    def save_grad(name):
        def hook(grad):
            grads[name] = grad
        return hook
    
    x = torch.randn(1, requires_grad=True)
    y = 3*x
    z = y * y
    
    # 为中间变量注册梯度保存接口,存储梯度时名字为 y。
    y.register_hook(save_grad('y'))
    
    # 反向传播 
    z.backward()
    
    # 查看 y 的梯度值
    print(grads['y'])
    

    一个示例输出是:

    tensor([-1.5435])
    
  • 相关阅读:
    计算几何
    差三角
    约瑟夫
    字符编码
    河南省赛之Substring
    移动字母
    抽屉原理
    不要为了完成代码而写代码
    分布式文件系统优化
    降低代码的复杂度
  • 原文地址:https://www.cnblogs.com/SivilTaram/p/pytorch_intermediate_variable_gradient.html
Copyright © 2011-2022 走看看