zoukankan      html  css  js  c++  java
  • 部分网络加载预训练模型代码实现

    引自:https://www.cxyzjd.com/article/feizai1208917009/103598233

    方式一: 自己网络和预训练网络结构一致的层,使用预训练网络对应层的参数批量初始化

    查看预训练模型参数:

    path = 'I:/迅雷下载/alexnet-owt-4df8aa71.pth'
    pretrained_dict = torch.load(path)
    for k, v in pretrained_dict.items():  # k 参数名 v 对应参数值
            print(k)
    model_dict = model.state_dict()                                    # 取出自己网络的参数字典
    pretrained_dict = torch.load("I:/迅雷下载/alexnet-owt-4df8aa71.pth")# 加载预训练网络的参数字典
    # 取出预训练网络的参数字典
    keys = []
    for k, v in pretrained_dict.items():
           keys.append(k)
    i = 0
    
    # 自己网络和预训练网络结构一致的层,使用预训练网络对应层的参数初始化
    for k, v in model_dict.items():
        if v.size() == pretrained_dict[keys[i]].size():
             model_dict[k] = pretrained_dict[keys[i]]
             #print(model_dict[k])
             i = i + 1
    model.load_state_dict(model_dict)
    

    方式二:自己网络和预训练网络结构一致的层,按层初始化

    # 加粗自己定义一个网络叫CNN
    model = CNN()
    model_dict = model.state_dict()                                    # 取出自己网络的参数
    
    for k, v in model_dict.items():                                    # 查看自己网络参数各层叫什么名称
           print(k)
    
    pretrained_dict = torch.load("I:/迅雷下载/alexnet-owt-4df8aa71.pth")# 加载预训练网络的参数
    for k, v in pretrained_dict.items():                                    # 查看预训练网络参数各层叫什么名称
           print(k)
    
    
    # 对应层赋值初始化
    model_dict['conv1.0.weight'] = pretrained_dict['features.0.weight'] # 将自己网络的conv1.0层的权重初始化为预训练网络features.0层的权重
    model_dict['conv1.0.bias'] = pretrained_dict['features.0.bias']    # 将自己网络的conv1.0层的偏置项初始化为预训练网络features.0层的偏置项
    
    model_dict['conv2.1.weight'] = pretrained_dict['features.3.weight']
    model_dict['conv1.1.bias'] = pretrained_dict['features.3.bias']
    
    model_dict['conv2.1.weight'] = pretrained_dict['features.6.weight']
    model_dict['conv2.1.bias'] = pretrained_dict['features.6.bias']
    
    ... ...

     

  • 相关阅读:
    比较实用的免费图标字库(转)
    聊聊 cursor鼠标样式
    (转)3款优秀的移动webAPP网站在线测试工具
    常用meta整理
    (转)SVN搭建(附下载地址)
    (转)C#串口SerialPort常用属性方法
    加载信息,先从数据库取出5条实现分页,鼠标向上滑动触发Ajax再加载5条,达到异步刷新,优化加载。。。
    图片上传,获取路径以及下载功能
    Mysql事务,并发问题,锁机制
    app中Webview实现下载表格
  • 原文地址:https://www.cnblogs.com/lyp1010/p/15224584.html
Copyright © 2011-2022 走看看