zoukankan      html  css  js  c++  java
  • 部分网络加载预训练模型代码实现

    引自:https://www.cxyzjd.com/article/feizai1208917009/103598233

    方式一: 自己网络和预训练网络结构一致的层,使用预训练网络对应层的参数批量初始化

    查看预训练模型参数:

    path = 'I:/迅雷下载/alexnet-owt-4df8aa71.pth'
    pretrained_dict = torch.load(path)
    for k, v in pretrained_dict.items():  # k 参数名 v 对应参数值
            print(k)
    model_dict = model.state_dict()                                    # 取出自己网络的参数字典
    pretrained_dict = torch.load("I:/迅雷下载/alexnet-owt-4df8aa71.pth")# 加载预训练网络的参数字典
    # 取出预训练网络的参数字典
    keys = []
    for k, v in pretrained_dict.items():
           keys.append(k)
    i = 0
    
    # 自己网络和预训练网络结构一致的层,使用预训练网络对应层的参数初始化
    for k, v in model_dict.items():
        if v.size() == pretrained_dict[keys[i]].size():
             model_dict[k] = pretrained_dict[keys[i]]
             #print(model_dict[k])
             i = i + 1
    model.load_state_dict(model_dict)
    

    方式二:自己网络和预训练网络结构一致的层,按层初始化

    # 加粗自己定义一个网络叫CNN
    model = CNN()
    model_dict = model.state_dict()                                    # 取出自己网络的参数
    
    for k, v in model_dict.items():                                    # 查看自己网络参数各层叫什么名称
           print(k)
    
    pretrained_dict = torch.load("I:/迅雷下载/alexnet-owt-4df8aa71.pth")# 加载预训练网络的参数
    for k, v in pretrained_dict.items():                                    # 查看预训练网络参数各层叫什么名称
           print(k)
    
    
    # 对应层赋值初始化
    model_dict['conv1.0.weight'] = pretrained_dict['features.0.weight'] # 将自己网络的conv1.0层的权重初始化为预训练网络features.0层的权重
    model_dict['conv1.0.bias'] = pretrained_dict['features.0.bias']    # 将自己网络的conv1.0层的偏置项初始化为预训练网络features.0层的偏置项
    
    model_dict['conv2.1.weight'] = pretrained_dict['features.3.weight']
    model_dict['conv1.1.bias'] = pretrained_dict['features.3.bias']
    
    model_dict['conv2.1.weight'] = pretrained_dict['features.6.weight']
    model_dict['conv2.1.bias'] = pretrained_dict['features.6.bias']
    
    ... ...

     

  • 相关阅读:
    POJ3258River Hopscotch(二分)
    POJ3273Monthly Expense(二分)
    POJ1002487-3279(map)
    HDU 3123 GCC
    POJ2031Building a Space Station
    POJ3096Surprising Strings(map)
    模板类
    POJ1265Area
    【ZZ】C 语言中的指针和内存泄漏 & 编写高效的C程序与C代码优化
    学习笔记之MySQL
  • 原文地址:https://www.cnblogs.com/lyp1010/p/15224584.html
Copyright © 2011-2022 走看看