pytorch在损失函数中为权重添加L1正则化

L1正则化可以使权重变稀疏，应用场景：对one-hot词袋模型中的词表进行裁剪时，根据权重weight筛选，此时需要权重越稀疏越好；

L1_Weight为超参数，可设定为1e-4

 1 def train(model, iterator, optimizer, criteon):
 2     avg_acc, avg_loss = [], []
 3     model.train()     
 4 
 5     for batch in tqdm(iterator):
 6         text, label = batch[0].cuda(), batch[1].cuda()         
 7 
 8         pred = model(text)    
 9         l1_penalty = L1_Weight * sum([p.abs().sum() for p in model.fc.parameters()])
10         loss = criteon(pred, label.long())        
11         loss_with_penalty = loss + l1_penalty
12 
13         acc = utils.binary_acc(torch.argmax(pred.cpu(), dim=1), label.cpu().long())  
14         avg_acc.append(acc)
15         avg_loss.append(loss.item())
16 
17         optimizer.zero_grad()
18         loss_with_penalty.backward()
19         #loss.backward()
20         optimizer.step()
21 
22     avg_acc = np.array(avg_acc).mean()
23     avg_loss = np.array(avg_loss).mean()
24     train_metrics = {'train_acc': avg_acc,
25                      'train_loss': avg_loss
26                      }
27     logging.info(train_metrics)
28     return avg_acc, avg_loss

查看全文

相关阅读:
windows下文件资源管理器的操作
 Visual Studio Code 折叠代码快捷键
 windows 10 取消alt+tab的预览功能
 String.prototype.replace
Webpack的tapable 为什么要使用 new Funtion 来生成静态代码
 Visual Studio Code 断点调试Nodejs程序跳过node内部模块(internal modules)
【社群话题分享】有哪些奇葩的技术人员考核方式？
工信部要求应用商店上新 App 检查 IPv6，这里有一份 IPv6 快速部署指南
 读完这篇文章，5G 就没有秘密了
 双剑合璧——掌握 cURL 和 Dig 走天涯

原文地址：https://www.cnblogs.com/cxq1126/p/14941913.html