Attacks for RL - 走看看

zoukankan html css js c++ java

Attacks for RL

1. http://rll.berkeley.edu/adversarial/ Adversarial Attacks on Neural Network Policies

就是对test时候的policy进行构造对抗样本，方法还是用的分类对抗样本的方法，对于DQN，把Q value做个softmax，一样地构造对抗样本。

查看全文

相关阅读:
通过anaconda进行python多版本控制
 搭建java环境
 windows安装 Microsoft Visual c++
更改jupyter notebook的主题颜色(theme) 包括pycharm
linux服务器安装anaconda，然后远程使用jupyter
根据经纬度坐标计算距离-python
Redis相关链接
 VBA笔记-参考教程
 用sklearn计算卡方检验P值
 linux创建新用户

原文地址：https://www.cnblogs.com/huangshiyu13/p/10670362.html

Copyright © 2011-2022 走看看