深度强化学习入门笔记 - 走看看

zoukankan html css js c++ java

深度强化学习入门笔记

一、深度强化学习（ DRLDRLDRL）

传统强化学习：真实环境中的状态数目过多，求解困难。
深度强化学习：将深度学习和强化学习结合在一起，通过深度神经网络直接学习环境（或观察）与状态动作值函数Q（s，a）之间的映射关系，简化问题的求解

Deep Q Network（DQN）

Deep Q Network（DQN）：是将神经网络（neural network）和Q-1earning结合，利用神经网络近似模拟函数Q（s，a），输入是问题的状态（e.g.，图形），输出是每个动作a对应的Q值，然后依据Q值大小选择对应状态执行的动作，以完成控制。
神经网络的参数：应用监督学习完成

DQN学习过程

　　　　

DQN算法流程

查看全文

相关阅读:
db2缓冲池调优
 linux下安装rpm出现error: Failed dependencies
linux下挂载磁盘
 db2 常见错误以及解决方案[ErrorCode SQLState]
db2数据库表操作错误SQL0668N Operation not allowed for reason code "1" on table "表". SQLSTATE=57016的解决方法
 db2用户权限赋值
 db2查看当前用户模式及当前用户的权限
 loadrunner常用函数整理
 书上的脚本案例
 hdu 1711---KMP

原文地址：https://www.cnblogs.com/tianqianlan/p/12271683.html

Copyright © 2011-2022 走看看