强化学习 - 走看看

zoukankan html css js c++ java

强化学习
强化学习 (Reinforcement Learning)，又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

算法

（1）通过价值选行为
- Q Learning
- Sarsa
- Deep Q Network
（2）直接选行为
- Police Gradients
（3）想象环境并从中学习
- Model based RL
分类

分类一
- 不理解环境 Model-Free RL
- 理解环境 Model-Based RL
分类二
- 基于概率（Police-Based RL）
- 基于价值（Value-Based RL）
分类三
- 回合更新（Monte-Carlo update）
- 单步更新（Temporal-Difference update）
分类四
- 在线学习（On-Police）
- 离线学习（Off-Police）
博客内容用于记录自己学习后的收获，如有侵权请联系我删除
查看全文

相关阅读:
Django模型层进阶
 Django模型层相关
 BOM与DOM
JavaScript入门
 HTML基础
 子查询/联合分组/all与any/视图/事务
 表的查询
 mysql的多表关系
 Mysql基本操作
 Spider_基础总结2_Requests异常

原文地址：https://www.cnblogs.com/ptxiaochen/p/13602210.html

Copyright © 2011-2022 走看看