RL Problems - 走看看

zoukankan html css js c++ java

RL Problems

1.Delayed, sparse reward(feedback), Long-term planning

Hierarchical Deep Reinforcement Learning, Sub-goal, SAMDP, optoins, Thompson sampling, Boltzman exploration, Improving Exploration

2.Partial observability, Imperfect-Information

Memory, Nash equilibria, MCTS, self-play, LSTM, active perception, curiosity

3.Large state space, Large action space

Hardware, Distributon, Deeper Neural Network.

查看全文

相关阅读:
JSDI——实现数据库连接池（JDBC改进）
MD5加密算法（实际应用）
Java Web 自动登录
 异步编程设计模式Demo
异步编程设计模式Demo
禁止程序启动2次
 C#线程同步的几种方法
 ASP.NET MVC的Action Filter
带有返回值的intent
android 属性动画

原文地址：https://www.cnblogs.com/huangshiyu13/p/7353706.html

Copyright © 2011-2022 走看看