zoukankan
html css js c++ java
强化学习和监督学习的区别
1、强化学习的样本通过不断与环境进行交互产生,即
试错学习
,而监督学习的样本由人工收集并标注。
2、强化学习的反馈信息只有
奖励
,并且是延迟的,而监督学习需要明确的指导信息(每一个状态对应的动作)。
博客内容用于记录自己学习后的收获,如有侵权请联系我删除
查看全文
相关阅读:
排序-堆排序
排序-计数排序
Django之路——10 django的分页组件
Django之路——9 Django的form组件的信息校验
Django之路——8 cookie 和sessions
Django之路——7 django与ajax
Django之路——6 Django的模型层(二)
Django之路——6 Django的模型层(一)
Django之路——4 Django的视图层
Django之路——5 Django的模板层
原文地址:https://www.cnblogs.com/ptxiaochen/p/13744926.html
最新文章
【广告】我妹妹导演的毕设——数字传媒摄影作品
【python】小型神经网络的搭建
【C++】根据二叉树的前序遍历和中序遍历重建二叉树并输出后续遍历
C#线程同步SemaphoreSlim类介绍
Java和C#语法差异
设计模式七大原则之迪米特法则
设计模式七大原则之合成复用原则
设计模式七大原则之接口隔离原则
设计模式七大原则之依赖倒转原则
设计模式七大原则之里氏替换原则
热门文章
设计模式七大原则之开闭原则
设计模式七大原则之单一职责原则
npm ERR! missing script: dev 解决方案
分布式ID解决方案
Spring的Bean配置和装配
数据库-事务
Java基础——运算符
Java基础——数据类型
第五坑:YYYY和yyyy
排序-基数排序
Copyright © 2011-2022 走看看