zoukankan
html css js c++ java
强化学习和监督学习的区别
1、强化学习的样本通过不断与环境进行交互产生,即
试错学习
,而监督学习的样本由人工收集并标注。
2、强化学习的反馈信息只有
奖励
,并且是延迟的,而监督学习需要明确的指导信息(每一个状态对应的动作)。
博客内容用于记录自己学习后的收获,如有侵权请联系我删除
查看全文
相关阅读:
day01--计算机硬件基础笔记
22 Jun 18 Django,ORM
21 Jun 18 Django,ORM
20 Jun 18 复习, mysql
20 Jun 18 Django,ORM
19 Jun 18 复习, 正则表达式
19 Jun 18 Django
15 Jun 18 复习, shutil模块
15 Jun 18 Django
14 Jun 18 复习, form表单
原文地址:https://www.cnblogs.com/ptxiaochen/p/13744926.html
最新文章
装饰器完整写法,ccs选择器,样式设置, 背景图片,圆形设置, display设置,盒模型设置
前端基础(标签,form表单,列表,http协议),flask框架初部了解
2018.12.18运算符,分支结构(循环),异常处理,函数
2018.12.17断点调试,js引入,变量定义,三种弹出框,数据类型,数据类型转换
2018.12.15 2d形变,动画,表格,多行文本垂直居中
2018.12.13过度动画,过度 案例,盒子阴影,伪类设计边框
作业十一。
学习python课程第十九天
学习python课程第十八天
作业十。
热门文章
学习python课程第十七天
学习python课程第十六天
作业九.
学习python课程第十五天
作业八.
学习python课程第十四天
编程语言分类、与用户交互、变量
计算机组成原理
day03--数据类型、与用户交互、格式化输出、基本运算符
day02--计算机系统、编程分类
Copyright © 2011-2022 走看看