有监督学习、无监督学习、强化学习比较 - 走看看

zoukankan html css js c++ java

有监督学习、无监督学习、强化学习比较
有监督学习Supervised Learning：
- 从已经标记的样本中进行学习
- 可用于目标识别、分类
- 本身不适合交互环境，但是若用正确的行为(action)对场景(situation)进行标注，也可学习。
- 适用于标注难度不大，成本不高的情况。
无监督学习Unsupervised Learning：
- 从没有标记的样本中进行学习，以发现其中的结构
- 常用于聚类，标注不易的场景。
强化学习Reinforcement Learning：
- 其中没有监督者，只有一个reward信号
- 在与situation的交互中获取样例（训练样本）
- agent的行为会影响之后一系列的data
Deep Q-Network
- Q-Learning（强化学习的一种）与神经网络的结合，简称 DQN。
- 解决的问题难题：状态的数量过多，并且需要人工去设计特征，而且一旦特征设计不好，则得不到想要的结果。
- 用神经网络处理状态过多的问题，取代原来 Q 表的功能。
查看全文

相关阅读:
全角半角转换
 MSN的头像存放路径
 treeview托拽和动态添加节点以及treeview和xml的交互的实现
 一个简单的分页存储过程
 datagrid数据导出到excel文件给客户端下载的几种方法
 大容量数据传输，web.config修改方法
 XSD(XML Schema Definition)学习笔记
 最近想发起一次服务器合租，有米有人有兴趣
 从首页看CCS布局
 关于CS1.1后台管理页面的研究

原文地址：https://www.cnblogs.com/xbit/p/9690700.html

Copyright © 2011-2022 走看看