绪论-1.1.2机器学习

zoukankan html css js c++ java

绪论-1.1.2机器学习

1.1.2 机器学习

　　机器学习分为两部分：

　　　　有监督学习（Surpervised Learning）

　　　　无监督学习（Unsupervised Learning）

　　　　强化学习（Reinforcement Learning，简称RL）

　　　　如下图所示：

　　有监督学习 有监督学习的数据集包含了样本x与样本label y，算法模型需要学习到映射关系Fθ：x->y，其中Fθ代表模型函数，θ为模型参数。在训练时，通过计算模型的预测值Fθ（x）与真实值y之间的误差来优化网络参数θ，使得网络下一次能够预测的更精准。常见的有监督学习有线性回归，逻辑回归，支持向量机，随机森林等。

　　无监督学习 收集带标签的数据往往代价比较昂贵，对于只有样本x的数据集，算法需要自行发现数据的模态，这种方式叫做无监督学习。无监督学习中有一类算法将自身作为监督信号，即模型需要学习的映射关系为Fθ：x->x，称为自监督学习（Self-supervised Learning），在计算时通过计算模型的预测值Fθ（x）与x之间的误差来优化网络参数θ。常见的无监督学习有自编码器，生成对抗网络等。

　　强化学习 也称为增强学习，通过与环境进行交互来学习解决问题的策略的一类算法。与有监督、无监督学习不同，强化学习问题并没有明确的“正确的”动作监督信号，算法需要与环境进行交互，获取环境反馈的滞后奖励信号，因此并不能通过计算动作与正确动作之间的误差来优化网络。常见的学习算法有DQN，PPO等。

　　

查看全文

相关阅读:
解决Mac开机变慢 command ＋option ＋ P ＋ R
Mac iphone 使用如何修改apple 用户名 XXX的mac Mac 与iphone如何连接传递文件为iphone增加铃声 iphone铃声的制作－－－城
 Xcode7 iOS9.0 的真机调试
 苹果电脑Mac OS系统重装图文详解
 关闭自动弹出照片自动弹出iTunes以及关闭手机照片流
 mac 使用清除废纸篓或彻底删除某文件附加: smb afp ftp NAS 访问服务器相关
 辨别苹果数据线真伪苹果计算器 Dashboard 知识
 使用OC swift 截取路径中的最后的文件名
 升级OS10.11系统后 Xcode6.4的变化少了个按钮 could not launch “Xcode” Xcode 插件安装
 如何在苹果官网下载旧版本的Xcode

原文地址：https://www.cnblogs.com/cropmodel/p/13254862.html