为什么机器学习中常常假设数据是独立同分布的？ - 走看看

zoukankan html css js c++ java

为什么机器学习中常常假设数据是独立同分布的？

独立、相关的关系：

独立，两个事件的发生没有任何关系

相关，一般指线性相关，不相关指不线性相关，但或许满足非线性相关

同分布：

意味着X1和X2具有相同的分布形状和相同的分布参数，对离散随机变量具有相同的分布律，对连续随机变量具有相同的概率密度函数，有着相同的分布函数，相同的期望、方差。

独立同分布（iid）

在不少问题中要求样本（数据）采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集，使用同分布假设能够使得这个做法解释得通。

（机器学习就是利用当前获取到的信息（或数据）进行训练学习，用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。）

查看全文

相关阅读:
Linq 和 Lambda 查询中按照多个值进行分组GroupBy
enter键触发事件的清除
 3、Python 基础类型 -- List 列表类型
 2、Python 基础类型 -- String 字符串类型
 1、Python 基础类型 -- Number 数字类型
 JMeter 常用网站
 性能测试之基础理论
 JMeter 性能测试实例
 JMeter 服务器监控插件环境配置
 【C++】利用指针实现通过函数改变多个参数的值

原文地址：https://www.cnblogs.com/pinking/p/8721897.html

Copyright © 2011-2022 走看看