zoukankan      html  css  js  c++  java
  • 为什么机器学习中常常假设数据是独立同分布的?

    独立、相关的关系:

    独立,两个事件的发生没有任何关系

    相关,一般指线性相关,不相关指不线性相关,但或许满足非线性相关

    同分布:

    意味着X1和X2具有相同的分布形状和相同的分布参数,对离散随机变量具有相同的分布律,对连续随机变量具有相同的概率密度函数,有着相同的分布函数,相同的期望、方差。

    独立同分布(iid)

    在不少问题中要求样本(数据)采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集,使用同分布假设能够使得这个做法解释得通。

    (机器学习就是利用当前获取到的信息(或数据)进行训练学习,用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。)

  • 相关阅读:
    新项目反思
    nei网访问
    react
    css沉默
    沉默
    node准备
    C++学习(八):删除文件
    利用工具格式化日期文本
    PageHelper 记录总条数不正确问题处理
    tk.mybatis 多个or条件拼接
  • 原文地址:https://www.cnblogs.com/pinking/p/8721897.html
Copyright © 2011-2022 走看看