zoukankan      html  css  js  c++  java
  • 第九周 第二部分

    多元高斯分布

    x1 ,x2大概为线性关系,一些浅绿色的叉根据p(x1) *p(x2) 不太异常,但实际异常圆圈上的异常情况应该大致一致,但p(x1) *p(x2) 差异较大

    那么,开发一种 改良版的异常检测算法 要用到一种 叫做多元高斯分布或者多元正态分布的东西

    它能捕捉到一些之前的算法检测不出来的异常

    多元高斯分布的参数 包括向量 µ 和一个 n×n 矩阵 Σ 被称为协方差矩阵
    Σ 的行列式 (determinant) 它是一个矩阵的数学函数    

     

    改变协方差矩阵 非对角线上的元素 你会得到一种不同的高斯分布
    所以当我将非对角线的元素 所以当我将非对角线的元素 从 0.5 增加到 0.8 时
    我会得到一个 更加窄和高的 沿着 x=y 这条线的分布 然后这个等高线图告诉我们 x 和 y 看起来是 一起增加的 概率高的地方是这样的 要么 x1 很大 x2 也很大 或者 x1 很小 x2 也很小
    或者是这两者之间 然后随着这个值 0.8 增大 你会得到这样一个高斯分布 差不多全部的概率 都在一个很窄的范围内
    也就是 x 几乎等于 y 它是一个非常高 而且非常薄的分布 几乎完全在 x 非常接近于 y 的这样一个 非常窄的范围内

    改变均值u:  改变峰值的位置,移动分布的中心

    总结1


    不同的图片 展示 多元高斯分布 所能描述的概率分布是什么样的
    它最重要的优势 就是它可以让你 能够描述当两个特征变量之间 可能存在正相关 或者是负相关关系的情况

     用一个多元高斯分布来拟合这个数据集 指的是这些红色叉 不是绿色样本 你会得到一个这样的高斯分布',大部分的概率在中间这个区域  这里的概率再稍微低一些

    远处这个点的概率非常低所以 当你 在这个样本上用多元高斯分布 它实际上会 正确地把那个样本 标记为一个异常点

    你需要建立一个新特征变量 如果有不正常的变量值组合这种情况 也就是说 x1 和 x2 的取值 的组合是不正常的 虽然 x1 自己 和 x2 自己的值
    看起来非常的正常 但是如果你愿意花时间 手动建立这样的新特征变量 那么原来的模型可以很好地运行
    而相对地 多元高斯模型可以自动捕捉 不同特征变量之间的相关性
    但是原来的模型也有一些其他的很重要的优势 其中一个很大的优势就是
    它的运算量更小 换种说法是 它更适用于 n 的值非常大 就是说特征变量很多的情况
    多元高斯模型 不是非常适合 n 很大的情况
    样本的数量要大于特征变量的数量或者矩阵sigma(对称矩阵)是不可逆的
    但是在实际中,只在m远大于n时候才用多元高斯分布

    在实际应用当中 左边这个原来的模型比较常用 如果你觉得 你需要捕捉特征变量之间的相关性
    一般人就会手动增加这样的额外特征变量 来捕捉特定的不正常的值的组合

    如果你发现 协方差矩阵 Σ 是奇异的 或者说你发现 它是不可逆的 一般只有两种情况
    第一种是它没有满足 这个 m 大于 n 的条件 第二种情况是 你有冗余特征变量 冗余特征变量的意思是
    如果你两个一样的特征变量 不知怎么你不小心把同一个特征变量 复制了两份 那么你的 x1 刚好等于 x2 或者如果你有像这样的冗余数据
    可能是 x3=x4+x5 好了 如果你有像这样 高度冗余的特征变量 如果 x3=x4+x5 那么 x3 就不含有 任何额外的信息

  • 相关阅读:
    unity 颜色空间
    Shader 常用常量 函数等
    Unity3d cg Shader 相关的方法
    DirectX HLSL Shader 内置函数
    unity texture2d 图片尺寸压缩
    Unity中Zxing生成二维码只能生成256大小图片的解决方案
    读取保存 调用系统选框 仅限Win/Mac/WebGL
    Unity编辑器中递归设置文件夹下资源的 AssetBundle Tag 可多选
    扣绿幕Shader(可自选颜色)
    智能手环体验:UP24
  • 原文地址:https://www.cnblogs.com/tingtin/p/12234677.html
Copyright © 2011-2022 走看看