zoukankan      html  css  js  c++  java
  • 无监督算法

    无监督算法:

    KMeans算法:

    1、 随机初始化数据集簇的中心,一般从数据集中选择

    2、 外循环:

    内循环:计算各个数值点到中心的距离,进行聚类

            计算每个聚类的平局值,移动聚类中心

     

    PCA算法:

    目标:数据压缩和可视化

    1、 对样本数据进行去均值和归一化

    2、 组建sigma矩阵,然后进行奇异值分解,求的压缩和的结果Z

    异常检测算法:

    1、 选择可能适应于异常样本的特征

    2、 根据样本得到高斯分布的均值和方差

    3、 对给定的样本计算其是否为异常样本

    异常检测与监督学习:

    异常检测:正样本数量较少(0-20);大量的负样本

              不同类型的正样本,很难从正样本中学的算法将其识别出来

              未来会出现之前从未出现过的正样本,与当前的正样本无相似性

    监督学习:有大量的正样本和负样本;

              足够的样本支撑可以从中学到正样本的特征的检测算法

              未来很难出现正样本中未出现过的样本

     

    常见的异常检测和监督学习:

    异常检测:欺诈行为/制造业/数据中心的监测

    监督学习:垃圾邮件/天气/癌症

  • 相关阅读:
    C
    C
    你好,欢迎到这里来
    数组专题
    web前端的性能优化
    MornUI 源码阅读笔记
    application tips
    [转]就这样,创建了自己的运行时共享库(RSL)
    [转]glew, glee与 gl glu glut glx glext的区别和关系
    编码相关了解
  • 原文地址:https://www.cnblogs.com/abella/p/10348320.html
Copyright © 2011-2022 走看看