zoukankan      html  css  js  c++  java
  • 5.机器学习——DBSCAN聚类算法

    1.优缺点

    优点:

    (1)聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类;

    (2)与K-MEANS比较起来,不需要输入要划分的聚类个数;

    (3)聚类簇的形状没有偏倚;

    (4)可以在需要时输入过滤噪声的参数。

    缺点:

    (1)当数据量增大时,要求较大的内存支持I/O消耗也很大;

    (2)当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差,因为这种情况下参数MinPts和Eps选取困难。

    (3)算法聚类效果依赖与距离公式选取,实际应用中常用欧式距离,对于高维数据,存在“维数灾难”。

    参考

    2.原理

    DBSCAN参数

    Eps——距离阈值,该聚类算法中把距离当做密度表达,距离如何计算也很重要。

    MinPts——形成一个核心点所需要最小的直接可达点数,例如改参数设置为5,Eps设置为2,那么一个核心点(包含自己)形成的条件是该核心店距离阈值2以内至少有5个点。

    待聚类点分为三类:

    1. 直接可达点   核心点距离阈值内的点成为直接可达点
    2. 可达点   属于不同核心点的直接的可达点通过核心点组成的路径(相邻核心点之间在各自距离阈值内)相连,那么这些直接可达点被称为可达点
    3. 局外点    既不是核心点也不是直接可达点也不是可达点被称为局外点,也可叫做噪声点

    3.聚类

    同一组直接可达点与可达点形成一个类簇,局外点形成噪声点

  • 相关阅读:
    delphi Int64Rec 应用实例
    PerformEraseBackground 擦除背景(ThemeServices)
    Delphi 的 Bit
    delphi 关于 "高位" 与 "低位"
    PByte和PChar的关系
    执行控制台程序并且获得它的输出结果
    Console下Pause效果的函数
    ByteType字符串中判断是否英文
    窗体包括标题作为一个位图复制到剪贴板
    inf 启动
  • 原文地址:https://www.cnblogs.com/SUNYZBlog/p/10570411.html
Copyright © 2011-2022 走看看