zoukankan      html  css  js  c++  java
  • 层次聚类

    ---恢复内容开始---

    层次聚类

     思想:只要一个区域中的点的密度大于某个阈值,就把它加到与之相近的聚类中去。


    DBSCAN:

    定义:

    (1)对象的ε-邻域:对于给定半径ε内的区域。

    (2)核心对象:对于给定数目m,如果一个对象的ε-邻域内至少包含m个对象,则称该对象为核心对象。

    (3)直接密度可达:给定一个对象集合D,如果对象p在对象q的ε-邻域内,且对象对象q是核心对象,那么我们称对象p是从对象q直接密度可达的。

    (4)密度可达:如果存在一个对象链p1,p2,...,pn,p1=p,pn=q,pi+1是从pi关于ε和m直接密度可达的,则对象p是从对象q密度可达的。

    (5)密度相连:如果对象集合D中存在一个对象o,使得对象p和对象q是从对象o关于ε和m密度可达,则对象p和对象q关于ε和m密度相连。

    (6)簇:密度相连的对象的最大集合。

    (7)噪声:不包含在任何簇中的对象。

    如果一个点p的ε邻域包含多于m个对象,则创建一个p作为核心对象的簇,然后DBSCAN反复寻找这些核心对象直接密度可达的对象,这个过程可能会涉及密度可达簇的合并,当没有新的点可以被添加到任何簇的时候该过程结束。


    密度最大值聚类:

    局部密度ρ:ρi=Σj K(dij-dc)

    K(x)=1(x<0)

    K(x)=0(其他)

    高局部密度点距离:密度高于对象i中所有对象到对象i的最近的距离。

    (对于密度最大的对象,设置它的高局部密度点距离为max(dij))

    簇中心:有着比较大的局部密度和很大的高密度距离的点

    异常点:高密度距离较大但局部密度较小的点

    ---恢复内容结束---

  • 相关阅读:
    bzoj2438
    bzoj3040
    [AHOI2009]维护序列
    [JSOI2008]最大数
    洛谷3378堆模板
    洛谷1439
    洛谷2756
    bzoj1016
    洛谷1875
    [模板] 强连通分量
  • 原文地址:https://www.cnblogs.com/hester-tang/p/7931058.html
Copyright © 2011-2022 走看看