zoukankan      html  css  js  c++  java
  • 聚类算法之划分法

    划分聚类是聚类分析中最常用的一种聚类算法,对于其研究的论文也是多如牛毛。聚类算法之划分法大致分为三种,一是k-means算法,二是k-medoids算法,三是大型数据库划分法。

    k-means算法

    有大牛解释的非常清楚,就不自己敲了。

    转自JerryLeadhttp://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html

     k-means算法的优点:

    • 聚类经典算法,简单,快速
    • 对处理大数据集,相对可伸缩,高效率
    • 复杂度O(nkt),n是所有对象数,k是簇的数目,t是迭代次数,通常k<<n,t<<n
    • 当簇密集,簇与簇之间的区别明显时效好

    缺点:

    • 在簇的平均值被定义的情况下才能使用
    • 必须事先给出k(要生成的簇的数目)
    • 对干扰(噪声,孤立点等)数据很敏感
  • 相关阅读:
    用python将博客园的文章爬取到本地
    2016.7.9
    2016.7.8
    2016.7.7
    2016.7.5
    2016.7.4
    2016.7.3
    2016.7.2
    2016.6.28
    2016.6.27
  • 原文地址:https://www.cnblogs.com/weimiaomiao/p/4323790.html
Copyright © 2011-2022 走看看