炼数成金数据分析课程---17、机器学习聚类算法(后面要重点看)
一、总结
一句话总结:
大纲+实例快速学习法
主要讲解常用聚类算法(比如K-means等)的原理及python代码实现:后面学习聚类的时候先学这个
1、聚类是什么?
将具有相似性的样本归为一类:让你将聚在一起的点分离开啊
2、聚类和分类的区别是什么?
聚类:无监督学习
分类:有监督学习
3、(凝聚的)层次聚类法 的思想是什么?
1开始时,每个样本各自作为一类
2规定某种度量作为样本之间的距离及类与类之间的距离,并计算之
3将距离最短的两个类合并为一个新类
4重复2-3,即不断合并最近的两个类,每次减少一个类,直至所有样本被合并为一类
4、各种类与类之间距离计算的方法?
◆离差平方和法——ward
◆类平均法——average
◆最大距离法—complete
5、动态聚类:K-means方法 的思想是什么?
1选择K个点作为初始质心
2将每个点指派到最近的质心,形成K个簇(聚类)
3重新计算每个簇的质心
4重复2-3直至质心不发生变化
二、内容在总结中
week14