zoukankan
html css js c++ java
K-means算法
K-means 聚类算法
无监督问题,我们手里没有标签
聚类:相似的东西分到一组
难点:如何评估,如何调参
基本概念
要得到簇的个数,需要制定K值
质心:均值,各个维度取平均即可
距离的度量:常用的欧几里得距离或者与余弦相似度(先标准化)
优化目标:一共有多少个簇,让每一个样本到簇中心点的距离越小越好
K-means算法
优势
简单,快速,适合常规数据集
劣势
K值很难确定
复杂度和样本呈线性关系
很难发现任意形状的簇
使用k-means对数据进行压缩
查看全文
相关阅读:
个人作业8 单词统计
个人作业7 第一阶段SCRUM冲刺(八)
大二暑假周总结(二)
大二暑假周总结(一)
梦断代码-阅读笔记03
个人课程总结
梦断代码-阅读笔记02
大二下周总结(16)
梦断代码-阅读笔记01
最长英语单词链
原文地址:https://www.cnblogs.com/jly1/p/13097737.html
最新文章
概述
概述
安装scala环境
寒假自学进度一
基本语法及操作
MapReduce数据清洗及Hive数据库操作
软件工程第十六周总结
大道至简阅读笔记03
个人课程总结
软件工程第十五周总结
热门文章
给老师的建议
第二阶段冲刺—第三天
学习进度十四
软件工程基础阅读笔记02
个人作业9 单词统计续
学习进度十三
软件工程基础阅读笔记01
学习进度十二
个人作业7 第一阶段SCRUM冲刺(十)
个人作业7 第一阶段SCRUM冲刺(九)
Copyright © 2011-2022 走看看