zoukankan
html css js c++ java
K-means算法
K-means 聚类算法
无监督问题,我们手里没有标签
聚类:相似的东西分到一组
难点:如何评估,如何调参
基本概念
要得到簇的个数,需要制定K值
质心:均值,各个维度取平均即可
距离的度量:常用的欧几里得距离或者与余弦相似度(先标准化)
优化目标:一共有多少个簇,让每一个样本到簇中心点的距离越小越好
K-means算法
优势
简单,快速,适合常规数据集
劣势
K值很难确定
复杂度和样本呈线性关系
很难发现任意形状的簇
使用k-means对数据进行压缩
查看全文
相关阅读:
常用词汇短语
Java中的数据结构
Java中的设计模式
.NET中的编译、程序调用
常用口语
0. Angular框架原理
茶叶
NPOI自定义单元格背景颜色
ASP.NET MVC添加Action就找不到
navicat for mysql 导入SQL Server显示中文乱码解决办法
原文地址:https://www.cnblogs.com/jly1/p/13097737.html
最新文章
linux移动硬盘unmount报错处理
SQL Server中CROSS APPLY和OUTER APPLY的应用详解
Oracle创建directory
oracle用户密码错误导致用户锁定
安装oracle提示swap交换分区太小
oracle11g rac 个性归档模式
linux删除N天前的文件
excel截取某个字符之前的值
maven
反射
热门文章
Linux小命令
枚举类
内部类
dubbo接口测试 思路整理
配置dubbotest的maven项目pox.xml报错
dubbo配置环境
linux服务器性能命令
抓包&网络分析
IIS
数码产品
Copyright © 2011-2022 走看看