zoukankan
html css js c++ java
K-means算法
K-means 聚类算法
无监督问题,我们手里没有标签
聚类:相似的东西分到一组
难点:如何评估,如何调参
基本概念
要得到簇的个数,需要制定K值
质心:均值,各个维度取平均即可
距离的度量:常用的欧几里得距离或者与余弦相似度(先标准化)
优化目标:一共有多少个簇,让每一个样本到簇中心点的距离越小越好
K-means算法
优势
简单,快速,适合常规数据集
劣势
K值很难确定
复杂度和样本呈线性关系
很难发现任意形状的簇
使用k-means对数据进行压缩
查看全文
相关阅读:
mongodb单机搭建
elasticsearch-6.2.3单机搭建
zookeeper集群搭建
JavaScript高级程序设计-读书笔记(6)
JavaScript高级程序设计-读书笔记(5)
JavaScript高级程序设计-读书笔记(4)
JavaScript高级程序设计-读书笔记(3)
JavaScript高级程序设计-读书笔记(2)
JavaScript高级程序设计-读书笔记(1)
activity通过流程实例id动态获取流程图并展示在jsp页面上
原文地址:https://www.cnblogs.com/jly1/p/13097737.html
最新文章
Git二进制文件冲突解决
28335XINTF的简单使用
Window10系统的安装
windows下C++环境的配置
C#设置字体(FontDIalog)、颜色(ColorDialog)对话框控件
GDI+图形图像处理技术中Pen和Brush的简单使用和简单图形的绘制(C#)
Python 基础数据类型之set
Python 基础数据类型之dict
Python 基础数据类型之tuplu
python 基础数据类型之list
热门文章
python 资产扫描01
python 常用模块之os
python 基础数据类型之str
selenium+python环境搭建
水仙花数-python
打印99乘法表-python
冒泡排序-python
求出10000以内所有的完全数-python
猜数字游戏-python
第7章 查找(散列表)
Copyright © 2011-2022 走看看