zoukankan
html css js c++ java
K-means算法
K-means 聚类算法
无监督问题,我们手里没有标签
聚类:相似的东西分到一组
难点:如何评估,如何调参
基本概念
要得到簇的个数,需要制定K值
质心:均值,各个维度取平均即可
距离的度量:常用的欧几里得距离或者与余弦相似度(先标准化)
优化目标:一共有多少个簇,让每一个样本到簇中心点的距离越小越好
K-means算法
优势
简单,快速,适合常规数据集
劣势
K值很难确定
复杂度和样本呈线性关系
很难发现任意形状的簇
使用k-means对数据进行压缩
查看全文
相关阅读:
数据结构与算法--绪论
Django之模板(T)
博客园之MD文件代码块添加隐藏/显示按钮
博客园之背景特效
博客园之生成侧边目录
占位先1
Django之视图(V)
Django之ORM
Django框架
tomcat在centos下启动缓慢,耗时较长
原文地址:https://www.cnblogs.com/jly1/p/13097737.html
最新文章
Oracle EBS INV 创建物料搬运单行
Oracle EBS INV 释放保留
Oracle EBS INV创建保留
Oracle EBS INV更新保留
转:Oracle EBS FND User Info API
AutoInvoice in Oracle Apps R12
转:Oracle EBS订单的流程(Order->AR)
转:通过API获取和创建 Oracle GL Account Code Combination ID’s (CCID’s)的几种方法汇总
(转+整理) oracle authid definer 与 authid current_user
转:ORACLE制造方法的比较
热门文章
Oracle 流式制造功能培训
(整理)FORM:Oracle EBS客制化Form的菜单栏用法说明
转:Oracle EBS 寄售业务总结
转:ORACLEERP开发基础之EBS开发基础
父盒子消除浮动的几种方法
Django之Cookie和Session
Django之ORM操作
数据结构与算法--线性表
Django之路由系统
算法效率的度量方法
Copyright © 2011-2022 走看看