zoukankan
html css js c++ java
K-means算法
K-means 聚类算法
无监督问题,我们手里没有标签
聚类:相似的东西分到一组
难点:如何评估,如何调参
基本概念
要得到簇的个数,需要制定K值
质心:均值,各个维度取平均即可
距离的度量:常用的欧几里得距离或者与余弦相似度(先标准化)
优化目标:一共有多少个簇,让每一个样本到簇中心点的距离越小越好
K-means算法
优势
简单,快速,适合常规数据集
劣势
K值很难确定
复杂度和样本呈线性关系
很难发现任意形状的簇
使用k-means对数据进行压缩
查看全文
相关阅读:
Fraction to Recurring Decimal
Compare Version Numbers
回溯法 -数据结构与算法
Maximum Gap
STL——迭代器的概念
STL——内存基本处理工具
STL——空间的配置和释放std::alloc(第一级配置器和第二级配置器)
careercup-中等难度 17.12
careercup-中等难度 17.11
careercup-中等难度 17.9
原文地址:https://www.cnblogs.com/jly1/p/13097737.html
最新文章
124. Binary Tree Maximum Path Sum
125. Valid Palindrome
126. Word Ladder II(hard)
127. Word Ladder
128. Longest Consecutive Sequence
129. Sum Root to Leaf Numbers
130. Surrounded Regions
132. Palindrome Partitioning II
131. Palindrome Partitioning
133. Clone Graph
热门文章
阮老师谈虚数
阮老师谈泊松分布
阮老师讲解TF-IDF算法
圈子内小故事
圈子
内容众包
恩,再见,学术圈
team geek
PHP手册 – 变量和常量
脑子里冒出了几个公式
Copyright © 2011-2022 走看看