zoukankan
html css js c++ java
KNN算法--物以类聚,人以群分
KNN(K Nearest Neighbors,K近邻 )算法是机器学习所有算法中理论最简单,最好理解的。KNN是一种基于实例的学习,通过计算新数据与训练数据特征值之间的距离,然后选取K(K>=1)个距离最近的邻居进行分类判断(投票法)或者回归。如果K=1,那么新数据被简单分配给其近邻的类。KNN算法算是监督学习还是无监督学习呢?首先来看一下监督学习和无监督学习的定义。对于监督学习,数据都有明确的label(分类针对离散分布,回归针对连续分布),根据机器学习产生的模型可以将新数据分到一个明确的类或得到一个预测值。对于非监督学习,数据没有label,机器学习出的模型是从数据中提取出来的pattern(提取决定性特征或者聚类等)。例如聚类是机器根据学习得到的模型来判断新数据“更像”哪些原数据集合。KNN算法用于分类时,每个训练数据都有明确的label,也可以明确的判断出新数据的label,KNN用于回归时也会根据邻居的值预测出一个明确的值,因此KNN属于监督学习。
KNN算法的计算过程:
选择一种距离计算方式, 通过数据所有的特征计算新数据与已知类别数据集中的数据点的距离
按照距离递增次序进行排序,选取与当前距离最小的k个点
对于离散分类,返回k个点出现频率最多的类别作预测分类;对于回归则返回k个点的加权值作为预测值
来自为知笔记(Wiz)
查看全文
相关阅读:
完整约束二(学习笔记)
完整约束一(学习笔记)
表的创建与管理二(学习笔记)
闪回技术(学习笔记)
表的创建与管理一(学习笔记)
借助AWR报告分析解决oracleCPU过高的问题(转)
数据的集合运算(学习笔记)
SQL:1999基本语法(学习笔记)
表的连接操作(学习笔记)
多表查询(学习笔记)
原文地址:https://www.cnblogs.com/zhoudayang/p/5058271.html
最新文章
【BZOJ1053】[HAOI2007]反素数(搜索)
【BZOJ1047】[HAOI2007]理想的正方形(单调队列,动态规划)
【BZOJ1044】[HAOI2008]木棍分割(动态规划,贪心)
【BZOJ1037】[ZJOI2008]生日聚会(动态规划)
【BZOJ1032】[JSOI2007]祖玛(动态规划)
【BZOJ1028】[JSOI2007]麻将(贪心)
【BZOJ2084】[Poi2010]Antisymmetry(manarcher)
【BZOJ1025】[SCOI2009]游戏(动态规划)
【BZOJ1024】[SCOI2009]生日快乐(搜索)
【BZOJ1021】[SHOI2008]循环的债务(动态规划)
热门文章
【BZOJ1019】[SHOI2008]汉诺塔(数论,搜索)
【BZOJ1017】[JSOI2008]魔兽地图(动态规划)
【BZOJ3489】A simple rmq problem(KD-Tree)
【BZOJ4477】[JSOI2015]字符串树(Trie树)
触发器一(触发器简介)(学习笔记)
Oracle系统工具包(学习笔记)
程序包(学习笔记)
函数(学习笔记)
存储过程(学习笔记)
完整约束三(学习笔记)
Copyright © 2011-2022 走看看