zoukankan
html css js c++ java
KNN算法--物以类聚,人以群分
KNN(K Nearest Neighbors,K近邻 )算法是机器学习所有算法中理论最简单,最好理解的。KNN是一种基于实例的学习,通过计算新数据与训练数据特征值之间的距离,然后选取K(K>=1)个距离最近的邻居进行分类判断(投票法)或者回归。如果K=1,那么新数据被简单分配给其近邻的类。KNN算法算是监督学习还是无监督学习呢?首先来看一下监督学习和无监督学习的定义。对于监督学习,数据都有明确的label(分类针对离散分布,回归针对连续分布),根据机器学习产生的模型可以将新数据分到一个明确的类或得到一个预测值。对于非监督学习,数据没有label,机器学习出的模型是从数据中提取出来的pattern(提取决定性特征或者聚类等)。例如聚类是机器根据学习得到的模型来判断新数据“更像”哪些原数据集合。KNN算法用于分类时,每个训练数据都有明确的label,也可以明确的判断出新数据的label,KNN用于回归时也会根据邻居的值预测出一个明确的值,因此KNN属于监督学习。
KNN算法的计算过程:
选择一种距离计算方式, 通过数据所有的特征计算新数据与已知类别数据集中的数据点的距离
按照距离递增次序进行排序,选取与当前距离最小的k个点
对于离散分类,返回k个点出现频率最多的类别作预测分类;对于回归则返回k个点的加权值作为预测值
来自为知笔记(Wiz)
查看全文
相关阅读:
Linux文件目录结构详解
Linux常用命令学习
51Nod 1094 和为k的连续区间 | 水
(转) jsp学习笔记
Hadoop到底能做什么?怎么用hadoop?
51Nod 1092 回文字符串 | 最长公共子序列变形
51Nod 1067 Bash游戏 V2 | 博弈论 Bash
51Nod 1062 序列中最大的数 | 简单DP
51Nod 1050 循环数组最大子段和 | DP
HDU 5643 King's Game | 约瑟夫环变形
原文地址:https://www.cnblogs.com/zhoudayang/p/5058271.html
最新文章
LeetCode: Single Number
LeetCode: Copy List with Random Pointer
Discourse 如何备份到 S3
Discourse 有什么办法可以设置全局通知
Discourse 如何启用 matomo 代码跟踪
Discourse 如何安装一个主题组件或者主题组件
Discourse 如何添加 Google Analytics 的代码
Discourse 安装或者编译的时候提示 github 不能被解析
Discourse 发送人邮件地址如何修改的方法
Discourse 主题字数限制
热门文章
Linode 虚拟主机安装 discourse 邮件没有发送
Fedora 运行 Apache 的时候无法启动,提示日志错误
守护进程
Linux安装telnet
linux CentOS 上安装chrome
Linux环境Nginx安装、调试以及PHP安装
CGI、FastCGI和php-fpm的概念和区别
Linux rpm 命令参数使用详解[介绍和应用]
Linux创建ftp并设置权限以及忘记ftp帐号(密码)修改
Linux中常用操作命令
Copyright © 2011-2022 走看看