zoukankan      html  css  js  c++  java
  • 初识机器学习_02 K-近邻算法

      

      采用测量不同特征之间距离的方法进行分类

      优点:精度高,对异常不敏感,无数据输入假定

      缺点:计算复杂度高,空间复杂度高

      适用:数值型,标称型

      原理:存在一个样本数据集,其中每一个数据都存在标签(分类)即训练集中每个数据与所属分类对应关系已知。

         输入无标签(分类标签)数据,将新数据的每个特征(数值)与样本集中的数据对应特征进行比较(计算距离),然后算法提取样本集中特征最相似(距离最近)的数据的分类标签,一般选取样本集中前K(k<=20)个最相似的数据(按距离排序),以出现次数最多的分类作为新数据的分类。

  • 相关阅读:
    压缩与解压缩
    权限和特殊权限
    用户和组
    bash基础特性
    vim编辑器
    目录及文件操作命令
    ye
    软件包的安装与管理
    磁盘管理
    归档与展开归档
  • 原文地址:https://www.cnblogs.com/govin/p/3687253.html
Copyright © 2011-2022 走看看