zoukankan      html  css  js  c++  java
  • [机器学习] k近邻算法

    算是机器学习中最简单的算法了,顾名思义是看k个近邻的类别,测试点的类别判断为k近邻里某一类点最多的,少数服从多数,要点摘录:

    1. 关键参数:k值 && 距离计算方式 && 分类决策规则

    2. k=1, 即只取最近点,容易过拟合,k取较大值,容易欠拟合。k值越小,模型越复杂。k = 3 or 5 works well.

    3. k近邻算法的一个实现:kd树(k-k维空间,二叉树),分两步:构造kd树--搜索kd树。复杂度O(logN). 下图是一个kd树及对应二叉树:

    4. 优点:方法简单易理解, 构建模型快。缺点:对稀疏矩阵或者特征维度比较高的情况下表现不好。

    参考:

    a. 《Introduction to Machine Learning with Python》

    b. 《统计学习方法》

    c. 十五分钟理解kd树 https://www.jianshu.com/p/ffe52db3e12b

  • 相关阅读:
    TestNG
    K近邻算法
    Python解决乱码问题
    Log4J 配置
    多线程死锁
    hadooplzo安装出错的解决方法
    B树
    设计模式
    整数序列化
    Maven
  • 原文地址:https://www.cnblogs.com/Arborday/p/8420684.html
Copyright © 2011-2022 走看看