zoukankan      html  css  js  c++  java
  • 线性判别函数

    模式识别课堂笔记

    假定用于分类的判别函数的参数形式已知,直接从样本来估计判别函数的参数。不需要有关概率密度函数的确切的参数形式。因此,属于无参数估计方法。

    注:虽然判别函数有需要学习的参数,但却与前面所讲的非参数估计是一个框架下的,因为线性判别法并不关心数据的生成机理,完全由样本来确定类别情况。

    分类:

    线性判别函数、支持向量机、Fisher线性判别函数

    广义线性判别函数、非线性判别函数、核学习机

    基本思想:

    步1:给定一个判别函数,且已知该函数的参数形式;

    步2:采用样本来训练判别函数的参数;

    步3:对于新样本,采用判别函数对其进行决策,并按照一些准则来完成分类。


    技术路线:

    –假定有 n 个 d 维空间中的样本,每个样本的类别标签已知,且一共有 c 个不同的类别。

    –假定判别函数的形式已知,寻找一个判别函数。

    –对于给定的新样本 x属于d维空间,判定它属于c中的哪个类别。

    从两类分类函数入手,再设计多类问题,最后推广到广义线性模型。第二部分是关于如何训练这些函数。

    1.先说二类分类函数;

     

    g(x)=0,定义了一个决策面H

    性质:w是H 的法向量,任意一点到H的距离为

    这个r是有正负的,代表是否与法向量同方向。

     

    2.接下来是多类分类:是建立在二类分类基础上的

    2.1一对多情况,把第i类标记为正,其他类标记为负,这样可以构造c个二类分类面;

    但是存在明显缺陷

    2.2一对一情况,两两进行构造分类面,构造时不考虑其他类(完全忽略),这样可以构造c(c-1)/2个分类面;

    同样有缺陷,但相较于上一个不确定的区域少一点,因为分类面多了(三个的话没有效果,四个以上才有对比)

    2.3对应与这种投票表决的方法有一种改进的叫最大决策的方法

     

    3.最后,由于线性机器有两个限制,决策区域要是凸的,而且要是单连通的。所以要对这种线性机制进行推广,得到广义线性判别函数。

    原理是将低维中线性不可分的数据点x,通过非线性变化映射到高维空间中形成数据点y,以期望新的数据点y在高维空间中线性可分。

     

    讨论完线性函数,在下一篇我们要讨论如何通过数据学习这些函数。

       

  • 相关阅读:
    Automatically Display Menu on Hover
    WPF自学教程系列1:如何将WPF空间嵌套到Form窗口?
    NET中的内存管理,GC机制,内存释放过程. 转载
    C++ 初始化和赋值的区别
    2.尽量用const, enum, inline代替#define Prefer const, enum, inline to #define.
    1.视C++为一个语言联邦 View C++ as a federation of languages
    C++内存对齐
    C++ class和struct的区别
    redhat AS5 Samba服务配置
    windowsXP & 2003 加固
  • 原文地址:https://www.cnblogs.com/simayuhe/p/5316943.html
Copyright © 2011-2022 走看看