zoukankan      html  css  js  c++  java
  • "模式识别与机器学习"读书笔记——2 Probability Distributions

    由于概率论在模式识别中占有举足轻重的位置,所以这章就专门讲一讲几个典型的概率分布和它们的性质。另外还涉及一些简单的统计学概念。

    概率分布就是给p(x)建立模型,又称为密度估计(density estimation)。说到底也就是个建模,所以每一个模型都是不适定的,模型也有无限多可能性,选取合适的模型就成立模式识别中的一个重要议题。

    这无限多的模型可以被分成两大类:parametric distribution与nonparametric distribution

    parametric distribution:
    之所以这么叫是因为它们的表现好坏是由一系列参数控制的,比如高斯分布中的u与那个方差。
    确定这种分布要由给定数据确定参数值。


    常见的做法有:
    找到参数使某某值最小等(likelihood function),最优化那个做法。
    贝叶斯做法,通过给定数据、先验分布确定后验分布。
    其中贝叶斯做法中一类特殊情况可以大大简化分析过程,即为conjugate priors。都属于exponential family of distribution 

    缺点:参数分布的缺点是提前已经确定了分布函数的框架了,对一些特定的情况不合适。有局限性。

    nonparametric distribution:

    分布的模式只与数据集的大小有关,其中的参数也只是确定复杂度用的。

  • 相关阅读:
    大话设计模式C++ 适配器模式
    36. Valid Sudoku
    c++ 常用的数据结构
    《大话设计模式》c++实现 状态模式
    c++ 各种类型转换
    38. Count and Say
    《大话设计模式》c++实现 抽象工厂模式
    66. Plus One
    49. Group Anagrams
    《大话设计模式》c++实现 建造者模式
  • 原文地址:https://www.cnblogs.com/plwang1990/p/2103644.html
Copyright © 2011-2022 走看看