zoukankan      html  css  js  c++  java
  • 如何理解似然函数?

    作者:Yeung Evan
    链接:https://www.zhihu.com/question/54082000/answer/145495695
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    在英语语境里,likelihood 和 probability 的日常使用是可以互换的,都表示对机会 (chance) 的同义替代。但在数学中,probability 这一指代是有严格的定义的,即符合柯尔莫果洛夫公理 (Kolmogorov axioms) 的一种数学对象(换句话说,不是所有的可以用0到1之间的数所表示的对象都能称为概率),而 likelihood (function) 这一概念是由Fisher提出,他采用这个词,也是为了凸显他所要表述的数学对象既和 probability 有千丝万缕的联系,但又不完全一样的这一感觉。中文把它们一个翻译为概率一个翻译为似然也是独具匠心。

    先看似然函数的定义,它是给定联合样本值m{x}下关于(未知)参数	heta

    的函数:

    L(	heta | m{x}) = f(m{x} | 	heta)

    这里的小m{x}是指联合样本随机变量m{X}取到的值,即m{X} = m{x}

    这里的	heta是指未知参数,它属于参数空间;

    这里的f(m{x}|	heta)是一个密度函数,特别地,它表示(给定)	heta下关于联合样本值m{x}

    的联合密度函数。

    所以从定义上,似然函数和密度函数是完全不同的两个数学对象,前者是关于	heta的函数,后者是关于m{x}的函数。所以这里的等号=

    理解为函数值形式的相等,而不是两个函数本身是同一函数(根据函数相等的定义,函数相等当且仅当定义域相等并且对应关系相等)。

    说完两者的区别,再说两者的联系。

    (1)如果m{X}是离散的随机向量,那么其概率密度函数 f(m{x} | 	heta)可改写为 f(m{x} | 	heta) = mathbb{P}_	heta(m{X} = m{x}),即代表了在参数	heta下随机向量m{X}取到值m{x}

    可能性;并且,如果我们发现

    L(	heta_1 | m{x} ) = mathbb{P}_{	heta_1}(m{X} = m{x}) > mathbb{P}_{	heta_2}(m{X} = m{x}) = L(	heta_2 | m{x})

    那么似然函数就反应出这样一个朴素推测:在参数	heta_1下随机向量m{X}取到值m{x}可能性大于 在参数	heta_2下随机向量m{X}取到值m{x}可能性。换句话说,我们更有理由相信(相对于	heta_2来说)	heta_1

    更有可能是真实值。

    (2)如果m{X}是连续的随机向量,那么其密度函数 f(m{x} | 	heta)本身(如果在m{x}连续的话)在m{x}处的概率为0,为了方便考虑一维情况:给定一个充分小epsilon > 0,那么随机变量X取值在(x - epsilon, x + epsilon)

    区间内的概率即为

    mathbb{P}_	heta(x - epsilon < X < x + epsilon) = int_{x - epsilon}^{x + epsilon} f(x | 	heta) dx approx 2 epsilon f(x | 	heta) = 2 epsilon L(	heta | x)

    并且两个未知参数的情况下做比就能约掉2epsilon,所以和离散情况下的理解一致,只是此时似然所表达的那种可能性概率f(x|	heta) = 0

    无关。

    综上,概率(密度)表达给定	heta下样本随机向量m{X} = m{x}可能性,而似然表达了给定样本m{X} = m{x}下参数	heta_1(相对于另外的参数	heta_2

    )为真实值的可能性。我们总是对随机变量的取值谈概率,而在非贝叶斯统计的角度下,参数是一个实数而非随机变量,所以我们一般不谈一个参数的概率

    最后我们再回到L(	heta | m{x}) = f(m{x} | 	heta)这个表达。首先我们严格记号,竖线|表示条件概率或者条件分布,分号;表示把参数隔开。所以这个式子的严格书写方式是

    L(	heta | m{x}) = f(m{x} ; 	heta)

    因为	heta在右端只当作参数理解。

  • 相关阅读:
    数据库mysql的基本操作
    多进程多线程与进程池线程池及协程
    面对对象的属性和方法
    Python中的编码及操作文件
    通过pymysql操作mysql数据库
    Spring注入
    Mybatis标签及使用1
    全局配置文件说明
    类方法和对象方法的区别
    Mybatis
  • 原文地址:https://www.cnblogs.com/swg1124/p/7116380.html
Copyright © 2011-2022 走看看