zoukankan      html  css  js  c++  java
  • 指数族分布:相关概念理解

    一、指数族分布指的是概率密度函数都能够表述成以下形式的概率分布。

     其中fai(x)是充分统计量,A(ita)是对数配分函数。ita是规范化参数。【配分函数其实就是归一化因子的概念,为了使概率满足概率总和为1的约束】

    指数族分布包括Gauss分布,bernoulli分布(0,1分布),beta分布,gamma分布,二项分布(多项式分布),Dirichlet分布等。这些分布的概率密度函数都可以表示成上图中式子的形式。

                对数配分函数的推导

    举例将高斯分布的概率密度函数用指数族分布的形式表达如下:

    三、指数族分布有三个重要性质,分别是充分统计量、共轭、最大熵。

    ①关于充分统计量:(sufficient statistic)的理解:比如高斯分布中的{均值、方差}就是一组充分统计量,通过{均值,方差}我们就能得到这一组数据的大部分信息。(待确定)

    不仅是{均值,方差},也可以是{sum(xi),sum(xi)^2}...,【查找相关统计概念】

    充分统计量“充分”指的就是参数组{ ..}包含的原始数据的信息足够多,可以用于压缩数据。

    “统计量”指的就是数学意义上一组数据的统计量,比如均值,方差...。

     ②关于共轭:是通过似然和先验的共轭关系,将先验的分布与后验的分布联系起来。如果似然和先验共轭,那么后验的分布与先验的分布是同一种分布。

     ③关于最大熵:【待定:对未知参数的估计,往最随机的方向假定。】

    四、指数族分布中A(ita)和fai(x)的关系、A'(ita)和fai(x)的关系

    ①:A'(ita)和fai(x)的关系

    式①:配分函数Z(也叫作归一化因子)

            A'(ita)和fai(x)的关系: A'(ita)=E(fai(x)),条件是p(x|ita)。

    ②由极大似然的想法推出 g_MLE=1/N(sum(fai(xi)))。

    即从样本的充分统计量进行求和平均,就能得到参数向量值 g_mle。

     可以应用于广义线性模型(回归/分类)、概率图模型(RBM)、和变分推断(简便运算)中。

    参考:

    1.https://www.bilibili.com/video/BV1QW411y7D3?p=2,B站UP主:shuhuai008

  • 相关阅读:
    Educational Codeforces Round 30 B【前缀和+思维/经典原题】
    Educational Codeforces Round 30 A[水题/数组排序]
    洛谷 P2415 集合求和【数学公式/模拟】
    洛谷 P2689 东南西北【模拟/搜索】
    洛谷 P1012 拼数 [字符串]
    codeforces 869C The Intriguing Obsession【组合数学+dp+第二类斯特林公式】
    洛谷 P3927 SAC E#1
    洛谷P3929 SAC E#1
    洛谷P3926 SAC E#1
    codeforces 868B The Eternal Immortality【暴力+trick】
  • 原文地址:https://www.cnblogs.com/feynmania/p/13405284.html
Copyright © 2011-2022 走看看