zoukankan      html  css  js  c++  java
  • 【数学基础篇】--详解人工智能之数学 积分学,概率空间,大数定律和中心极限定理

    一、前述

    上一篇我们讲到了微分学,本文我们接着讲解积分学,以及概率的相关知识。

    二、常用符号

    三、积分

    1、积分定义

    将一个函数对应的区间n等分,然后加和求极限。

    2、积分理解

    代数意义: 无穷求和

    几何意义: 函数与 X 轴之间的有向面积。

    3、(牛顿-莱布尼茨公式)

    如果 f(x) 是定义在闭区间 [a, b] 上的可微函数, 那么就有

    不定积分表示为

    牛顿-莱布尼茨公式展示了微分与积分的基本关系: 在一定程度上微分与积分互 为逆运算.

     4、案例

    求函数 ln(x) 的不定积分。

    5、多变量函数的积分

    如果积分区域形状不规则,可以用一个矩形把积分区域包起 来,并令函数在积分区域外边等于 0.

    二重积分的几何意义是积分函数与 X − Y 坐标平面之间部 分的有向体积.

     6、积分学总结

    积分的代数意义是无穷求和,几何意义是带符号的体积

    微分和积分在一定程度上互为逆运算

    熟悉微分公式有助于计算积分

    多重积分可以理解成是依次进行的单重积分

    四、随机变量与概率

    1、离散随机变量(发生事件的几种情况,比如扔塞子。1-6为随机变量)

    比如上述事件<=3就是1.2.3事件概率取值。

    2、连续随机变量

    对于每一个具体的取值的概率为0.

    对于连续型随机变量,概率为概率密度函数的积分.

    不论是离散还是连续型随机变量, 概率函数和概率密度函数 的定义域即为这个随机变量的值域.

    作为一个特殊的概率函数,分布函数定义为 Φ(x) = P(X < x).

    我们在此只考虑几乎处处连续的概率密度函数,我们不考虑离散,连续混 合型的随机变量

     3、概率

    事件的概率(事件是一个集合)

    整个概率空间是一个事件,这个事件一定发生所以全空间的 概率为 1

    事件是随机变量值域的子集 S

    事件的概率则表示 S 里面概率之和或概率密度之积分.

    事件的条件概率

    条件本身也是事件,也可表示为随机变量值域的子集:A

    条件概率里面的事件,又是这个条件的子集:S ∩ A ⊂ A

    概率其实就是集合的大小比例,而概率函数或者概率密度函数可以理解为比较 大小时候的权重

     4、贝叶斯公式

    利用前面的定义我们知道,事件 A, B 同时发生的概率为 P(A ∩ B),

    一方面 P(A ∩ B) = P(B|A)P(A)

    另一方面对称的有 P(A ∩ B) = P(A|B)P(B)

    所以 P(B|A)P(A) = P(A|B)P(B),

    两边同时除以 P(B) 就得到 了贝叶斯公式.

    五、随机变量与概率:共轭分布

     1、概述

    常见的概率分布基本上都有参数,比如正态分布有 (µ, σ) 两个参 数,泊松分布有一个参数 λ. 对于一个具体的问题而言,关于这 些参数有两种不同的看法

    利用经验得到一个关于参数的先验分布.(Bayesian)

    不对参数先验分布做任何假设,只利用当前观测的数据来对 参数进行估计.(Frequentist)。

    2、先验分布,似然函数,后验分布

    参数先验分布为 p(θ) 似然函数为 p(x|θ) 观测值为 X,贝叶斯的思想是根据观测值来调整参数的先验分布从而得到参数 的后验分布. 参数后验分布为

    3、共轭分布

    如果参数的后验分布与先验分布属于同一类分布,那么我们说这 种先验分布为共轭分布 (Conjugate prior). 比如

    似然函数为正态分布时, 如果 σ 已知,关于 µ 的正太分布是 共轭分布 似然函数为正态分布时, 如果 µ 已知,关于 σ 的反 Gamma 分布是共轭分布

    共轭分布的好处在于,先验与后验分布属于一个大类,这样计算 和理解上都比较方便.

    4、小结 (随机变量与概率)

    概率可以理解为事件所代表的集合在全概率空间中的比例

    对于概率分布参数的先验分布有不同的观点

    如果参数先验分布与后验分布属于同一类,则叫做共轭分布.

    六、大数定律和中心极限定理

    1、随机变量的矩

    X 是一个随机变量对于任何正整数 n,定义

    矩可以描述随机变量的一些特征,

    期望是 X“中心”位置的一种 描述,

    方差可以描述 X 的分散程度,

    特征函数可以全面描述概率 分布.

    2、切比雪夫不等式

    设 X 为随机变量,期望值为 µ, 标准差为 σ, 对于任何实数 k > 0

    切比雪夫不等式给出方差对 X 分散程度的描述提供了一个定量 的估计.

    如何证明切比雪夫不等式:

     

    3、随机变量的相关系数

    X,Y 是两个随机变量。

    X, Y 的协方差:cov(X, Y ) = E(XY ) − E(X)E(Y )

    X, Y 的相关系数

    4、独立随机变量

    X,Y 是两个随机变量如果联合分布 p(x, y) = p(x)p(y),

    则 X, Y 为独立随机变量. 独立随机变量相关系数为 0

    相关系数为零,两个随机变量不见得独立

    5、特殊分布的特征函数

    6、大数定律

    自然对数底数 e 的定义。

    定义:

     

     7、中心极限定理

     8、总结

    随机变量的矩可以描述随机变量所服从分布的性质

    随机变量的特征函数可以全面描述随机变量的分布

    切比雪夫不等式指出方差可以描述随机变量取值的分散程度

    大数定律指出独立重复实验的平均值的收敛规律

    中心极限定理给出独立重复实验平均值更细致的描述

     

     

  • 相关阅读:
    Angular中文api
    Angular各版本和组件下载
    判断一个浏览器是否支持opacity
    查找函数参数名称
    运行时代码求值
    简单的动画引擎
    利用闭包特性改写addEventListener的回调函数
    springboot指定redis库编号配置实现
    springboot获取IOC(ApplicationContext)实例
    ajax-springMVC提交表单的方式
  • 原文地址:https://www.cnblogs.com/LHWorldBlog/p/9614192.html
Copyright © 2011-2022 走看看