zoukankan      html  css  js  c++  java
  • 贝叶斯方法(Bayesian approach) —— 一种概率解释(probabilistic interpretation)

    1. Bayesian approach

    对于多项式拟合问题,我们可通过最小二乘(least squares)的方式计算得到模型的参数,最小二乘法又可视为最大似然(maximum likelihood)的一种特例,当模型选择过于复杂时,很容易在测试集上造成过拟合(over-fitting),因此,过拟合问题可被理解为最大似然普遍存在的一种性质。

    过拟合的问题可通过贝叶斯方法得以避免。

    2. 举例

    N 个输入向量 x={x1,x2,,xN}T 及每一个输入向量对应的目标值 t={t1,t2,,tN}。定义 y(x,w) 为判定函数,所谓一种概率化的处理方式即在于,输入样本为 x0 时,预测值未必为 y(x0,w),而是以一定概率为 y(x0,w)。我们现做如下假设:

    p(tx,w,β)=N(t|y(x,w),β1)

    也即服从均值为 y(x,w),方差为 σ2=β1 的高斯分布。

    则对于全体样本的似然函数(连乘是基于样本之间彼此独立的基本假设)为:

    p(tx,w,β)=n=1NN(tn|y(xn,w),β1)

    为方便计算,两边同时取对数,进一步简化为:

    lnp(tx,w,β)=β2n=1N{tny(xn,w)}2+N2lnβN2ln(2π)

    则可求得 β 的最大似然解 βML(上述等式求关于 β 的导数,并置 0):

    1βML=1Nn=1N{tny(xn,w)}2

    1βML 表示的是高斯分布的方差。

  • 相关阅读:
    小例子-使用JS/JQ获取a标签的href网址
    R语言随手记-线性回归模型诊断
    R语言随手记-数据处理
    正选择分析-PAML discussion group
    ggtree-基本函数使用
    PhastCons
    R语言随手记-批量读取和循环处理多个数据文件
    变异位点有害性软件评估
    ggplot画图-分页and排序
    R画图-标题和坐标轴篇
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9422340.html
Copyright © 2011-2022 走看看