zoukankan      html  css  js  c++  java
  • 老师布置的几道作业

    这题问的问题 据我的理解应该是 找到使这个式子最大化的c, 用Xi表示出来, 解法我认为应该用拉格朗日乘数法。

    令 $L(c,lambda)=c^TSigma c - lambda (c^Tc-1)$,然后对$L$求c的偏导数并设为0:

    $$ abla(L)_c=2Sigma c - 2lambda c=0$$

    我们有$Sigma c=lambda c$,这是题目中给的式子取到极值的条件,也就是说,拉格朗日乘子是协方差矩阵的特征值,而c是对应的特征向量。

    把$Sigma c=lambda c$代入原题,有 $$c^TSigma c=lambda c^Tc$$,又因为$c^Tc=1$,因此$$c^TSigma c=lambda c^Tc=lambda$$

    那么现在一切都明朗了,只要令$lambda$等于$Sigma$最大的特征值就可以了。

    另一个问题是我们不光要知道最大值是多少,还要求出特征向量并用$X_i$表示。所以我们要先求协方差矩阵,再对其特征值分解。首先我把回归系数的最大似然估计表示为一个向量:$hat{eta}=(eta_1,eta_2)^T$,并设$X=egin{bmatrix}1 &X_1\1 &X_2\...&...\1&X_nend{bmatrix}$,根据正规方程有:

    $$ hat{eta}=(X^TX)^{-1}X^TY $$

    接下来求协方差矩阵:

    $$ hat{eta}=(X^TX)^{-1}X^TY=(X^TX)^{-1}X^T(Xeta+epsilon)=eta+(X^TX)^{-1}X^Tepsilon$$

    $$Sigma=Var(hat{eta})=E[(hat{eta}-eta)(hat{eta}-eta)^T] =E[(X^TX)^{-1}X^Tepsilonepsilon^TX(X^TX)^{-1}]=(X^TX)^{-1}X^TE[epsilonepsilon^T]X(X^TX)^{-1}=sigma^2(X^TX)^{-1}$$

    因此原问题等价于求解

    $$sigma^2(X^TX)^{-1} c=lambda c$$

    于是

    $$ (X^TX) c=frac{sigma^2}{lambda} c=mu c$$

    其中$mu=frac{sigma^2}{lambda}$

    $$ (X^TX-mu I)c=0$$

    令$det(X^TX-mu I)=0$有:

    $$egin{bmatrix}n-mu & sum X_i\ sum X_i & sum X_i^2-muend{bmatrix}=0$$

    解得

    $$frac{sigma^2}{lambda}=mu=frac{(sum X_i^2+n)pmsqrt{(sum X_i^2+n)^2-4(nsum X_i^2-(sum X_i)^2)}}{2}=frac{(sum X_i^2+n)pmsqrt{(sum X_i^2-n)^2+4(sum X_i)^2}}{2}$$

    因此

    $$ lambda=frac{2sigma^2}{(sum X_i^2+n)pmsqrt{(sum X_i^2-n)^2+4(sum X_i)^2}}$$

    如果$(sum X_i^2+n)-sqrt{(sum X_i^2-n)^2+4(sum X_i)^2}>0$那么$lambda$的最大值就是$frac{2sigma^2}{(sum X_i^2+n)-sqrt{(sum X_i^2-n)^2+4(sum X_i)^2}}$

    下面证明$(sum X_i^2+n)-sqrt{(sum X_i^2-n)^2+4(sum X_i)^2}>0$

    $$frac{2sigma^2}{(sum X_i^2+n)-sqrt{(sum X_i^2-n)^2+4(sum X_i)^2}}=frac{2sigma^2(sum X_i^2+n+sqrt{(sum X_i^2-n)^2+4(sum X_i)^2})}{4(nsum X_i^2-(sum X_i)^2)}$$

    下面研究分母

    $$nsum X_i^2-(sum X_i)^2=n(sum X_i^2-nar{X}^2)=nsum(X_i-ar{X})^2$$

    证明:

    $$sum(X_i-ar{X})^2=sum(X_i^2+ar{X}^2-2ar{X}X_i)=sum X_i^2+nar{X}^2-2nar{X}^2=sum X_i^2-nar{X}^2$$

    因此分母>=0,等于0的情况只发生在所有$X_i$都相等时,但这种情况一般不会发生,基本上可以认为分母>0。

    所以

    $$lambda_{max}=frac{sigma^2(sum X_i^2+n+sqrt{(sum X_i^2-n)^2+4(sum X_i)^2})}{2nsum(X_i-ar{X})^2}$$

    剩下的就是求特征向量,太繁琐不求了, 如果有更简单的方法欢迎指出

    这题参考 https://en.wikipedia.org/wiki/Bayes_estimator

  • 相关阅读:
    商业模式--资源整合
    “不小心出卖了领导”
    计算机禁用桌面并且禁用键盘Win+*快捷键组合之后如何打开文件资源管理器
    spring-boot 参数长度、文件上传大小限制问题
    Python 学习基础
    Python字典详解
    Python元组
    Python列表详解
    Python变量类型
    Python字符串详解
  • 原文地址:https://www.cnblogs.com/wacc/p/4823883.html
Copyright © 2011-2022 走看看