zoukankan      html  css  js  c++  java
  • 高等数理统计(四)

    引言

      【比较官方的简介】数理统计学是一门以概率论为基础,应用性很强的学科。它研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。

      【简单的讲】,就是通过样本分析来推断整体。

      【意义或者重要性】在这个大数据时代,数据是非常重要的。怎样挖掘数据内部的规律或者隐含的信息,变得尤为重要。当时我们是不可能获得整体的数据的,所以我们只能通过抽取样本,进而通过样本来推断整体的规律。

      【目录】

      第一章、样本与统计量

        一、引言:

        二、总体与样本:

        三、统计量:

        四、常用分布:

      第二章、参数估计

        一、引言:

        二、点估计——矩估计法

        三、点估计——极大似然估计

        四、估计量的优良性准则

        五、区间估计——正态分布

          1、引入

          2、单个正态总体参数的区间估计

          3、两个正态总体的区间估计

        六、区间估计——非正态分布:

          1、大样本正态近似法

          2、二项分布

          3、泊松分布

      第三章、假设检验

        一、引言:

        二、正态总体均值的假设检验

          1、单正态总体 N(μ, σ2)均值 μ 的检验

            (1) 双边检验 H0: μ = μ0;H1: μ≠μ0 

            (2) 单边检验 H0: μ = μ0;H1: μ>μ0

          2、两个正态总体 N(μ1, σ12) 和  N(μ2, σ22)均值的比较

            (1) 双边检验 H0μ1 = μ2;H1μ1μ2 

              (2) 单边检验 H0μ1 >= μ2;H1μ1<μ2 

            (3) 单边检验 H0μ1 <= μ2;H1μ1>μ2 

        三、正态总体方差的检验

          1、单个正态总体方差的 χ2 检验

            (1) H0: σ2 =σ02;H1: σ2 ≠σ02

            (2) H0: σ2 =σ02;H1: σ2 >σ02

            (3)  H0σ2 ≤σ02;H1σ2 > σ02 (同2.)

          2、两正态总体方差比的 F 检验

             (1).  H0: σ12 = σ22;H1: σ12 ≠  σ22.

             (2) H0: σ12 = σ22;H1:    σ12> σ22

             (3) H0: σ12 ≤ σ22;H1:    σ12> σ22

       第四章、回归分析

        一、引言

        二、一元线性回归
          1、一元线性回归模型
          2、回归系数的最小二乘估计:
          3、回归方程的显著性检验
            (1)F 检验
            (2)T 检验
              (3)相关系数检验

          4、估计与预测

            (1) E(y0)的估计

            (2) y0的预测区间

         三、广义线性回归模型

         四、非线性回归模型

    第四章、回归分析

      一、引言:

      变量间的两类关系:十九世纪,英国生物学家兼统计学家高尔顿研究发现:

         其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。

        Ø 回归分析处理的是变量与变量间的关系。变量间常见的关系有两类:确定性关系与相关关系
        Ø 变量间的相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式,寻找这种定量关系表达式就是回归分析的主要任务。
        Ø 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物中变量的大量观察或试验获得的数据,去寻找隐藏在数据背后的相关关系,给出它们的表达形式——回归函数的估计
      
      二、一元线性回归
      1、一元线性回归模型

      设y与x间有相关关系,称x为自变量(预报变量),y为因变量(响应变量),在知道x取值后,y有一个分布p(y|x),我们关心的是y的均值E(Y|x)

        

      这便是y关于x的理论回归函数——条件期望,也就是我们要寻找的相关关系的表达式。通常,相关关系可用下式表示:y =f (x)+ ε,其中ε是随机误差,一般假设ε ~N(0,σ2)

      进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画散点图 的方法进行选择。

      【例1】合金的强度y (×107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi) ,i=1,2, ... , n。本例中,我们收集到12组数据,列于表1中

        

      为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见图1

        

      从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为

                            y =Β0+ Β1x+ ε                                        (2)

        这便是y关于x的一元线性回归的数据结构式。通常假定

                            E(ε) =0,  Var(ε) = σ                                                     (3)

        在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即

                            y ~N(Β0+ Β1x , σ2 )                                 (4)

      显然,假定(4) 比 (3) 要强。

      由于 Β0, Β1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1, y2,…, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:

        

      由数据(xi,yi),i=1,2,…,n,可以获得Β0, Β1的估计 ,称

        

      为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后, 称回归值(在不同场合也称其为拟合值、预测值)

      2、回归系数的最小二乘估计:

        

        

        

      【例2】使用例1中合金钢强度和碳含量数据,我们可求得回归方程,见下表.

        

      【性质】关于最小二乘估计的一些性质罗列在如下定理之中

        

        

      【证明】定理1证明如下:

      

      

      

       3、回归方程的显著性检验

      在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。如果Β1=0,那么不管x如何变化,E(y)不随x的变化作线性变化,那么这时求得的一元线性回归方程就没有意义,称回归方程不显著。如果Β1≠0,E(y)随x的变化作线性变化,称回归方程是显著

        综上,对回归方程是否有意义作判断就是要作如下的显著性检验:H0:Β1=0      vs      H1: Β1≠0  。拒绝H0表示回归方程是显著的

      在一元线性回归中有三种等价的检验方法,下面分别加以介绍。

      (1)F 检验:采用方差分析的思想,我们从数据出发研究各yi不同的原因。

      

      【证明】公式(13)证明如下:

      

      【推论】

      

       关于SR 和 Se所含有的成分可由如下定理说明

      

      进一步,有关SR 和 Se的分布,有如下定理。

      

      如同方差分析那样,我们可以考虑采用F比作为检验统计量:

      

      【例3】在合金钢强度的例2中,我们已求出了回归方程,这里我们考虑关于回归方程的显著性检验。

      

      (2)T 检验:

      对H0 : Β1 =0的检验也可基于t分布进行。

      

      

      

      (3)相关系数检验

      一元线性回归方程是反映两个随机变量x与y间的线性相关关系,它的显著性检验还可通过对二维总体相关系数r的检验进行。(相关系数的概念可见【第一章------>三、统计量】)

      

      

      

      【总结】在一元线性回归场合,三种检验方法是等价的:在相同的显著性水平下,要么都拒绝原假设,要么都接受原假设,不会产生矛盾。  F 检验可以很容易推广到多元回归分析场合,而其他二个则否,所以,F检验是最常用的关于回归方程显著性检验的检验方法

       4、估计与预测:

      当回归方程经过检验是显著的后,可用来做估计和预测。这是二个不同的问题:

      

      (1) E(y0)的估计

      在x=x0时,其对应的因变量y0是一个随机变量,有一个分布,我们经常需要对该分布的均值给出估计。

      

      

      

      (2) y0的预测区间

      

      【详细过程】

      

      

      

      

       三、广义线性回归模型

       四、非线性回归模型

  • 相关阅读:
    MySQL性能指标及计算方法(go)
    Flashback for MySQL 5.7
    oracle_外部表的两种实现方式oracle_loader[datapump]
    oracle数据库内存调整之增加内存
    Leetcode: Binary Tree Paths
    Leetcode: Verify Preorder Sequence in Binary Search Tree
    Leetcode: Meeting Rooms II
    Leetcode: Meeting Rooms
    Leetcode: Flatten 2D Vector
    Leetcode: Count Univalue Subtrees
  • 原文地址:https://www.cnblogs.com/mo-wang/p/4988754.html
Copyright © 2011-2022 走看看