zoukankan      html  css  js  c++  java
  • 【统计学】6.统计量及其抽样分布

    【统计学】6.统计量及其抽样分布

    6.1 统计量
    6.2 抽样分布
    6.3 样本均值的分布与中心极限定理
    6.4 由正态分布导出的几个重要分布

    学习目标

    1.了解统计量及其分布的几个概念
    2.了解由正态分布导出的几个重要分布
    3.理解样本均值的分布与中心极限定理
    4.掌握单样本比例和样本方差的抽样分布

    6.1 统计量

    6.1.1 统计量的概念

    统计量(statistic)

    [X_1,X_2,...,X_n ]

    是从总体X中抽取的容量为n的一个样本,如果由次样本构造一个函数

    [T(X_1,X_2,...,X_n) ]

    不依赖于任何未知参数,则称函数

    [T(X_1,X_2,...,X_n) ]

    是一个统计量

    样本均值、样本比例、样本方差等都是统计量

    1. 统计量是样本的一个函数
    2. 统计量是统计推断的基础
    6.1.2 常用统计量

    (1)样本均值

    [overline X = frac{1}{n}sum^n_{i=1}X_i ]

    (2)样本方差

    [S^2 = frac{1}{n-1}sum^n_{i=1}(X_i-overline X)^2 ]

    (3)样本变异系数

    [V = S sqrt{X} ]

    (4)k阶矩

    [m_k = frac{1}{n}sum^n_{i=1}X^k_i ]

    (5)k阶中心矩

    [v_k = frac{1}{n-1}sum^n_{i=1}(X_i-overline X)^k ]

    (6)样本偏度

    [alpha_3 =frac{ sqrt{n-1}sum^n_{i=1}(X_i-overline X)^3}{sum^n_{i=1}(X_i-overline X)^{frac{3}{2}}} ]

    (7)样本峰度

    [alpha_4 = frac{n-1sum^n_{i=1}(X_i-overline X)^4}{[sum^n_{i=1}(X_i-overline X)^2]^2}-3 ]

    6.2 抽样分布(sampling distribution)

    1. 样本统计量的概率分布,是一种理论分布
      1. 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
    2. 随机变量是样本统计量
      1. 样本均值、样本比例、样本方差等
    3. 结果来自容量相同的所有可能样本
    4. 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据

    6.3 样本均值的分布与中心极限定理

    样本均值的抽样分布

    1. 在重复容量为n的样本时,由样本均值的多有可能取值形成的相对频数分布
    2. 一种概率分布
    3. 推断总体均值μ的理论基础

    当总体服从正态分布

    [N(mu,sigma^2) ]

    来自该总体的所有容量为n的样本的均值

    [overline x ]

    也服从正态分布,

    [overline x ]

    的数学期望为

    [mu ]

    方差为

    [frac{sigma^2}{n} ]

    [overline x acksim N(mu,frac{sigma^2}{n}) ]

    中心极限定理(central limit theorem)

    【统计学】中心极限定理

    从均值为μ,方差为

    [sigma^2 ]

    的任意一个总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为

    [frac{sigma^2}{n} ]

    的正态分布

    【统计学】中心极限定理趋向分布

    6.4 由正态分布推导出来的几个重要分布

    卡方分布
    1. 有阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Person)分别于1875年和1900年推导出来

    2. [X acksim N(mu,sigma^2) ]

      [z = frac{X-mu}{sigma} acksim N(0,1) ]

    3. [Y = z^2 ]

      则Y服从自由度为1的卡方分布,即

      [Y acksim chi^2(1) ]

    4. 当总体

      [X acksim N(mu,sigma^2) ]

      从中抽取容量为n的样本,则

      [frac{sum^2_{i=1}(x_i-overline x)^2}{sigma^2} acksim chi^2(n-1) ]

    卡方分布的性质和特点

    1. 分布的变量始终为正
    2. 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称
    3. 期望为

    [E(chi^2) = n ]

    方差为

    [D(chi^2) = 2n ]

    其中n为自由度

    1. 可加性:若U和v为两个独立的卡方分布随机变量,

    [U acksim chi^2(n_1),V acksim chi^2(n_2) ]

    [U+V ]

    这一随机变量服从自由度为

    [n_1+n_2 ]

    的卡方分布

    【统计学】卡方分布

    t分布
    1. 高赛特(W.S.Gosset)于1908年在一篇以"student"为笔名的论文中首次提出
    2. t 分布式类似正态分布的一种对称分布,它通常要比正态分布平坦和分散
    3. 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布

    【统计学】t分布

    F分布
    1. 由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名

    2. 设若U为服从自由度为n1的卡方分布,即

      [U acksim chi^2(n_1) ]

      V为服从自由度为n2的卡方分布,即

      [V acksim chi^2(n_2) ]

      且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为

      [F = frac{frac{U}{n_1}}{frac{V}{n_2}} ]

      [F acksim F(n_1,n_2) ]

      【统计学】F分布

    例题

    例题 1

    设从一个均值μ=10,标准差sigma=0.6的总体中随机选取容量n=36的样本。假定该总体不是很偏,要求:

    1. 样本均值小于9.9的近似概率

      n=36说明是大样本,则该样本均值是满足

      [overline x acksim N(10,frac{0.6^2}{36}) = N(mu,sigma^2) \ mu = 10 ,sigma = 0.1 ]

      先进行标准化

      [P(overline x <9.9) = P(frac{overline x -10}{0.1}<frac{9.9-10}{0.1}) \ phi(-1) = 1- phi(1) = 1-0.8413 = 0.1587 ]

    2. 样本均值超过9.9的近似概率

    [P(overline x >9.9) = P(Z>-1) = phi(1) = 0.8413 ]

    1. 样本均值在总体均值10附近0.1范围的概率

    [P(9.9< overline x <10.1) = P(-1<Z<1) = 2phi(1) -1 = 0.6826 ]

    例题2

    某汽车电瓶生产商称其生产的电瓶均有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命试验

    1. 假定厂方声称是正确的,试描述50个电瓶的平均寿命的抽样分布

      [overline X acksim N(60,frac{36}{50}) ]

    2. 假定厂方声称是正确的,试描述50个样本组成的样本的平均寿命不超过57个月的概率

    [P(overline X leq 57) = P(frac{overline X -60}{sqrt{0.72} }leq frac{57-60}{sqrt{0.72}}) \= 1 - phi(3.529) = 1-0.9998 = 0.0002 ]

    例题3

    [Z_1,Z_2,...Z_6 ]

    表示从标准正态总体中随机抽取的容量为n=6的一个样本,试确定常数b,使得,

    [P(sum^6_{i=1}Z^2_i leq b) = 0.95 ]

    这是一个小样本,总体服从正态分布则

    [Z_i acksim N(0,1) ]

    [P(chi^2_{6} leq b) = 0.95 \ P(chi^2_{6} > b) = 0.05 \ b = 12.592 ]

    Win a contest, win a challenge
  • 相关阅读:
    Java openrasp学习记录(一)
    Java ASM3学习(3)
    Java ASM3学习(2)
    Java Instrumentation插桩技术学习
    Java ASM3学习(1)
    从JDK源码学习HashSet和HashTable
    从JDK源码学习HashMap
    从JDK源码学习ArrayList
    Java XXE漏洞典型场景分析
    CVE-2020-7961 Liferay Portal 复现分析
  • 原文地址:https://www.cnblogs.com/pandaboy1123/p/14759749.html
Copyright © 2011-2022 走看看