前言
变量引入
前面讨论的随机变量的取值是可以一一列举的,称为离散型随机变量,但在实际应用中,还有许多随机变量可以取某一区间的一切值,比如某种电子产品的使用寿命(X),可以取([0,b])或([0,+infty))内的一切值。所有取值在某个区间的随机变量称为连续型随机变量,
曲线引入
由频率分布直方图可以得到频率折线图,如果将区间无限细分,最终得到一条曲线,这条曲线称为随机变量(X)的分布密度曲线,这条曲线对应的函数称为(X)的分布密度函数,记为(f(x))。
正态曲线
函数(f(x)=cfrac{1}{sigmasqrt{2pi}}e^{-cfrac{(x-mu)^2}{2sigma^2}},xin(-infty,+infty)),其中实数(mu,sigma(sigma>0))为参数,我们称(f(x))的图像为正态分布密度曲线,简称正态曲线。
曲线性质
⑴曲线位于(x)轴的上方,与(x)轴不相交;
⑵曲线是单峰的,它关于直线(x=mu)对称;
⑶曲线在(x=mu)处达到峰值(cfrac{1}{sigmasqrt{2pi}});
⑷曲线与(x)轴之间的面积为1;
⑸当(sigma)一定时,曲线的位置由(mu)确定,曲线随着(mu)的变化而沿着(x)轴平移;
⑹当(mu)一定时,曲线的形状由(sigma)确定,(sigma)越小,曲线越“瘦高”,表示总体的分布越集中;(sigma)越大,曲线越“矮胖”,表示总体的分布越分散;
正态分布
⑴.正态分布的定义及表示
若对于任何实数(a,b(a<b)),随机变量(X)满足(P(a<Xleq b)=int_{a}^{b}f(x)\,dx),则称(X)的分布为正态分布,也叫“常态分布”,或“高斯分布”,记作(X sim N(mu,sigma^2))
若(mu=0,sigma=1),则称为标准正态分布,记作(X sim N(0,1))
⑵.正态总体在三个特殊区间内取值的概率值:
①(P(mu-sigma<Xleq mu+sigma)=68.3\%)
②(P(mu-2sigma<Xleq mu+2sigma)=95.4\%)
③(P(mu-3sigma<Xleq mu+3sigma)=99.7\%)
(3).常用性质
根据正态密度曲线的对称性,当(P(xi>x_1)=P(xi<x_2))时必然有(cfrac{x_1+x_2}{2}=mu)。
典例剖析
解析:因为(mu=2),根据正态分布的性质得(cfrac{(a+2)+(2a-3)}{2}=2),解得(a=cfrac{5}{3})。
分析:因为(P(xi>140)=cfrac{1-2P(100<xi<120)}{2}=0.05),所以在140分以上的试卷中要抽取(100×0.05=5)(份),故选 B.
解后反思:在计算服从正态分布的随机变量在特殊区间上的概率时要充分利用正态密度曲线的对称性,将所求的概率转化到我们已知区间上的概率。
(A.P(Yge mu_2)ge P(Yge mu_1))
(B.P(Xleq sigma_2)ge P(Xleq sigma_1))
(C).对任意实数(t),(P(Xleq t)ge P(Yleq t))
(D).对任意实数(t),(P(Xge t)ge P(Yge t))
分析:根据正态密度曲线可知,(mu_1<mu_2),(sigma_1<sigma_2),
则有(P(Yge mu_2)< P(Yge mu_1)),故(A)错; 且有(P(Xleq sigma_2)< P(Xleq sigma_1)),故(B)错;
对(C)选项而言,不妨赋值,设(t=mu_1),由图可知,必有(P(Xleq t)ge P(Yleq t)),故(C)正确;
对(D)选项而言,不妨赋值,设(t=mu_1),由图可知,必有(P(Xge t)< P(Yge t)),故(D)错误;
综上所述,选(C)。
附:若随机变量(Xsim N(mu,sigma^2)),则(P(mu-sigma<Xleq mu+sigma)=68.3\%),(P(mu-2sigma<Xleq mu+2sigma)=95.4\%)
分析:由题可知,(P(-3<X<3)=68.26\%),(P(-6<X<6)=95.44\%),则(P(3<X<6)=cfrac{1}{2}(95.44\%-68.26\%)=13.59\%),故选(B)。
附:若随机变量(Xsim N(mu,sigma^2)),则(P(mu-sigma<Xleq mu+sigma)=68.3\%),(P(mu-2sigma<Xleq mu+2sigma)=95.4\%)
分析:由正态分布(N(0,1))的密度曲线的几何意义,知题图中阴影部分的面积为(P(0<Xleq 1)=cfrac{1}{2} imes 0.6826=0.3413),
故落入阴影部分的点的个数的估计值为(0.3413 imes 10000=3413),故选(C)。
(2018•攀枝花三模)某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.
(I)求该市高一学生身高高于1.70米的概率,并求图1中a、b、c的值.
(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(1.50,1.70]的学生人数,求ξ的分布列和数学期望;
(Ⅲ)若变量S满足P(μ﹣σ<S≤μ+σ)>0.6826且P(μ﹣2σ<S≤μ+2σ)>0.9544,则称变量S满足近似于正态分布N(μ,σ2)的概率分布.如果该市高一学生的身高满足近似于正态分布N(1.6,0.01)的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由.
【考点】CP:正态分布曲线的特点及曲线所表示的意义.菁优网版权所有
【专题】38:对应思想;49:综合法;5I:概率与统计.
【分析】(I)根据茎叶图和频率分布直方图计算各小组的频率,从而得出a,b,c的值;
(II)根据二项分布的概率公式得出ξ的分布列和数学期望;
(III)分别计算P(1.50<X≤1.70,P(1.40<X≤1.80)即可得出结论.
【解答】解:(I)由图2 可知,100名样本学生中身高高于1.70米共有15 名,
以样本的频率估计总体的概率,可得这批学生的身高高于1.70 的概率为0.15.
记X为学生的身高,给合图1可得:
f(1.30<X≤1.40)=f(1.80<X≤1.90)= =0.02,
f(1.40<X≤1.50)=f(1.70<X≤1.80)= =0.13,
f(1.50<X≤1.60)=f(1.60<X≤1.70)= (1﹣2×0.02﹣2×0.13)=0.35,
又由于组距为0.1,所以a=0.2,b=1.3,c=3.5.
(II)以样本的频率估计总体的概率可得:
从这批学生中随机选取1名,身高在(1.50,1.70]的概率为0.35+0.35=0.7.
所以随机变量ξ服从二项分布B(3,0.7),故P(ξ=k)= •0.7k•0.33﹣k(k=0,1,2,3).
故ξ的分布列为:
ξ 0 1 2 3
P 0.027 0.189 0.441 0.343
∴E(ξ)=3×0.7=2.1.
(Ⅲ)由(Ⅱ)可知,P(1.50<X≤1.70)=0.7>0.6826,
又结合(I),可得:P(1.40<X≤1.80)=1﹣0.02×2=0.96>0.9544,
所以这批学生的身高满足近似于正态分布N(1.50,0.01)的概率分布,
所有应该认为该市高一学生的身高发育总体是正常的.
【点评】本题考查了频率分布直方图,二项分布列,正态分布,属于中档题.
分析:(0.8185).
附:若(Zsim N(mu,sigma^2)),则(P(|Z-mu|<sigma)=0.6826),(P(|Z-mu|<2sigma)=0.9544),(P(|Z-mu|<3sigma)=0.9974),
分析:选(A);