学习目标:抓住80%的核心考点 (参考专业综合考试大纲一书)
重点如下:
1概率论知识(同大学课程):计算均值,方差,标准差,背公式,正态分布
2统计量及抽样分布-核心知识
3参数估计(计算题) -居间估计计算
4假设检验(判断题)
5线性回归方程(小题)-判断相关性
6other:其他是非重点
------------------------------开始扯淡-----------------------------
1变量分类:(后期分析的变量都将针对这三类变量)
分类变量(categorical variable) :说明事物类别的名称
顺序变量(rank variable):说明事物有序类别的名称
数值型变量(metric variable) :说明事物数字特征的名称
2基本概念:
后期在计算时,要区别研究对象是整体还是样本,这样计算公式带入的参数不一样。
3数据度量
a 集中趋势:一组数据向其中心值靠拢的倾向和程度
分类数据:众数 (出现次数最多)
顺序数据:中位数(排序后处于中间位置上的值)和四分位数(排序后处于25%和75%位置上的值)
数值型数据:平均数(均值)-如上图
三者关系如下图:
b 离散程度(反映各变量值远离其中心值的程度)
分类数据:异众比率 (用于衡量众数的代表性)
顺序数据:四分位差(反映了中间50%数据的离散程度)
数值型数据:方差和标准差 (大学概率论知识)-这里的X- 用u代替则是-总体方差和标准差
相对离散程度:离散系数(用于对不同组别数据离散程度的比较)
----------------------------------以下是概率论知识:重点是正态分布----------------------------------------------
1离散型随机变量:
数学期望计算:
方差计算:
常见的离散型随机变量:二项分布(非0即1)
2连续随机变量:
概率密度函数:相当于高数的积分函数(总体面积为1)
分布函数:相当于上图的a-b部分的面积
正态分布:(标准正态分布有对称性)
-------------------------------------------以下是统计学基础知识-------------------------------------------------------
1统计量:是样本的一个函数,是函数,是函数,重要的说三次。
2 .X2分布:期望为n,方差为2n(n为自由度) (n决定分布的形状,通常是不对称的正偏分布,当n增加时,形状趋于对称)
t分布:类似正态分布的一种对称分布,它通常要比正态分布平坦和分散 (所以后面的参数估计计算中,用t分布计算出来的值和正态分布相差不大)
F分布:(就是两个自由度的x2分布合在一起的)
中心极限定理(就是他们在N样本量很大时,都会服从标准正态分布-为了简化计算吧,偷懒)
-------------------------------------------------------END-----------------------------------------------------------------------