参数估计即通过样本计算出来的某个统计值来估计总体的统计值。
参数估计分点估计和区间估计。
点估计即,通过样本直接估计总体的某个指标(均值或者标准差等),估计的结果是一个确定的值。
区间估计即,通过样本估计总体的某个指标,估计的结果是一个区间(置信区间,在某个置信水平上的总体指标所在的区间)。
解释:α为显著性水平{即犯第一类错误的概率(弃真,第二类错误为取伪)}。取α=0.05,下的置信区间即:取真(0.95)的概率下的置信区间。
例子:总体均值有0.95的概率在该置信区间内。(假设估计的参数是均值)
评估一个估计出来的值或者区间的好坏,有三个指标:无偏性(随着抽样次数增加,估计值和实际值无限重合。实际上就是没有系统误差),有效性(越接近实际值越有效),一致性(随着样本量增大,估计的精度也增大)。
PROC MEANS DATA=SASHELP.FISH MAXDEC=2 N MEAN STD STDERR CLM ALPHA=0.01; WHERE SPECIES="Bream"; VAR HEIGHT; TITLE "95% CONFIDENCE INTERVAL FOR BREAM"; RUN;
N 样本个数 、MEAN 均值、STD 标准差、STDERR标准误差、CLM置信区间(ALPHA=0.01指明显著性程度是0.01,即置信水平是1-ALPHA=0.99,默认值是0.05),结果如下图:
上面是默认的ALPHA值,下图是指明ALPHA=0.01的结果。