【统计学】1.导论
其他课程的联系
- 前置课程
- 概率论和数理统计
- 后续课程
- 数据分析等相关课程
- 教材
- 统计学(第七版)贾俊平
上机实验
- Excel
- SPSS
学习方式
- 听课
- 读书、参考资料、课后习题
- 实验相关内容
- 预习和复习
1.1 统计及其应用领域
1.2 统计数据的类型
1.3 统计学中的几个基本概念
学习目标
1.理解统计学的含义
1.1.1 什么是统计学(statistics)
收集、处理、分析、解释数据并从数据中得出结论的科学
收集数据:取得数据
处理数据:整理与图表展示
分析数据:利用统计方法分析数据
数据解释:结果的说明
得到结论:从数据分析中得出客观结论
1.1.2 统计的应用领域
统计学应用于经济学、医学、管理学、工程学、社会学等领域
统计学为多个学科提供通用的数据分析方法
2.了解描述统计和推断统计
描述统计(descriptive statistics)
1.研究数据收集、处理、汇总、图表描述、概括与分析等统计方法
2.内容
- 搜集数据
- 整理数据
- 展示数据
- 描述性分析
3.目的
- 描述数据特征
- 找出数据的基本规律
推断统计(inferential statistics)
1.研究如何利用样本数据来推断总体特征的统计方法
2.内容
- 参数估计
- 假设检验
3.目的
- 对总体特征做出判断
3.了解统计学的应用领域
1.企业发展战略
2.产品质量管理
3.市场研究
4.财务分析
5.经济预测
6.人力资源管理
统计不是万能的
一般来说,统计中的数据分析是从数据中找出启发,而不是寻找支持某个结论的统计结果
统计方法可以帮助分析数据,但对统计结论做进一步的解释,可能需要其他方面的专业知识
4.了解数据的基本类型
1.2.1 分类数据、顺序数据、数值型数据
统计数据的分类
- 按计量层次
- 分类的数据(categorical data)
- 只能归于某一类别的非数字型数据
- 对事物进行分类的结果,数据表现为类别,用文字来表述
- 例如,人口按性别分为男、女两类
- 顺序的数据(rank data)
- 只能归于某一有序类别的非数字型数据
- 对事物类别顺序的测度,数据表现为类别,用文字来表述
- 例如,产品分为一等品、二等品、三等品、次品等
- 数值型的数据(metric data)
- 按数字尺度测量的观察值
- 结果表现为具体的数值,对事物的精确测度
- 例如:身高为 175cm、168cm、183cm
- 分类的数据(categorical data)
1.2.2 观测数据和实验数据
-
按收集方法
-
观察的数据(observational data)
- 通过调查或观测而收集到的数据
- 在没有对事物人为控制的条件下得到的
- 有关社会经济现象的统计数据几乎都是观测数据
-
实验的数据(experimental data)
- 在实验中控制实验对象而收集到的数据
- 比如,对一种新药疗效的实验,对一种新的农作物品种的实验等
- 自然科学领域的数据大多数都为实验数据
1.2.3 截面数据和时间序列数据
-
按时间状况
-
截面的数据(cross-sectional data)
- 在相同或近似相同的时间点上收集的数据
- 描述现象在某一时刻的变化情况
- 比如,2010年在我国各地区的国内生产总值数据
-
时序的数据(time series data)
- 在不同时间上收集到的数据
- 描述现象随时间变化的情况
- 比如,2010年至2020年国内生产总值数据
统计数据的分类作用
- 区分数据类型是十分重要的
- 不同类型的统计数据适用的数据分析方法不同
5.理解统计学中的几个基本概念
1.3.1 总体和样本
- 总体(population)
- 所研究的全部个体(数据)的集合,其中每一个个体也称为元素
- 分为有限总体和无限总体
- 有限总体的范围能够明确确定,且元素的数目是有限的
- 无限总体所包括的元素是无限的,不可数的
- 样本(sample)
- 从总体中抽取的一部分元素的集合
- 构成样本的元素的数目称为样本容量或样本量
1.3.2 参数和统计量
- 参数(parameter)
- 描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值
- 所关心的参数主要有总体均值、标准差、总体比例等
- 总体参数通常用希腊字母表示
- 总体数据通常是不知道的,所以参数是一个未知的常数
- 统计量(statistic)
- 描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数
- 所关心的样本统计量有样本均值、样本标准差、样本比例等
- 样本统计量通常用小写英文字母来表示
- 样本是已经抽出来的,所以统计量是一个自变量为样本的函数
1.3.3 变量
- 说明现象某种特征的概念
- 如商品销售额、受教育程度、产品的质量等级等
- 变量的具体表现称为变量值,即数据
- 变量可以分为
- 分类变量(categorical variable)说明事物类别的名称
- 顺序变量(rank variable)说明事物有序类别的名称
- 数值型变量(metric variable)说明事物数字特征的名称
- 离散变量:取有限个值
- 连续变量:可以取无穷多个值
- 变量及其类型
- 基本分类
- 分类变量
- 顺序变量
- 数字变量
- 其他分类
- 随机变量/非随机变量
- 经验变量/理论变量
- 基本分类
本章小结
统计及其应用领域
统计数据的类型
统计中的几个基本概念
随堂练习
一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”,回答以下问题
1.这一研究的总体是什么?
网上购物的消费者或网上购物消费者的消费额
2.“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量,是离散型还是连续型?
分类变量,离散型
3.消费者每月在网上购物的平均花费是200元是参数还是统计量
统计量
4.研究者所使用的主要是描述统计方法还是推断
推断统计