zoukankan      html  css  js  c++  java
  • 统计数据的类型的划分

    1.与数据相关的几个基本概念:
         个体:收集数据时所依据的对象。【数据库中的关键字】
        变量:对个体所感兴趣的特征。【属性】
        观察值:对某个体收集到的测量值的全体。【测量值表全体】
                       观察值是对数据集中每个个体的各个方面进行测量所得的集合。因此它的个数总是等于个体的数量,每个个体的测量值个数等于变量的个数。数据总数=个体数*变量数。
     
    2.对数据的测量尺度:
        名义尺度:用于确认个体属性的标签或者名称。
        顺序尺度:数据以名义数据显示,但数据顺序或等级之间的差异有意义。【如对于服务质量测量:优秀、良好、较差;对酒店的1-5星级的划分;班级中上成绩排名】
        区间尺度:数据具有顺序数据所有的特征,并以相同的刻度或单位表示数值间的间隔。它总是数值型数据。【如学生的语文成绩分数】
        比率尺度:数据数据具有区间数据所有特性,且两个数据的比值是有意义的,其测量尺度为比率尺度。
     
    3.统计数据类型
        在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量。
    1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。【例如, ”性别“,”男“编码为1,”女“编码为2。 】
    2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。【例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。 】
    3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。统计中经常需要这种数据来时行分析。【例如,温度。】
    4.定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点。【例如职工人数,身高。】
     
     
        一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。不同测度级别的数据,应用范围不同。等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功能。
     
        中国统计网中有一博文提到了如下分类:
    1.按计量尺度分类
     
    分类数据:只能归于某一类别的非数字型数据。【根据特征划成类。可以使用名义尺度或者顺序尺度】——分类变量
    顺序数据:只能归于某一有序类别的非数字型数据。 
                    【百度百科:用来表示顺序、等级的数据。如一等品、二等品;优、良、差;小学、初中、高中、大学;等等。对这类数据,要反映平均水平,只能用中位数。(显然众数也可以)
    数值型数据:按数字尺度测量的观察值。——数据变量
                     数值型数据可能是离散的也可能是连续的。如泊松分布描述的数据是离散的,正态分布等描述的数据是连续的。
     
    2.按收集方法分类
     
    观测数据:通过调查和观测而收集到的数据。 
    实验数据:在实验中控制实验对象而收集到的数据。
     
    3.按时间状况分类
     
    截面数据:在相同或近似相同时间点上收集的数据。 
    时间序列数据:在不同时间上收集到一段时间内的数据。
     
     
  • 相关阅读:
    搭建中文分词工具——递归方法
    (五)django上传文件并读取相应数据存入数据库
    (四)django上传文件并读取存入数据库
    Django中的外键赋值
    (二)Django连接本地mysql异常
    (一)环境搭建——Django
    论文阅读笔记:《Interconnected Question Generation with Coreference Alignment and Conversion Flow Modeling》
    AWS EC2 CentOS release 6.5 部署redis
    2016年简直一晃而过
    Android开发学习之路--性能优化之布局优化
  • 原文地址:https://www.cnblogs.com/ysdx2013/p/4769925.html
Copyright © 2011-2022 走看看