zoukankan      html  css  js  c++  java
  • 认识数据-数据的计量尺度(Levels of Measurement)

    一、 数据的计量尺度(Levels of Measurement)

          一般认为,数据是对客观现象计量的结果。按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级分为四个层次:

    1、定类尺度(Nominal Level /列名尺度):按照事物的某种属性对其进行平行的分类或分组。例:人口的性别(男、女);企业的所有制性质(国有、集体、私营等)

    • n  计量层次最低
    • n  对事物进行平行的分类
    • n  各类别可以指定数字代码表示
    • 具有=或¹的数学特性
    • n  数据表现为“类别”
      1. 定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,顺序可以任意改变。
      2. 对定类尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数 (frequency)。
      3. 对事物进行分类时,必须符合穷尽(exhaustive)和互斥(mutually exclusive)要求。

     2、定序尺度(Ordinal Level顺序尺度):是对事物之间等级或顺序差别的一种测度。例:产品等级(一等品、二等品…);考试成绩(优、良、中、可、差)

    • n  对事物分类的同时给出各类别的顺序
    • n  比定类尺度精确
    • n  不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序)
    • n  数据表现为“类别”,但有序
      1. 无法测出类别之间的准确差值
      2. 该尺度的计量结果只能排序,不能进行算术运算。
      3. 具有>或<的数学特性

     3、定距尺度(Interval Level/间隔尺度):是对事物类别或次序之间间距的测度。例:100分制考试成绩;摄氏温度对不同地区温度的测量

    • n  不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少
    • n  比定序尺度精确
    • n  定距尺度通常以自然或物理单位为计量尺度,因此数据表现为“数值”
    • 没有绝对零点;“0”是测量尺度上的一个测量点,并不代表“没有”
    • 计量结果可以进行加减运算,具有 + 或 - 的数学特性

     4、定比尺度(Ratio Level/比率尺度):是能够测算两个测度值之间比值的一种计量尺度。例:职工月收入;企业产值;公制的距离、重量

    • n  与定距尺度属于同一层次,计量结果也表现为数值;
    • n  除了具有其他三种计量尺度的全部特点外,还具有可计算两个测度值之间比值的特点;
    • n  “0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算(而定距尺度只可进行加减运算)

    高层次的计量尺度具有低层次计量尺度的全部特性,但反之不行
    可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来

    二、数据分布的特征描述手段:集中趋势(位置)、离中趋势(分散程度)

    1、对于集中趋势的测度:

    • 定类数据:众数
    • 定序数据:中位数和四分位数
    • 定距和定比数据:平均数(均值)
    • 众数、中位数和均值的比较

    定义:集中趋势 (Central tendency)

    • 一组数据向其中心值靠拢的倾向和程度
    • 测度集中趋势就是寻找数据一般水平的代表值或中心值
    • 不同类型的数据用不同的集中趋势测度值
    • 低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据
    • 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定

    2、离中趋势

    • 离中趋势的各测度值是对数据离散程度所作的描述
    • 反映各变量值远离其中心值的程度,因此也称为离中趋势
    • 从另一个侧面说明了集中趋势测度值的代表程度
    • 不同类型的数据有不同的离散程度测度值

    3、定类数据的整理与显示


    基本过程:

    • 列出各类别
    • 计算各类别的频数
    • 制作频数分布表
    • 用图形显示数据


    主要指标:

      • 频数:落在各类别中的数据个数
      • 比例:某一类别数据占全部数据的比值
      • 比率:不同类别数值的比值
      • 百分比:将对比的基数作为100而计算的比值
  • 相关阅读:
    spoj 694 求一个字符串中不同子串的个数
    Qt for Android 开发大坑
    HDUOJ A Mathematical Curiosity 1017
    Node.js开发入门—HelloWorld再分析
    GTK入门学习:布局容器之固定布局
    彻底领悟javascript中的exec与match方法
    JQuery中attr属性和jQuery.data()学习笔记
    正则表达式-验证带千分号的,带任意位小数的数字类型
    JQuery EasyUI 动态改变表单项的验证守则
    JavaScript计算两个日期的时间差
  • 原文地址:https://www.cnblogs.com/liangqihui/p/8442477.html
Copyright © 2011-2022 走看看