zoukankan      html  css  js  c++  java
  • 行为统计学第二章知识总结(未完)

    如何将数据组织成某些可理解的形式,使得他可以比较容易地发现数据的趋势,并与其他人交流,这就是描述性统计的任务:简化结构并整理组织数据。整理一组数据的最常用过程是将数据放入一个频数分布

    频数分布是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。

    频数分布的结构可以是表或涂,但是,在这两种情况下分布都具有两个相同的元素:

    1、组成最初测量量表的类别。

    2、频数的记录或每个类别中的个体数目。

    比例与百分率

    除了频数粉笔中的两个基本列外,表中还可以加入其它描述数据分布的测量。最常用的两种测量为比例与百分比。

    比例=P=f/N

    由于比例描述了频数(f)与数据数目(N)和之间的关系,因此它也被成为相对频数。

    分组频数分布表

      当一个数据组涵盖了较大范围的值时,在频数分布表中列出所有数据就不合理了。例如一组考试分数的范围由最低分X=41至最高分X=96。这些数据涵盖的范围超过了50.如果我们由X=96至X=41列出所有数据,这个频数表将具有56行。虽然也可以组织并简化数据,这个表还是会变的冗长麻烦。这个情况下,我们可以将数据分成区间组,然后将区间列在表中代替每个数据。数据组而非个体值,这些组或区间,被称为组距

    规则一:

      分组频数分布表应该具有大约10个组距。具有太少或太多区间,这个表都不能提供清晰的画面。需要注意的是,10个区间是一个通常的指导方针。

    规则二:

      每个区间的宽度应为相对简单的数据。

    规则三:

      每个组距的最小数值应为宽度的倍数。

    规则四:

      所有区间应具有相同宽度。他们应该无间断无重复地涵盖所有数值,使得任意特定数值都恰好只属于一个区间。

    实限与频数分布

      实限的概念也可以用于一个分组频数分布表的组距中。例如:一个40到40的组距由X=40至X=49的数值组成,这些值被称为区间的表面界限。因此看起来它们组成了这个组距的上限和下限,但是,X=40事实上是一个从39.5至40.5的区间。因此这个区间的实限为39.5至40.5的区间。

    等距或等比数据的频数分布图

      直方图:首先将数字(测量类别)沿X轴列出,然后画出位于每个X值上的一个矩形。使得,a.矩形的高度对应每个类别的频数;b.矩形的宽度为每个类别的实限。

    折线图:首先将数字(测量类别)沿X轴列出,然后,a.每个坐标的中心上方有一个点,它的垂直位置对应着这一类别的频数;b.点和点之间的连续线段将这一系列点连接在一起。C.最后,在分数全距的两端各画一条线与X轴相交。

    总体分布的频数分布图

      当你得到一个总体中每个分数的确切频数时,就可以构建与样本的频数分布图相同的直方图、折线图或者柱形图。例如,如果总体为N=50为特定组,我们可以确定这组人中有多少人的IQ为110.然而,如果我们对整个国际的成年人感兴趣,那么就不能得到IQ为110的确切人数。虽然我们仍然可以构建极大总数的频数分布图,但这样的图通常有两个特点:相对频数和平滑曲线

    相对频数:虽然通常我们不能得出总体中的每个分数的具体频数,但是,通常可以得出相对频数。比如:不知道湖中确切有多少条鱼,但是,在多年捕鱼的经验下,可以知道太阳鱼的数目恰好是鲤鱼的两倍。(下图并没有显示鱼的绝对数目,而是太阳鱼与鲤鱼的相对数目)

    平滑曲线:当一个总体由等比量表的数字构成时,习惯上用平滑曲线代替直方图或折线图中的阶梯状或锯齿状。一个常见的总体分布为正态曲线。

  • 相关阅读:
    MySQL_update同一张表
    MySQL_前缀索引_建立
    oracle_partition sample_simple
    oracle_partition sample
    java_java 利用JAX-RS快速开发RESTful 服务
    Java_Spring MVC_Servlet
    匿名函数
    randrange()和random() 函数
    迭代器 生成器 面向过程编程
    enumerate 模块
  • 原文地址:https://www.cnblogs.com/yangsy0915/p/5476206.html
Copyright © 2011-2022 走看看