zoukankan      html  css  js  c++  java
  • 频率分布直方图

    前言

    制作步骤

    如何制作;

    频率分布直方图的特点

    ①直方图中相邻两横坐标之差表示组距,纵轴表示(cfrac{频率}{组距})(频率=cfrac{频率}{组距} imes 组距)

    ②频率分布直方图中各小长方形的面积(频率)之和为(1),各小长方形高之比也就是频率比。

    ③频率分布表和频率分布直方图是一组数据频率分别的两种形式,前者准确,后者直观。

    平均数、众数与中位数从不同的角度描述了一组数据的集中趋势;平均数是从平均水平的角度刻画集中趋势;众数是从相同数据出现的次数多少刻画集中趋势;中位数是从数据从小到大的顺序出现的位置刻画集中趋势;

    方差与标准差描述其波动大小,单位有区别;

    使用角度

    从形的角度

    从数的角度

    频率分布直方图中的数字特征的计算

    当一组数据经过加工整理成频率分布直方图后,数据信息会有所损失,所以计算数据的数字特征有一定的难度。

    ①众数:直方图中最高矩形的中点横坐标;

    ②中位数:频率分布直方图频率和(面积和)的一半处所对应的横坐标,即面积等分线所对应的横坐标;

    ③平均数:每个矩形的分组的中点值乘以每个对应矩形的面积再求和;

    ④方差:每个矩形的分组的中点值与平均值的差的平方与频率乘积,再求和;

    ⑤标准差:方差的算术平方根;

    例2【2017高考真题卷Ⅱ文科19题改编】【题文】如图所示,求该频率分布直方图的众数、中位数、平均数、方差。

    考点:频率分布直方图,众数、中位数、平均数、方差

    分析:以上图为例,

    • 求众数:

    “旧养殖法”的众数为(47.5);“新养殖法”的众数为(52.5)

    • 求中位数:

    “旧养殖法”的中位数先判断其大概位置,由于(25-50)之间的面积和为(0.62),25-45之间的面积和为(0.42)

    故中位数一定位于(45-50)之间,设中位数为(x),则(0.42+(x-45) imes0.04=0.50),求得(x=47),即中位数为(47)

    • 求平均数:比如“旧养殖法”的平均数的计算

    (ar{x}=27.5 imes5 imes0.012+32.5 imes5 imes0.014+37.5 imes5 imes0.024)

    (+42.5 imes5 imes0.034+47.5 imes5 imes0.040+52.5 imes5 imes0.032)

    (+57.5 imes5 imes0.020+62.5 imes5 imes0.012+67.5 imes5 imes0.012)

    (=47.1)

    “新养殖法”的平均数的计算

    (ar{y}=37.5 imes5 imes0.004+42.5 imes5 imes0.020+47.5 imes5 imes0.044)

    (+52.5 imes5 imes0.068+57.5 imes5 imes0.046)

    (+62.5 imes5 imes0.010+67.5 imes5 imes0.008)

    (=52.35)

    求方差:比如“新养殖法”的方差计算

    (S^2=(37.5-52.35)^2 imes 0.004 imes 5+(42.5-52.35)^2 imes 0.020 imes 5+(47.5-52.35)^2 imes 0.044 imes 5)

    (+(52.5-52.35)^2 imes 0.068 imes 5+(57.5-52.35)^2 imes 0.046 imes 5)

    (+(62.5-52.35)^2 imes 0.010 imes 5+(67.5-52.35)^2 imes 0.008 imes 5)

    (=?)

    例1【2017全国卷2文科19题理科18题高考真题】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:

    (1)记(A)表示事件“旧养殖法的箱产量低于50kg”,估计(A)的概率;

    分析:本题实质是考查用频率估计概率,所以要会根据频率分布直方图计算频率。

    由于“旧养殖法的箱产量低于50kg”的频率为((0.012+0.014+0.024+0.034+0.040) imes 5=0.62)

    故所求概率(P(A)=0.62)

    同理得到“新养殖法的箱产量低于50kg”的频率为((0.004+0.020+0.044) imes 5=0.34)

    (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关,参考数据表格如下:
    (egin{array}{c|lcr} P(chi^2ge k_0) & 0.050 &0.010 &0.001 \ hline k_0 & 3.841 & 6.635 & 10.828 end{array})

    分析:由上问可知,“旧养殖法的箱产量低于50kg”的频数为(100 imes 0.62=62)

    则“旧养殖法的箱产量不低于(50kg)”的频数为(100-62=38)

    “新养殖法的箱产量低于(50kg)”的频数为(100 imes 0.34=34)

    则“新养殖法的箱产量不低于(50kg)”的频数为(100-34=66),由此得到二列联表如下:

    箱产量<(50kg) 箱产量(ge 50kg) 总计
    旧养殖法 (62(a)) (38(b)) (100(a+b))
    新养殖法 (34(c)) (66(d)) (100(c+d))
    总计 (96(a+c)) (104(b+d)) (200(a+b+c+d))

    由上表计算得到(chi^2=cfrac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)})

    (=cfrac{200(62 imes 66-38 imes 34)^2}{(62+38)(34+66)(62+34)(38+66)}=15.705>6.635)

    故有99%以上的把握认为,二者有关联。

    (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较。

    分析:本题目的难点有:到底从哪些角度进行比较?每一个角度下的数值的计算方法。

    数据的极差:旧,(25-70);新,(35-70),极差反映了数据的取值范围和数据的几种程度,当然误差是有的;

    数据的众数:旧,(47.5);新,(52.5),众数反映了出现次数最多,

    数据的平均数:旧,(47.1);新,(52.35),平均数反映了一组数据的平均水平,

    数据的方差(标准差):比较精确的反映了数据的分散和集中程度,将这种程度数量化了。

    本题目从运算量和问题出发,可以从数据的范围和数据的中位数(或均值)两个角度作答。

    “旧养殖法”的数据分布在(25-70)之间,“新养殖法”的数据分布在(35-70)之间,

    故从数据范围来看,新养殖法的数据更集中,优于旧养殖法;

    “旧养殖法”的平均数(中位数)分布在(40-45)之间,“新养殖法”的平均数(中位数)分布在(50-55)之间,

    从平均数(中位数)角度来看,新养殖法也优于旧养殖法。

    关联实际

    • 问选手水平高低,需要比较平均数;

    • 问选手发挥如何,需要比较方差,

    • 给定一个考试成绩,问此人考的怎么样? 可以将该成绩与样本的中位数比较,也可以将该成绩与样本平均数比较;

  • 相关阅读:
    【python】利用python+tkinter做一个简单的智能电视遥控器
    【selenium】自动化测试中,元素无法点击定位等问题的解决:js的使用方法
    《Selenium 2自动化测试实战 基于Python语言》中发送最新邮件无内容问题的解决方法
    单线程代码事例
    死锁的实例
    大公司的Java面试题集
    xml文件有误
    android开发艺术探索
    Java 获取APK安装程序的包名
    内部类中class声明地方不同,效果不一样
  • 原文地址:https://www.cnblogs.com/wanghai0666/p/12659212.html
Copyright © 2011-2022 走看看