zoukankan      html  css  js  c++  java
  • python实现读取类别频数数据画水平条形图

    1、数据分组-->频数分布表

    环境配置:

    1 import pandas as pd
    2 import numpy as np
    3 import matplotlib.pyplot as plt

    按照你设定合适的间隔,把数据分为各个范围的组,然后统计出在这个范围内的频数有多少,我没有找到合适的函数,我就自己写了一个函数,类似直方图的工作,这是画水平条形图的数据准备。至于为什么要画水平条形图,当类别太多,使用水平条形图比较简洁,个人看法。下面给出代码,就不解释代码含义了。

     1 def data_count(dataa, r1, r2, step):
     2     r = pd.DataFrame(np.random.randn(1, 2))
     3     r.drop(0, inplace=True)
     4     while r1+step <= r2:
     5         num = 0
     6         for j in range(len(dataa)):
     7             if dataa[j] >= r1 and dataa[j] < r1+step:
     8                 num = num + 1
     9         f = "%s~%d" % (r1, r1+step)
    10         # r = r.append([[int(r1), num], ]) # 使用单数表示
    11         r = r.append([[f, num], ])  # 使用范围表示
    12         r1 = r1 + step
    13     return r

     要注意的数据范围只包含上界不含下界,数据公式这样子${ ext{1}} leqslant data < 5$,只含上界,这样就可以做出不重不漏。

    2、频数计算

    这是运用data_count函数(上面代码)进行频数计算的演示,首先看一下原数据长什么样,暂时麻烦就不公布了,你们自己按照自己的数据决定。

    原数据

    测试data_count函数代码:

    1 data_gap1 = data_count(g11[:], 1, 51, 1)
    2 data_gap2 = data_count(g22[:], 1, 51, 1)

    很简单啦,就是函数的调用,你们都会的,给大家看一下输出结果,如下图:

    输出结果

    感觉相当完美,函数也很万能,只要输入最小值最大值和间隔,就能出频数分布表

    3、水平条形图

    def plot_bar(plot_data, title):
        plt.figure(figsize=(10, 15))
        y = plot_data.iloc[:, 1].values
        tt = list(range(len(y)))
        index = plot_data.iloc[:, 0].values
        plt.bar(left=0, bottom=list(range(len(y))), width=y, color='blue', height=0.5,
                orientation='horizontal')  # 水平对应bottom&width, height表示bar的宽度
        plt.yticks(tt, index)
        plt.ylabel('数据范围')
        plt.xlabel('频数')
        plt.title(title)
        plt.show()

    上面中plt.bar(left=0, bottom=list(range(len(y))), width=y, color='blue', height=0.5,orientation='horizontal')这句代码是最重要的,其中left表示直方图的开始的位置(也就是最左边的地方),height是指直方图的高度,当直方图太粗时,可以通过width来定义直方图的宽度,注意多个直方图要用元组,yerr这个参数是防止直方图触顶。orientation='horizontal'指得水平条形图,使用barh方法可以省略这个参数得设定。

    有个坑,如果直接用bottom=类别数据,文本格式的类别会乱序,需要像我那样先指定位置,在指定类别,如plt.yticks(tt, index)所作的工作。

    水平条形图

  • 相关阅读:
    STM32 + RT Thread OS 学习笔记[四]
    Python学习入门基础教程(learning Python)--5.3 Python写文件基础
    Android Dialog
    poj 2513 连接火柴 字典树+欧拉通路 好题
    Ubuntu 问题解决汇总
    [置顶] 问题解决——产生未引用参数的警告
    BZOJ 1367([Baltic2004]sequence-左偏树+中位数贪心)
    【Cocos2d-X开发学习笔记】第01期:PC开发环境的详细搭建
    在navigationItem中添加搜索栏
    Loading half a billion rows into MySQL---转载
  • 原文地址:https://www.cnblogs.com/Yuanjing-Liu/p/9341843.html
Copyright © 2011-2022 走看看