zoukankan      html  css  js  c++  java
  • 使用matplotlib 制图(柱状图、箱型图)

    柱状图:

    import pandas as pd
    import matplotlib.pyplot as plt
    data = pd.read_csv('D:\myfiles\study\python\analyse\数据团\城市数据团_数据分析师_体验课_课程资料\数据资料\地市级党委书记数据库(2000-10).csv', encoding='gbk')
    
    # 按省份分析市委书记女性比例
    # 新建变量data_gender2,字段包括省份、性别
    # 去除缺失值
    data_gender2 = data[['省级政区名称','性别']]
    data_gender2_re = data_gender2[data_gender2['性别'].notnull()]
    # 按照省份统计出男女人数
    # crosstab(行,列)用于针对字符串数据的透视(类似excel的数据透视)
    pt = pd.crosstab(data_gender2_re['省级政区名称'], data_gender2_re['性别'])
    # 计算出女性占比
    # 这里直接在pt数据中添加了一个新的字段“女性占比”
    # sort_values()排序,ascending = False表示降序
    pt['女性占比'] =  pt['女'] / (pt['女'] + pt['男'])
    pt2 = pt.sort_values(by=['女性占比'], ascending=False)
    # 创建一个图表,大小为8*4
    fig_q1_1 = plt.figure(figsize=(10, 5))
    
    index = pt2.index[:10]  # 取前十个
    plt.bar(range(10),  # 横坐标
            pt2['女性占比'][:10],  # 纵坐标
            tick_label=index,  # 横轴标签
            color='blue')  # 颜色
    plt.title('不同省份女性市委书记占比')
    plt.xlabel('省份')
    plt.ylabel('女性占比')
    plt.show()
    

      

    箱型图:

    import pandas as pd
    import matplotlib.pyplot as plt
    data = pd.read_csv('D:\myfiles\study\python\analyse\数据团\城市数据团_数据分析师_体验课_课程资料\数据资料\地市级党委书记数据库(2000-10).csv', encoding='gbk')
    
    
    # 绘制图表2:女性市委书记占比结构
    # 创建一个图表,大小为6*6
    fig_q1_2 = plt.figure(figsize=(6, 6))
    # 创建箱形图:四分位数,上下边缘值(非最大最小值),异常值
    plt.boxplot(pt2['女性占比'],  # 值
                vert=True,  # true:纵向,false:横向
                showmeans=True)  # 显示均值
    # 参数添加
    plt.title('女性市委书记占比结构')
    plt.xticks([])
    plt.ylabel('女性占比')
    plt.show()
    

      

  • 相关阅读:
    Python—设计模式
    Python—操作系统和多线程
    thin mission 2021 11 3
    搜索
    c++ 调试
    Lecture--words families
    高数--积分
    thin mission 2021.11.2
    tiny mission 2021.11.1
    zlib使用心得
  • 原文地址:https://www.cnblogs.com/wumingxiaoyao/p/8582993.html
Copyright © 2011-2022 走看看