zoukankan      html  css  js  c++  java
  • matplotlib可视化《1》绘图快速入门

    Matplotlib

    导入数据

    1 import matplotlib.pyplot as plt
    2 %matplotlib inline#不需写plot.show直接出图
    3 plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
    4 plt.rcParams['axes.unicode_minus'] = False#显示负号
    5 import pandas as pd
    6 import numpy as np
    7 from pandas import Series,DataFrame 
    8 test=pd.read_excel("/Users/yaozhilin/Downloads/exercise.xlsx",sep="t")
    9 test.head(5)#显示前五行

    •离散型数据的可视化

    ~饼图

    需求:计算“所需区域”每个地方的百分比-可视化

    1 fig= plt.figure(figsize=(6,6))#调整图的大小
    2 t=test["所属区域"].value_counts()
    3 plt.pie(list(map(lambda x:x/t.sum(),t)),labels=list(t.index),autopct='%.1f%%',explode = [0,0.1,0,0])

    注:labels为标签,autopct调数据显示,explode调突起部分

    ~条形图 

    x为分类变量y为连续变量

    1 tb=test.groupby(["所属区域"]).agg({"数量":np.mean,})
    2 plt.bar(tb.index,list(tb["数量"]))
    3 plt.xlabel("地区")
    4 plt.ylabel("销售量")
    5 plt.title("各地区年销售量")
    6 plt.grid(linestyle="-.", axis='y', alpha=0.4)#设置横向网格

    1 plt.barh(tb.index,list(tb["数量"]),color="red")2 plt.ylabel("地区")
    3 plt.xlabel("销售量")
    4 plt.title("各地区年销售量")

    •连续性数据的可视化

    ~箱型图

    单变量

    1 t=test['数量'].dropna()#切记要去除na
    2 plt.boxplot(t)

    由图可判断离群值

    ~直方图

    表示连续变量出现的频次

    a=np.random.randn(50)#随机正态分布的50个数
    plt.hist(a,bins=10)#bins表示切割多少分

    ~折线图 

    随时间变化的连续数据

    1 tt=test.groupby(test["订购日期"]).agg({"数量":np.sum})#先聚合
    2 tt

    1 plt.plot(tt.index,tt["数量"],"go--")

    
    

    关系型数据的可视化

    ~散点图

    1 X=np.random.rand(50)
    2 Y=np.random.rand(50)
    3 plt.scatter(X,Y,c=np.random.randint(6,8,size=50),s=np.random.randint(10,60,size=50))

  • 相关阅读:
    如何获得RVA(相对虚地址)的值,从而得到一个程序的入口点
    Prism 问题总结一: 在模块中引用公用程序集出错
    Dapper 操作 ACCESS 数据库问题总结
    我国土地招拍挂制度
    [导入]棋味
    [导入]无语
    [导入]心灯
    [导入]寄托
    [导入]视频资源
    [导入]asp.net实现视频截图
  • 原文地址:https://www.cnblogs.com/ye20190812/p/13447028.html
Copyright © 2011-2022 走看看