zoukankan      html  css  js  c++  java
  • matplotlib可视化《1》绘图快速入门

    Matplotlib

    导入数据

    1 import matplotlib.pyplot as plt
    2 %matplotlib inline#不需写plot.show直接出图
    3 plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
    4 plt.rcParams['axes.unicode_minus'] = False#显示负号
    5 import pandas as pd
    6 import numpy as np
    7 from pandas import Series,DataFrame 
    8 test=pd.read_excel("/Users/yaozhilin/Downloads/exercise.xlsx",sep="t")
    9 test.head(5)#显示前五行

    •离散型数据的可视化

    ~饼图

    需求:计算“所需区域”每个地方的百分比-可视化

    1 fig= plt.figure(figsize=(6,6))#调整图的大小
    2 t=test["所属区域"].value_counts()
    3 plt.pie(list(map(lambda x:x/t.sum(),t)),labels=list(t.index),autopct='%.1f%%',explode = [0,0.1,0,0])

    注:labels为标签,autopct调数据显示,explode调突起部分

    ~条形图 

    x为分类变量y为连续变量

    1 tb=test.groupby(["所属区域"]).agg({"数量":np.mean,})
    2 plt.bar(tb.index,list(tb["数量"]))
    3 plt.xlabel("地区")
    4 plt.ylabel("销售量")
    5 plt.title("各地区年销售量")
    6 plt.grid(linestyle="-.", axis='y', alpha=0.4)#设置横向网格

    1 plt.barh(tb.index,list(tb["数量"]),color="red")2 plt.ylabel("地区")
    3 plt.xlabel("销售量")
    4 plt.title("各地区年销售量")

    •连续性数据的可视化

    ~箱型图

    单变量

    1 t=test['数量'].dropna()#切记要去除na
    2 plt.boxplot(t)

    由图可判断离群值

    ~直方图

    表示连续变量出现的频次

    a=np.random.randn(50)#随机正态分布的50个数
    plt.hist(a,bins=10)#bins表示切割多少分

    ~折线图 

    随时间变化的连续数据

    1 tt=test.groupby(test["订购日期"]).agg({"数量":np.sum})#先聚合
    2 tt

    1 plt.plot(tt.index,tt["数量"],"go--")

    
    

    关系型数据的可视化

    ~散点图

    1 X=np.random.rand(50)
    2 Y=np.random.rand(50)
    3 plt.scatter(X,Y,c=np.random.randint(6,8,size=50),s=np.random.randint(10,60,size=50))

  • 相关阅读:
    Supermap/Cesium 开发心得----获取三维视角的四至范围
    Supermap/Cesium 开发心得----定位
    GIS面试小知识点
    Oracle数据库小知识点整理
    利用 uDig 生成 GeoServer 可用的 SLD 渲染文件
    Geoserver设置style
    图片按宽高比1:1响应,窗口大小如何变化,图片宽高始终相等
    简单树
    递归渲染树
    div等高布局
  • 原文地址:https://www.cnblogs.com/ye20190812/p/13447028.html
Copyright © 2011-2022 走看看