zoukankan      html  css  js  c++  java
  • 用seborn的函数distplot(), jointplot(), pairplt()对数据的单变量分析绘图

    1.用seaborn的distplot()函数绘制直方图。参数kde = True时会把分布曲线也画出来。

    如下代码所示是绘制标准正态分布的分布图

    1 import seaborn as sns
    2 import numpy as np
    3 import matplotlib as mpl
    4 import matplotlib.pyplot as plt
    5 
    6 
    7 x = np.random.normal(size=1000)
    8 sns.distplot(x)
    9 plt.show()

    2.对于两组变量关系,可以用散点图画出他们的分布。函数是jointplot()。

    如下代码是绘出二维正态分布的散点图

     1 import seaborn as sns
     2 import numpy as np
     3 import pandas as pd
     4 import matplotlib as mpl
     5 import matplotlib.pyplot as plt
     6 
     7 
     8 data = np.random.multivariate_normal(mean=[0, 0], cov=[[1, 0], [0, 1]], size=1000)  #1000组标准二维正态分布
     9 df = pd.DataFrame(data=data, columns=["x", "y"])
    10 sns.jointplot(x="x", y="y", kind="hex", data=df)
    11 plt.show()

      data是一个长度为1000的ndarray类型,每个元素又是一个二维向量,分别是二维正态分布的两个随机变量的样本值。所以可以当成是1000*2的矩阵

      利用DataFrame函数将ndarray变成DataFrame结构,然后利用jointplot()画出散点图。其中如果kind=“scatter”则是普通散点图,这里为了避免样本太多,普通的散点图可能连成一片看不出分布差异,

    用kind=“hex"来画,运行结果如下

     3.最强大的函数应该是pairplot函数,它能对DataFram的属性两两配对绘制散点图,并且对某一属性绘制直方图

    如下代码所示,iris是seaborn内置数据集

    1 import seaborn as sns
    2 import numpy as np
    3 import pandas as pd
    4 import matplotlib as mpl
    5 import matplotlib.pyplot as plt
    6 
    7 iris = sns.load_dataset("iris")   #seaborn内置数据集,DaraFram类型
    8 sns.pairplot(iris, kind="hex")
    9 plt.show()

    运行结果如下

  • 相关阅读:
    音标,口型,舌位对照表:适合已有一定英语基础的人重新回顾音标发音,在不断的练习中让自己的发音更准确,口型更标准。
    c++友元函数和友元类
    经典MFC界面和Ribbon界面框架对比(单文档为例)
    QEM三维模型简化算法
    VC6和VS2008中C++编译器差异
    VS操作技巧
    msvcrt.lib和LIBCD.lib链接冲突
    二叉树遍历算法
    IE/QQ使用代理上网
    Google Map街景(红蓝立体)
  • 原文地址:https://www.cnblogs.com/loubin/p/11267177.html
Copyright © 2011-2022 走看看