zoukankan      html  css  js  c++  java
  • Seaborn相关

    Seaborn:基于Matplotlib,seaborn提供许多功能,比如:内置主题、颜色调色板、函数和提供可视化单变量、双变量、线性回归的工具。其能帮助我们构建复杂的可视化。

    ————————缩写定义————————

    import seaborn as sns

    ————————函数解析————————

    1、绘制一个单变量的观测分布:sns.distplot()

    (1)函数原型

    distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)

    这个函数结合了matplotlib的“hist”功能(自动计算一个好的默认bin大小)和seaborn:func:“kdeplot”和:func:“rugplot”函数。它也适合“scipy”。统计数据的分布,并根据数据绘制出估计的PDF(概率密度函数)。

    (2)参数解释

    a:series,1维数组或列表。观测数据。如果这是一个带有“name”属性的系列对象,那么该名称将被用来标记数据轴。

    bins:对应matplotlib hist()的参数,或None,可选。设置直方图参数。默认用Freedman-Diaconis法则。设置矩形条数目。

    hist:bool,可选。是否要绘制一个(normed)直方图。

    kde:bool,可选。是否绘制高斯核密度估计。

    rug:bool,可选。是否在支撑轴上显示观测的小细条(边际毛毯)。

    fit:随机变量对象,可选。一个带有“fit”方法的对象,返回一个可以被传递到“pdf”方法的元组,该方法是在一个值网格之后的位置参数,以对pdf进行评估。{hist, kde, rug, fit}_kws:字典,可选的关键字参数,用于潜在的绘图功能。

    color:matplotlib color, 可选。用于绘制所有除了拟合曲线。

    vertical:bool,可选。是否在y轴上显示观测值。

    norm_hist:bool,可选。如果为True,直方图高度显示的是密度而不是计数。这是暗示一个KDE或拟合密度被绘制。

    axlabel:字符串、False或None,可选。支持轴标签的名称。如果为None,就试着从a那里得到它,如果是False,则不设置标签。

    label:字符串,可选。图上相关成分的图例标签。

    ax:matplotlib axis, 可选。如果提供,在这个轴上绘图。

    (3)返回值

    ax:matplotlib Axes。返回坐标轴对象,并进行进一步调整。

    2、拟合和绘制单变量或双变量核密度估计:sns.kdeplot()

    (1)函数原型

    kdeplot(data, data2=None, shade=False, vertical=False, kernel='gau', bw='scott', gridsize=100, cut=3, clip=None, legend=True, cumulative=False, shade_lowest=True, cbar=False, cbar_ax=None, cbar_kws=None, ax=None, **kwargs)

    (2)参数解释

    data:1维array_like。输入数据

    data2:1维array_like,可选。第二个输入数据。如果存在,则估计一个双变量KDE。

    shade:bool,可选。如果True,显示在KDE曲线下的区域的阴影(或者当数据是双变量的时候用填充的轮廓线绘制)。

    vertical:bool,可选。如果True,在x轴上显示密度。

    kernel:{'gau' | 'cos' | 'biw' | 'epa' | 'tri' | 'triw' }, 可选。控制拟合的内核形状。双变量KDE只能使用高斯核'gau'。

    bw:{'scott' | 'silverman' | scalar | pair of scalars }, 可选。为双变量图的每个维度确定内核大小、标量系数或标量的引用方法的名称。

    gridsize:整型,可选。评价网格中离散点的个数。

    cut:标量,可选。从最极端的数据点上画出估算值来cut * bw。

    clip:pair of scalars(标量), or pair of pair of scalars, 可选。用于拟合KDE的数据点的下界和上界。可以为双变量图提供一对(低,高)边界。

    legend:bool,可选。如果可能的话,添加一个图例或者标记出坐标轴。

    cumulative:bool,可选。如果True,画出kde估计的累积分布。

    shade_lowest:bool,可选。如果True,则绘制双变量KDE图的最低轮廓。在绘制单变量图或当“shade=False”时不相关。当你想要在同一个坐标轴上有多个密度时,把这个设置为“False”可以很有用。

    cbar:bool,可选。如果True且为双变量KDE图,则添加一个colorbar。

    cbar_ax:matplotlib axes, 可选。在现有的坐标轴上画除colorbar,否则space is taken from the main axes.

    cbar_kws:字典,可选。对于fig.colorbar()的关键字参数。

    ax:matplotlib axes, 可选。用于绘制的坐标轴,否则使用当前坐标轴。

    kwargs:键值对。其他关键字参数用于传递给plt.plot()或plt.contour{f}(具体哪一个取决于单变量还是双变量KDE)

    (3)返回值

    ax:matplotlib Axes。

  • 相关阅读:
    Dockerfile
    走进Docker
    liunx 设置定时任务
    《程序员自我修养》读书笔记
    Ubuntu换源
    liunx安装python2.7.12
    预习非数值数据的编码方式
    预习原码补码
    第三章预习
    预习非数值数据的编码方式
  • 原文地址:https://www.cnblogs.com/ivan-count/p/8647063.html
Copyright © 2011-2022 走看看