zoukankan      html  css  js  c++  java
  • 人工智能-画图形(扩展)

    Matplotlib:其能够支持所有的2D作图和部分3D作图。能通过交互环境做出印刷质量的图像。

    Seaborn:基于Matplotlib,seaborn提供许多功能,比如:内置主题、颜色调色板、函数和提供可视化单变量、双变量、线性回归的工具。其能帮助我们构建复杂的可视化。

    小提琴图

     

            小提琴图 (Violin Plot) 用于显示数据分布及其概率密度。

            这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中位数。

     

    # 导包
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns

    if __name__ == "__main__":
      # 读取数据
      df = pd.read_excel('test.xlsx','sheet1')
      print(df)
     
     
      # 绘制小提琴图
      sns.violinplot(df['Age'],df['Sales'])
      
      # 初始化数据
      sns.despine()
      
      # 绘制
      plt.show()
     
     
     
     
     
     
     
    堆积柱形图
     
     
     
     
     
     
     
     
     
     
    # 导包
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns

    if __name__ == "__main__":
    # 读取数据
      df = pd.read_excel('test.xlsx','sheet1')
      print(df)

      # 根据性别体重分组求男女体重比例
      # 生命绘图对象
      myexcel = df.groupby(['BMI','Gender']).Sales.sum()
      # 绘制柱状图
      myexcel.unstack().plot(
        kind= 'bar',
        stacked=True,
        color=['red','blue']
      )
      # 绘制
      plt.show()
     
     

     

    箱线图
     
     
    箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
     
    用 作:   显示一组数据分散情况资料
    # 导包
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns

    if __name__ == "__main__":
      # 读取数据
      df = pd.read_excel('test.xlsx','sheet1')
      print(df)


      # 箱线图
      sns.boxplot(df['Age'])
      # 初始化数据
      sns.despine()
      plt.show()
     
     
     
     

     直方图

     
    直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。
    直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)首先引入。它是一种条形图。 为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。 间隔必须相邻,并且通常是(但不是必须的)相等的大小。
    直方图也可以被归一化以显示“相对”频率。 然后,它显示了属于几个类别中的每个案例的比例,其高度等于1。
     
     
     
    直方图的常见作用有以下三点:
    (1)显示质量波动的状态;
    (2)较直观地传递有关过程质量状况的信息;
    (3)通过研究质量波动状况之后,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。
     
     
    # 导包
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns

    if __name__ == "__main__":
      # 读取数据
      df = pd.read_excel('test.xlsx','sheet1')
      print(df)


      # 直方图
      fig = plt.figure()
      ax = fig.add_subplot(111)
      ax.hist(df['Age'], bins=7)
      plt.title('Age distribution')
      plt.xlabel('Age')
      plt.ylabel('Employee')
      
      plt.show()
     
    气泡图
     
    气泡图(bubble chart)是可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,而第三个变量则用气泡的大小来表示。排列在工作表的列中的数据(第一列中列出 x 值,在相邻列中列出相应的 y 值和气泡大小的值)可以绘制在气泡图中。气泡图与散点图相似,不同之处在于:气泡图允许在图表中额外加入一个表示大小的变量进行对比。 

     

     
    # 导包
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns

    if __name__ == "__main__":
      # 读取数据
      df = pd.read_excel('test.xlsx','sheet1')
      print(df)


      
      fig = plt.figure()
      ax = fig.add_subplot(111)
      ax.scatter(df['Age'], df['Sales'], s=df['Income']) # 第三个变量表明根据收入气泡的大小
      plt.show()

     

  • 相关阅读:
    重读数据结构——严蔚敏C语言版
    Tcp/Ip网络通讯初探
    XMLHttpRequest post 传递多个参数及服务器端读取
    HDOJ 1106 排序 (字符串处理)
    用Java创建数组工具类ArrayTool
    自己动手编写一个VS插件(三)——创建工具栏之一
    「译」JavaScript 的怪癖 1:隐式类型转换
    javascript 中强制执行 toString()
    VS 2008的64位编译环境的安装和使用
    计算机神书『编码:隐匿在计算机软硬件背后的语言』
  • 原文地址:https://www.cnblogs.com/chengdongzi/p/10497035.html
Copyright © 2011-2022 走看看