zoukankan      html  css  js  c++  java
  • matplotlib 知识点13:绘制散点图(scatter函数精讲)

      散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。

      用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

      散点图通常用于显示和比较数值,例如科学数据、统计数据和工程数据。


     

    初认识:使用numpy包的random函数随机生成100组数据,然后通过scatter函数绘制散点图。  

    #!/usr/bin/env python
    #!-*-coding:utf-8 -*-
    #!@Author : Biyoulin
    #!@Time   : 2018/9/2 14:40
    
    import matplotlib.pyplot as plt
    import numpy as np
    
    plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
    plt.rcParams['axes.unicode_minus']=False   #用来正常显示负号
    
    N = 100
    x = np.random.randn(N)
    y = np.random.randn(N)
    plt.scatter(x,y)
    
    plt.title("散点图示例01") #显示图表名称
    plt.xlabel("x轴")    #x轴名称
    plt.ylabel("y轴")    #y轴名称
    plt.text(+1.2,-3,"By:biyoulin",fontsize=16,color="purple")
    
    plt.show()



    scatter函数格式:

    scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None,
                vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None,
                hold=None, data=None, **kwargs):

    scatter函数参数详解,英文原版请参见:matplotlib官网scatter函数

    x,y:形如shape(n,)的数组,可选值,
    s:  点的大小(也就是面积)默认20
    c:  点的颜色或颜色序列,默认蓝色。其它如c = 'r' (red); c = 'g' (green); c = 'k' (black) ; c = 'y'(yellow)
    marker:标记样式,可选值,默认是圆点;
    cmap: colormap用于表示从第一个点开始到最后一个点之间颜色渐进变化;
    norm: normalize,
    vmin:
    vmax:
    alpha: 设置标记的颜色透明度,可以理解为颜色属性之一
    linewidths: 设置标记边框的宽度值
    verts:
    edgecolors: 设置标记边框的颜色
    hold:
    data:
    **kwargs:
     


    scatter()函数各参数示例:

    1、x,y:横纵坐标,数据坐标(data position)

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5)
    plt.show() 

    2、marker : 图标,默认的是“.”,也可以是其它形状,想了解更多的,请参见:matplotlib 学习笔记02:marker标记详解。下面例子将marker设置成了“d”(diamond形状): 

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,marker='d')
    plt.show()

    也可以是文字:

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,marker='$biyoulin$')
    plt.show() 

    上面的文字是不是看不到?因为字体太小了,通过参数s(size)可以调整“点”的大小。

     3、size,字体大小,默认值为20; 

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,s=10000,marker='$biyoulin$')
    plt.show()

    到目前为止几个例子中的“点”都是蓝色的,可以通过调整c(color)参数来设置颜色:

    4、c : color,色彩会颜色序列,默认是'b'(蓝色),可支持的颜色参数如下:

    b c g k m r w y
    blue cyan green black magenta red white yellow
    蓝色 青色 绿色 黑色 洋红 红色 白色 黄色
    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,s=10000,c='r',marker='$biyoulin$')
    plt.show() 

    5、alpha:可以理解为颜色的属性之一 ,即透明度,alpha的范围为[0,1],从透明到不透明,上面的例子中 alpha为1,可以看看0.5的效果: 

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,s=10000,c='r',alpha=0.5,marker='$biyoulin$')
    plt.show()

    6、edgecolors:the edge color of marker,顾名思义“边”的颜色,设置标记边框的颜色,下面的例子中,将边的颜色设置了为蓝色: 

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,s=10000,c='r',alpha=1,marker='d',edgecolors='b')
    plt.show()

    可能有人会问,看不出来“边”的颜色是蓝色。没关系,通过设置linewidths,就容易看出来了。

    7、linewidths:the edge size of the marker,设置标记边框的宽度; 

    import matplotlib.pyplot as plt
    plt.scatter(x=0.5,y=0.5,s=10000,c='r',alpha=1,marker='d',linewidths=10
                ,edgecolors='b')
    plt.show()

    8、cmap:A colormap is a series of colors in a gradient that moves from a starting to ending color。注意到是“a series of”,这个参数用于多个点之间,只有一个点就无意义了。注意到“gradient”即量级、程度,用于表示从第一个点开始到最后一个点之间颜色渐进变化。

    import matplotlib.pyplot as plt
    x1=list(range(0,60))
    y1=list(range(0,60))
    plt.scatter(x=x1,y=y1,marker='d',s=10,c=y1,cmap=plt.cm.Reds)
    plt.show()

    注意到c=y1,不再是颜色的名称,这里是一个序列,并且值等于“点”数量值(如果不匹配,则会出错)。只有c是一个array或一个sequence,用cmap才有意义。

      

    参考博文:https://www.cnblogs.com/sunshinewang/p/6853813.html

         https://blog.csdn.net/zidephagino/article/details/80777906

    作者:biyoulin

    出处:http://www.cnblogs.com/biyoulin/

    版权声明:本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。 

  • 相关阅读:
    海居住证我们不得不说的实情![转]
    SQL Server 日期和时间函数
    RESTORE DATABASE命令还原SQLServer 2005 数据库
    asp.net 部署数据库、开始菜单、桌面快捷方式实例(下)
    Server Application Unavailable asp.net 解决办法
    半个月,除了上班时间,而其他时间都不上网,你可以吗?(网络的郁闷)
    唐朝疆域地图[中亚势力范围(公元660年
    偶的偶像 陈松伶写真集
    Sql Server 行转列学习 根据学生表、课程表、学生成绩表统计每个学生的各科成绩和他的总成绩、平均成绩
    DIV+CSS 布局一行两列,左列固定宽度,右列自适应宽度;设置最小宽度,窗口小的时候显示滚动条.
  • 原文地址:https://www.cnblogs.com/biyoulin/p/9565362.html
Copyright © 2011-2022 走看看