zoukankan      html  css  js  c++  java
  • python金融与量化分析------Matplotlib(绘图和可视化)

    -----------------------------------------------------------Matplotlib:绘图和可视化------------------------------------------------------------------------------
        Matplotlib:---------------------------------------------------是一个强大的Python绘图和数据可视化的工具包
        一:安装方法:------------------------------------------------pip install matplotlib
        
        二:引用方法:------------------------------------------------import matplotlib.pyplot as plt
        
        三:使用:
            1:绘图函数:---------------------------------------------plt.plot()
            2:显示函数------------------------------------------------plt.show()
            3:plot函数:绘制折线图
                ----线型:------------------------------------------------(-,-.,--,..,-.,......等)
                ----点型:------------------------------------------------marker(v,^,s,*,H,+,X,D,o,......等)
                ----颜色:------------------------------------------------color(b,g,r,y,k,w,......等)
                plot函数绘制多条曲线
                pands包对plot的支持
            4:Matplotlip:图像标注
                ----设置图像标题:----------------------------------------plt.title()
                ----设置x轴名称:-----------------------------------------plt.xlabel()
                ----设置y轴名称:-----------------------------------------plt.ylabel()
                ----设置x轴范围:-----------------------------------------plt.xlim()
                ----设置y轴名称:-----------------------------------------plt.ylim()
                ----设置x轴刻度:-----------------------------------------plt.xticks()
                ----设置y轴刻度:-----------------------------------------plt.yticks()
                ----设置曲线图例:-----------------------------------------plt.legend()
            5:Matplotlib:画布与子图
                ----画布--------------------------------------------------figure
                    fig = plt.figure()
                ----图:--------------------------------------------------subplot
                    ax1 = fig.add subplot(2,2,1)
                    
                ----调节子图间距:----------------------------------------subplots_adjust(left, bottom, right, top, wspace, hspace)
            6:Matplotlib-支持的图类型
                坐标图:--------------------------------------------------plt.plot(x,y,fmt,...)

                箱型图:--------------------------------------------------plt.boxplot(data, notch, position)

                条形图:--------------------------------------------------plt.bar(left,height,width,bottom)

                横向条形图:----------------------------------------------plt.barh(width,bottom,left,height)

                极坐标图:------------------------------------------------plt.polar(theta, r)

                饼图:----------------------------------------------------plt.pie(data, explode)

                功率谱密度图:--------------------------------------------plt.psd(x,NFFT=256,pad_to,Fs)

                谱图:----------------------------------------------------plt.specgram(x,NFFT=256,pad_to,F)

                X-Y相关性函数:-------------------------------------------plt.cohere(x,y,NFFT=256,Fs)

                散点图:--------------------------------------------------plt.scatter(x,y)

                步阶图:--------------------------------------------------plt.step(x,y,where)

                直方图:--------------------------------------------------plt.hist(x,bins,normed)
            
            7:Matplotlib——绘制K线图
                matplotlib.finanace子包中有许多绘制金融相关图的函数接口。
                绘制K线图:matplotlib.finance.candlestick_ochl函数

    实例:
    
    1:
    import matplotlib.pyplot as plt
    plt.plot([1,2,3,4])
    plt.show()

    运行结果
    这里写图片描述

    你可能会很疑惑X和Y轴为什么是0~3和1~4。原因是这样的,这里我们只是为plot()命令提供 了一个list或者是array,matplotlib就会假设这个序列是Y轴上的取值,并且会自动为你生成X轴上的值。因为python中的范围是从0开始的,因此X轴就是从0开始,长度与Y的长度相同,也就是[0,1,2,3]。

    plot()是一个灵活的命令,它的参数可以是任意数量,比如:

        plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
    • 1

    这表示的是(x,y)对,(1,1)(2,4)(3,9)(4,16)。这里有第三个可选参数,它是字符串格式的,表示颜色和线的类型。该字符串格式中的字母和符号来自于MATLAB,它是颜色字符串和线的类型字符串的组合。默认情况下,该字符串参数是’b-‘,表示蓝色的实线。
    举一个使用红色圆圈绘制上述点集的例子:

        import matplotlib.pyplot as plt
        plt.plot([1,2,3,4], [1,4,9,16], 'ro')
        plt.axis([0, 6, 0, 20])
        plt.show()

    这里写图片描述

    可以查看plot()的文档,那里有完整的关于线的类型的说明。axis()命令可以方便的获取和设置XY轴的一些属性。

    如果matplotlib仅限于使用上面那种list,那么它将显得毫无用处。通常,我们都是使用numpy数组,实际上,所有的序列都将被在内部被转化成numpy数字。下面的例子是使用一个命令用几种不同风格的线绘制一个数组:

        import numpy as np
        import matplotlib.pyplot as plt
    
        # 0到5之间每隔0.2取一个数
        t = np.arange(0., 5., 0.2)
    
        # 红色的破折号,蓝色的方块,绿色的三角形
        plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')
        plt.show()

    这里写图片描述

    • 控制线的属性
      线有许多属性可以设置:线宽、线的形状,平滑等等。这里有一些设置线属性的方法:

      • 使用关键字参数
      plt.plot(x,y,linewidth=2.0)
      • 1
      • 对线对象(Line2D)使用set_方法,plot()会返回一个线对象的列表,比如line1, line2 = plot(x1, y1, x2, y2)。下面的代码我们将假设我们只有一条线,即返回的线对象列表的长度为1。
      line, = plt.plot(x, y, '-')
      line.set_antialiased(False) # 关闭平滑
      • 1
      • 2
      • 使用setp()命令。 下面的例子使用的是MATLAB风格的命令去设置一个线的列表的多个属性。setp()可以作用于一个列表对象或者是一个单一的对象。你可以使用python风格的关键字参数或者是MATLAB风格的string/value对为参数:
      lines = plt.plot(x1, y1, x2, y2)
      
      # 使用关键字
      
      plt.setp(lines, color='r', linewidth=2.0)
      
      # 或者是MATLAB风格的string/value对
      
      plt.setp(lines, 'color', 'r', 'linewidth', 2.0)
    • 这是一些Line2D的属性和取值:
      这里写图片描述

    • 工作在多图形(figures)和多坐标系(axes)
      MATLAB和pyplot都有当前图形(figure)和当前坐标系(axes)的概念。所有的绘图命令都是应用于当前坐标系的。gca()和gcf()(get current axes/figures)分别获取当前axes和figures的对象。通常,你不用担心这些,因为他们都在幕后被保存了,下面是一个例子,创建了两个子绘图区域(subplot):

      import numpy as np
      import matplotlib.pyplot as plt
      
      def f(t):
          return np.exp(-t) * np.cos(2*np.pi*t)
      
      t1 = np.arange(0.0, 5.0, 0.1)
      t2 = np.arange(0.0, 5.0, 0.02)
      
      plt.figure("2subplot")
      plt.subplot(211)
      plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')
      
      plt.subplot(212)
      plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
      plt.show()
    • 这里写图片描述

      figure()命令在这儿可以不写,因为figure(1)将会被默认执行,同样,subplot(111)也是默认被执行的。subplot()中的参数分别指定了numrows、numcols、fignum,其中fignum的取值范围为1到numrows*numcols,分别表示的是将绘图区域划分为numrows行和numcols列个子绘图区域,fignum为当前子图的编号。编号是从1开始,一行一行由左向右编号的。其实subplot中的参数【111】本应写作【1,1,1】,但是如果这三个参数都小于10(其实就是第三个参数小于10)就可以省略逗号。你可以创建任意数量的子图(subplots)和坐标系(axes)。如果你想手动放置一个axes,也就是它不再是一个矩形方格,你就可以使用命令axes(),它可以让坐标系位于任何位置,axes([left,bottom,width,height]),其中所有的值都是0到1(axes([0.3,0.4,0.2,0.3])表示的是该坐标系位于figure的(0.3,0.4)处,其宽度和长度分别为figure横坐标和纵坐标总长的0.2和0.3)。其实subplot和axes的区别就在于axes大小和位置更加随意。
      你可以创建多个figure,通过调用figure(),其参数为figure的编号。当然每个figure可以包含多个subplot或者是多个axes。例子:

      import matplotlib.pyplot as plt
      plt.figure(1)                # 编号为1的figure
      plt.subplot(211)             # figure1中的第一个子图
      plt.plot([1, 2, 3])
      plt.subplot(212)             # figure1中的第二个子图
      plt.plot([4, 5, 6])
      
      
      plt.figure(2)                # figure2
      plt.plot([4, 5, 6])          # 默认使用subplot(111),此时figure2为当      
                                   # 前figure
      
      plt.figure(1)                # 设置figure1为当前figure;  
                                   # 但是subplot(212)为当前子图
      plt.subplot(211)             # 使subplot(211)为当前子图
      plt.title('Easy as 1, 2, 3') # 对subplot(211)命名
    • 我们可以使用clf()和cla()(clear current figure/axes)清除当前figure和当前axes。
      如果你创建了许多figures,你需要注意一件事:figure的内存直到显示调用close()函数才会被完全释放,否则它并没有被全部释放。如果只是删掉对figure的引用,或者是通过关闭window进程管理器关闭该figure,这都是不完全删除figure的,因为pyplot在内部维持了一个引用,直到close()被调用。

    • 文字
      text()命令可以被用来在任何位置添加文字,xlabel()、ylabel()、title()被用来在指定位置添加文字。

      import numpy as np
      import matplotlib.pyplot as plt
      
      mu, sigma = 100, 15
      x = mu + sigma * np.random.randn(10000)
      
      
      # 直方图
      
      n, bins, patches = plt.hist(x, 50, normed=1, facecolor='g', alpha=0.75)
      
      
      plt.xlabel('Smarts')
      plt.ylabel('Probability')
      plt.title('Histogram of IQ')
      plt.text(60, .025, r'$mu=100, sigma=15$')
      plt.axis([40, 160, 0, 0.03])
      plt.grid(True)
      plt.show()
    • 这里写图片描述
      所有text()命令返回一个matplotlib.text.Text实例,像上面的线一样,可以通过关键字参数在text()定制文本样式,也可以通过setp()来定制文字的样式:

      t = plt.xlabel('my data', fontsize=14, color='red')
      setp(t,color='blue')
      • 1
      • 2
      • 在文本中使用数学表达式
        matplotlib接受任何TeX方程表达式,比如这里写图片描述,你可以写成用”$”符号包裹的TeX表达式:
      plt.title(r'$sigma_i=15$')
      • 1

      这里的”r”非常重要,它表示后面的字符串是一个纯粹的字符串,不会将后面的反斜杠当作转义字符。matplotlib内置有TeX表达式解释器和排版引擎,和自带的数学字体。因此你可以不用安装TeX就能使用数学表达式,如果你安装了LaTeX和dvipng,你也可以使用LaTex排版你的文字并且直接输出到figures或者是保存。

      • 注释文本
        使用text()命令可以在Axes中任意位置放置文本,一个普遍的文本用法是对一些特性进行注释,annotate()方法让添加注释变得很容易。对于注释有两点需要注意:需要被注释的地方,使用xy参数来指出,还有就是注释文本所放置的位置,使用参数xytext来指定位置,这两个参数都使(x,y)元组:
      import numpy as np
      import matplotlib.pyplot as plt
      
      ax = plt.subplot(111)
      
      t = np.arange(0.0, 5.0, 0.01)
      s = np.cos(2*np.pi*t)
      line, = plt.plot(t, s, lw=2)
      
      plt.annotate('local max', xy=(2, 1), xytext=(3, 1.5),
                  arrowprops=dict(facecolor='black', shrink=0.05),
                  )
      
      plt.ylim(-2,2)
      plt.show()
    • 这里写图片描述
      这里的xy和xytext所使用的坐标是根据XY轴的刻度的坐标,称为data coordinates。当然也可以使用其他坐标系统,具体参考官方文档。

    • 对数和其他非线性坐标轴(axis)
      matplotlib.pylot不仅仅提供了线性的坐标,还提供了对数(logarithmic)和分对数(logit)坐标。当数据的维度跨越许多数量级时,这种坐标就很有用,改变坐标轴的刻度很容易:

      plt.xscale(‘log’)
    • 下面是一个例子,对于同样的数据,在Y轴使用不同刻度下的曲线图:

      import numpy as np
      import matplotlib.pyplot as plt
      
      
      # 在区间[0,1]制造一些数据
      
      
      # np.random.normal为高斯分布
      
      y = np.random.normal(loc=0.5, scale=0.4, size=1000)
      y = y[(y > 0) & (y < 1)]
      y.sort()
      x = np.arange(len(y))
      
      
      # 创建一个窗口
      
      plt.figure(1)
      
      
      # 线性
      
      plt.subplot(221)
      plt.plot(x, y)
      plt.yscale('linear')
      plt.title('linear')
      plt.grid(True)
      
      
      
      # 对数
      
      plt.subplot(222)
      plt.plot(x, y)
      plt.yscale('log')
      plt.title('log')
      plt.grid(True)
      
      
      
      # symmetric log
      
      plt.subplot(223)
      plt.plot(x, y - y.mean())
      plt.yscale('symlog', linthreshy=0.05)
      plt.title('symlog')
      plt.grid(True)
      
      
      # logit
      
      plt.subplot(224)
      plt.plot(x, y)
      plt.yscale('logit')
      plt.title('logit')
      plt.grid(True)
      
      plt.show()
    • 这里写图片描述

     

    实现一个最简单的plot函数调用:

    复制代码
    1 import matplotlib.pyplot as plt
    2 
    3 y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供
    4 
    5 x=len(y)           # 设置x轴,以y轴数组长度为宽度
    6 x=range(x)      # 以0开始的递增序列作为x轴数据
    7 
    8 plt.plot(x,y)  #  只提供x轴,y轴参数,画最简单图形
    复制代码

    图形输出结果类似于:

    加入新方法:

    plt.figure() :自定义画布大小

    plt.subplot() :设置画布划分以及图像在画布上输出的位置

    复制代码
    import matplotlib.pyplot as plt
    
    y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供
    
    x=len(y)           # 设置x轴,以y轴数组长度为宽度
    x=range(x)      # 以0开始的递增序列作为x轴数据
    
    #==============================
    plt.figure(figsize=(8,8),dpi=80)  # 画图之前首先设置figure对象,此函数相当于设置一块自定义大小的画布,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小
    plt.subplot(221) # 将figure设置的画布大小分成几个部分,参数‘221’表示2(row)x2(colu),即将画布分成2x2,两行两列的4块区域,1表示选择图形输出的区域在第一块,图形输出区域参数必须在“行x列”范围                       ,此处必须在1和2之间选择——如果参数设置为subplot(111),则表示画布整个输出,不分割成小块区域,图形直接输出在整块画布上
    plt.plot(y,xx) # 在2x2画布中第一块区域输出图形
    plt.subplot(222) 
    plt.plot(y,xx)    #在2x2画布中第二块区域输出图形
    plt.show()
    plt.subplot(223)  #在2x2画布中第三块区域输出图形
    plt.plot(y,xx)
    plt.subplot(224)  # 在在2x2画布中第四块区域输出图形
    plt.plot(y,xx)
    #==============================
    
    plt.plot(x,y)  #  只提供x轴,y轴参数,画最简单图形
    复制代码

    输出结果:

    加入新方法:

    plt.xticks():设置x轴刻度的表现方式

    plt.xlim():设置x轴刻度的取值范围

    复制代码
     1 import matplotlib.pyplot as plt
     2 import numpy as nu
     3 
     4 y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供
     5 
     6 x=len(y)           # 设置x轴,以y轴数组长度为宽度
     7 x=range(x)      # 以0开始的递增序列作为x轴数据
     8 
     9 plt.figure(figsize=(8,8),dpi=80)  # 画图之前首先设置figure对象,此函数相当于设置一块自定义大小的画布,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小
    10 plt.subplot(111) # 将figure设置的画布大小分成几个部分,参数‘221’表示2(row)x2(colu),即将画布分成2x2,两行两列的4块区域,1表示选择图形输出的区域在第一块,图形输出区域参数必须在“行x列”范围                       ,此处必须在1和2之间选择——如果参数设置为subplot(111),则表示画布整个输出,不分割成小块区域,图形直接输出在整块画布上
    11 plt.plot(y,x)
    12 #================================
    13 plt.xlim(0,1000)  #  设置x轴刻度范围,从0~1000
    14 plt.ylim(0,20)   # 设置y轴刻度的范围,从0~20
    15 
    16 plt.xticks(nu.linspace(0,1000,15,endpoint=True))  # 设置x轴刻度
    17 plt.yticks(nu.linspace(0,20,10,endpoint=True))  # 设置y轴刻度
    18 #numpy.linspace()方法返回一个等差数列数组,第一个参数表示等差数列的第一个数,第二个参数表示等差数列最后一个数,第三个参数设置组成等差数列的元素个数,endpoint参数设置最后一个数是否包含在该等差数列。数列中相邻元素间的步长值为随机
    19 如:nu.linspace(0,1000,15,endpoint=True)表示:第一个元素为0,最后一个数为1000,在这个 范围内,取15个值,构成一个等差数列,步长值随机,且1000包含在该数列中
    20 #================================
    21 plt.show()
    复制代码

    图形输出结果:

     修改plot方法,新加入参数:

    plt.plot(y,xx,color='red',linewidth=2.5,linestyle='-') # color参数设置曲线颜色,linewidth设置曲线宽度,linestyle设置曲线风格

    输出结果:

  • 相关阅读:
    Zookeeper之 为什么最好是奇数台机器?
    Kafka 之 如何高吞吐和低延迟
    hbase 之 rowkey的设计
    Zookeeper之 两种选举制度|为什么需要过半投票机制?
    Mysql 之 union和union all
    Mysql之 distinct & null | distinct 调优
    Linux 之 系统资源命令
    Linux 之 vi 之 快速定位到n line
    Zeppelin问题 之 Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
    springboot项目中进行XSS过滤
  • 原文地址:https://www.cnblogs.com/w-s-l123/p/8378911.html
Copyright © 2011-2022 走看看