zoukankan      html  css  js  c++  java
  • numpy之常见统计量API

    import numpy as np
    import matplotlib.pyplot as mp
    import datetime as dt
    import matplotlib.dates as md
    
    '''
        1.算数平均值:收盘价均值计算
        2.加权平均值:交易量加权平均价格(VWAP)---交易量体现了市场对当前交易价格的认可度,交易量越高表示市场对当前的价格越认可,该价格越接近股票价值的真值
        3.最值:波动性
        4.中位数
        5.排序
        6.标准差
    '''
    
    
    # 日期转化函数
    def dmy2ymd(dmy):
        # 把dmy格式的字符串转化成ymd格式的字符串
        dmy = str(dmy, encoding='utf-8')
        d = dt.datetime.strptime(dmy, '%d-%m-%Y')
        d = d.date()
        ymd = d.strftime('%Y-%m-%d')
        return ymd
    
    
    dates, opening_prices, highest_prices, lowest_prices, closing_prices, volumns = 
        np.loadtxt('./da_data/aapl.csv', delimiter=',', usecols=(1, 3, 4, 5, 6, 7), unpack=True,
                   dtype='M8[D], f8, f8, f8, f8, f8', converters={1: dmy2ymd})  # converters为转换器,运行时先执行,其中1表示时间所在的列索引号
    
    # 评估AAPL股票波动性
    max_val = np.max(highest_prices)
    min_val = np.min(lowest_prices)
    print(max_val, '~', min_val)
    # 查看最高价和最低价的日期
    print('max_date:', dates[np.argmax(highest_prices)])
    print('min_date:', dates[np.argmin(lowest_prices)])
    
    # 绘制收盘价折线图
    mp.figure('AAPL', facecolor='lightgray')
    mp.title('AAPL', fontsize=18)
    mp.xlabel('date', fontsize=12)
    mp.ylabel('closing_pricing', fontsize=12)
    mp.tick_params(labelsize=10)
    mp.grid(linestyle=':')
    # 设置x轴的刻度定位器,使之更适合显示日期数据
    ax = mp.gca()
    # 以周一作为主刻度
    ma_loc = md.WeekdayLocator(byweekday=md.MO)
    # 次刻度,除周一外的日期
    mi_loc = md.DayLocator()
    ax.xaxis.set_major_locator(ma_loc)
    ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d'))
    ax.xaxis.set_minor_locator(mi_loc)
    # 日期数据类型转换,更适合绘图
    dates = dates.astype(md.datetime.datetime)
    mp.plot(dates, closing_prices, linewidth=2, linestyle='--', color='dodgerblue', label='AAPL')
    # 计算均值,绘制图像
    mean = np.mean(closing_prices)
    mp.hlines(mean, dates[0], dates[-1], color='orangered', label='Mean(CP)')
    # 计算VWAP交易量加权平均值
    avg1 = np.average(closing_prices, weights=volumns)
    mp.hlines(avg1, dates[0], dates[-1], colors='greenyellow', label='VWAP')
    # 计算TWAP时间加权平均值---越靠近当前时间的收盘价对均值的影响程度越高
    w = np.linspace(1, 7, 30)
    avg2 = np.average(closing_prices, weights=w)
    mp.hlines(avg2, dates[0], dates[-1], colors='pink', label='TWAP')
    # 计算中位数
    median = np.median(closing_prices)
    mp.hlines(median, dates[0], dates[-1], colors='blue', label='Median(CP)')
    print(median)
    # 排序
    sorted_prices = np.msort(closing_prices)
    print(sorted_prices)
    size = sorted_prices.size
    median = ((sorted_prices[int((size - 1) / 2)]) + (sorted_prices[int(size / 2)])) / 2
    print(median)
    # 标准差
    s = np.std(closing_prices)
    s1 = np.std(closing_prices, ddof=1)
    print('总体标准差为:', s)
    print('样本标准差为:', s1)
    
    # 手动算标准差
    mean = np.mean(closing_prices)
    D = closing_prices - mean
    D2 = D ** 2
    V = np.mean(D2)
    s = np.sqrt(V)
    print(s)
    
    mp.tight_layout()
    mp.legend()
    # 自动格式化x轴日期的显示格式(以最合适的方式显示)
    mp.gcf().autofmt_xdate()
    mp.show()
  • 相关阅读:
    多线程篇七:通过Callable和Future获取线程池中单个务完成后的结果
    多线程篇六:线程池
    微服务学习和认识
    多线程篇五:多个线程访问共享对象和数据的方式
    多线程篇四:ThreadLocal实现线程范围内变量共享
    多线程篇三:线程同步
    多线程篇二:定时任务
    多线程篇一:传统线程实现方式
    Jms学习篇二:ActiveMQ
    04-运算符
  • 原文地址:https://www.cnblogs.com/yuxiangyang/p/11161562.html
Copyright © 2011-2022 走看看