zoukankan      html  css  js  c++  java
  • 股票涨跌预测方法之三:建立模型并训练

    前一阵子在同学的鼓动下,花了一个多月研究了股票行情的预测方法,熟悉了常见的炒股术语及技术指标,现总结如下,纯属兴趣,如果想依照本文的方法来短线操作获利,请绕道。

             研究的第三步就是建立神经网络预测模型了,还是使用keras来搭建,使用简单的3层全连接层做实验,输出就是根据第二天的涨跌幅分为5类:涨(范围[0.01,])、微涨(范围[0.003,0.01])、平(范围[-0.003,0.003])、微跌(范围[-0.01,-0.003])、跌(范围[, -0.01]),测试了下这么分,5类概率几乎均等。

             输入选择什么呢?如果直接将最近N天的开盘价、收盘价、交易量等原始值输进去,应该是很难训练的,毕竟不同股票的价格差异较大,同一个股票几年前的价格、交易量跟现在也类似,很难收敛,如果输入上篇文章中的股票技术指标,这些指标又太简单,主要用于绘图让人观察,我们采用了不同天数的收盘价格滑动平均(类似于MACD中的ema计算)、不同天数的收盘意愿滑动平均(类似于CR指标的计算)、不同天数的股票振幅滑动平均、不同天数的交易量滑动平均,注意所有的平均值计算完后还要除以一个基准值,使得每个值都在1.0附近。

    def GetPara(m, allDate):
        if 1:   #简单处理下输入SVM,效果较好  
            data = []
            tmp = avg1(m.close, 32)
            data.append(m.close/tmp)
            data.append(avg1(m.close, 2)/tmp)
            data.append(avg1(m.close, 4)/tmp)
            data.append(avg1(m.close, 8)/tmp)
            data.append(avg1(m.close, 16)/tmp)
            
            tmp = m.close.copy()
            tmp[0] = (m.high[0]+m.low[0])/2
            tmp[1:] = (2*m.close[:-1] + m.high[:-1] +m.low[:-1]).values /4
            a = m.high - tmp
            b = tmp - m.low
            data.append(avg1(a, 2)/avg1(b, 2))
            data.append(avg1(a, 4)/avg1(b, 2))
            data.append(avg1(a, 8)/avg1(b, 2))
            data.append(avg1(a, 16)/avg1(b, 2))
            data.append(avg1(a, 32)/avg1(b, 2))
            
            tmp = (m.high- m.low)/ ((m.high+ m.low+0.00001)/2)
            data.append(tmp)
            data.append(avg1(tmp, 2))
            data.append(avg1(tmp, 4))
            data.append(avg1(tmp, 8))
            data.append(avg1(tmp, 16))
            data.append(avg1(tmp, 32))
        
            tmp = avg1(m.volume, 32)
            data.append(m.volume/tmp)
            data.append(avg1(m.volume, 2)/tmp)
            data.append(avg1(m.volume, 4)/tmp)
            data.append(avg1(m.volume, 8)/tmp)
            data.append(avg1(m.volume, 16)/tmp)
            
    
            data = np.array(data).T
            X_train = []
            Y_train = []
            n2 = 28
            for k in range(30, len(tmp)-1):
                if allDate[m.date[k-1]] - allDate[m.date[k-n2]] != n2-1:
                    continue
                X_train.append(data[k, :].ravel())
                
                #v = (m.close[k]-m.close[k-1])/m.close[k-1]            
                v = (m.close[k+1]-m.close[k])/m.close[k]
                if v>=0.01: tmp=0
                elif v>=0.003: tmp=1
                elif v>=-0.003: tmp=2
                elif v>=-0.01:tmp = 3
                else: tmp = 4
                Y_train.append(tmp)
            return X_train, Y_train        

    然后就是建立模型并训练,loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'],  class_mode='categorical',随机采用10%的数据做验证,经过长时间的等待,结果如下:

         准确率35%左右,嗯,比扔银币的20%好多了。

  • 相关阅读:
    去除 .sh 文件的
    Shell Notepad++导致报错:#!/bin/bash: 坏的解释器: 没有那个文件或目录
    linux 不同格式的软件包的安装
    linux:jenkins 默认安装目录
    使用nsis制作的安装包安装后,无法卸载干净的问题
    bash: ./t.sh:/bin/bash^M:损坏的解释器: 没有那个文件或目录
    jenkins启动/重启/停止命令 改端口
    解决windows系统80端口被占用问题
    find ./ -name *.bak | xargs rm -rf
    Linux查看端口占用情况,释放占用的端口
  • 原文地址:https://www.cnblogs.com/zmshy2128/p/7118727.html
Copyright © 2011-2022 走看看