zoukankan      html  css  js  c++  java
  • 拓端tecdat|R语言ARIMAGARCH波动率模型预测股票市场苹果公司日收益率时间序列

    原文链接:http://tecdat.cn/?p=23934

    原文出处:拓端数据部落公众号

    引言

    在本文中,我们将尝试为苹果公司的日收益率寻找一个合适的 GARCH 模型。波动率建模需要两个主要步骤。

    1. 指定一个均值方程(例如 ARMA,AR,MA,ARIMA 等)。
    2. 建立一个波动率方程(例如 GARCH, ARCH,这些方程是由 Robert Engle 首先开发的)。

    要做(1),你需要利用著名的Box-Jenkins方法,它包括三个主要步骤。

    1. 识别
    2. 估算
    3. 诊断检查

    这三个步骤有时会有不同的名称,这取决于你读的是谁的书。在本文中,我将更多地关注(2)。

    我将使用一个名为quantmod的软件包,它代表量化金融建模框架。这允许你在R中直接从各种在线资源中抓取金融数据。

    1.  
       
    2.  
      #install.packages("quantmod") -需要先安装该软件包
    3.  
       
    4.  
      getSymbols(Symbols = "AAPL",
    5.  
      src="yahoo", #其他来源包括:谷歌、FRED等。
    6.  
       
    7.  
       

    收益通常有一个非常简单的平均数方程,这导致了简单的残差。

    我们首先要测试序列依赖性,这是条件异方差的一个指标(序列依赖性与序列相关不同)。这是通过对原始序列的平方/绝对值进行测试,并使用Ljung和Box(1978)的Ljung-Box测试等联合假设进行测试,这是一个Portmentau检验,正式检验连续自相关,直到预定的滞后数,如下所示。

    其中T是总的周期数,m是你要测试的序列相关的滞后期数,ρ2k是滞后期k的相关性,Q∗(m)∼χ2α有m个自由度。

    检查

    下面是AAPL对数收益时间序列及其ACF,这里我们要寻找显著的滞后期(也可以运行pacf)或存在序列自相关。

    通过观察ACF,水平序列(对数收益)并不是真正的自相关,但现在让我们看一下平方序列来检查序列依赖性。

    我们可以看到,平方序列的ACF显示出显著的滞后。这是一个信号,说明我们应该在某个时候测试ARCH效应。

    平稳性

    我们可以看到,AAPL的对数回报在某种程度上是一个平稳的过程,所以我们将使用Augmented Dicky-Fuller检验(ADF)来正式检验平稳性。ADF是一个广泛使用的单位根检验,即平稳性。我们将使用12个滞后期,因为根据文献的建议,我们有每日数据。 何:存在单位根(系列是非平稳的

    1.  
      ##
    2.  
      ## Title:
    3.  
      ## Augmented Dickey-Fuller Test
    4.  
      ##
    5.  
      ## Test Results:
    6.  
      ## PARAMETER:
    7.  
      ## Lag Order: 12
    8.  
      ## STATISTIC:
    9.  
      ## Dickey-Fuller: -14.6203
    10.  
      ## P VALUE:
    11.  
      ## 0.01
    12.  
      ##
    13.  
      ## Description:
    14.  
      ## Mon May 25 16:45:37 2020 by user: Florian

    上面的P值为0.01,表明我们应该拒绝Ho,因此,该系列是平稳的。

    结构突变检验

    请注意,我从2008年底开始研究APPL序列。以避免08年大衰退,通常会在数据中产生结构性突变(即趋势的严重下降/跳跃)。我们将对结构性突变/变化进行Chow测试。 AAPL的日收益率没有结构性突变

    该图显示,用于估计断点(BP)数量的BIC(黑线)是BIC线的最小值,所以我们可以确认没有结构性断点,因为最小值是零,即零断点。在预测时间序列时,断点非常重要。

    估计

    在这一节中,我们试图用auto.arima命令来拟合最佳arima模型,允许一个季节性差异和一个水平差异。

    正如我们所知,{Yt}的一般ARIMA(p,d,q)。

    根据auto.arima,最佳模型是ARIMA(3,0,2),平均数为非零,AIC为-14781.55。我们的平均方程如下(括号内为SE)。

    Auto.arima函数挑选出具有最低AIC的ARIMA(p,d,q),其中。

    其中Λθ是观察到的数据在参数的mle的概率。因此,如果Auto.arima函数运行N模型,其决策规则为AIC∗=min{AICi}Ni=1

    诊断检查

    我们可以看到,我们的ARIMA(3,0,2)的残差是良好的表现。它们似乎也有一定的正态分布

    1.  
      ##
    2.  
      ## Ljung-Box test
    3.  
      ##
    4.  
      ## data: Residuals from ARIMA(3,0,2) with non-zero mean
    5.  
      ## Q* = 6.7928, df = 4, p-value = 0.1473
    6.  
      ##
    7.  
      ## Model df: 6. Total lags used: 10

    现在我们将通过对我们的ARIMA(3,0,2)模型的平方残差应用Ljung-Box测试来检验ARCH效应。

    1.  
      ##
    2.  
      ## Box-Ljung test
    3.  
      ##
    4.  
      ## data: resid^2
    5.  
      ## X-squared = 126.6, df = 12, p-value < 2.2e-16

    我们可以看到,残差平方的 ACF 显示出许多显著的滞后期,因此我们得出结论,确实存在 ARCH 效应,我们应该对波动率进行建模。

    使用 GARCH 建立波动率模型

    上面将我们的平均数方程中的残差进行了平方,看看大的冲击是否紧随在其他大的冲击之后(无论哪个方向,即负的或正的),如果是这样,那么我们就有条件异方差,意味着我们有需要建模的非恒定方差。下面是一个GARCH(m,s)的样子。

    其中{ϵ2t}mt=1是我们通常的特异性冲击,iid随机变量,即ϵ2t∼WN(0,σ2ϵ)。我们可以更紧凑地写成:

    其中B是标准的后移算子Biϵ2t=ϵ2t-i,Biσ2t=σ2t-i。对于任何整数ii,以及α和β分别是度数为m和s的多项式

    请注意,一个特殊情况是当s=0时,GARCH(m,0)被称为ARCH(m)。

    当我说GARCH家族时,它表明模型有变化。

    • SGARCH。普通GARCH
    • EGARCH。指数GARCH,允许波动率不为负值(这迫使模型只输出正方差
    • FGARCH。这是为长记忆模型准备的。它使用了被称为 ARFIMA 的 Fractionaly integrated ARIMA(即非整数整合)。
    • GARCH-M:这是GARCH的均值,适合你的均值方程中有波动率例如CAPM的方程中有σ。
    • GJR-GARCH。假设负面冲击和正面冲击之间存在不对称性(金融数据几乎都是这样)。

    为收益率序列建立波动率模型包括四个步骤:

    1. 通过测试数据中的序列依赖性来指定一个均值方程,如果有必要,为收益序列建立一个 计量经济学模型(例如,ARIMA 模型)来消除任何线性依赖。
    2. 使用平均值方程的残差来测试ARCH效应。
    3. 如果ARCH效应在统计上是显著的,就指定一个波动率模型,并对均值和波动率方程进行联合估计。
    4. 仔细检查拟合的模型,必要时对其进行改进。

    一个简单的 GARCH 模型有以下成分。

    均值: 

    波动率方程:  

    误差假设: 

    1.  
       
    2.  
      #以下命令将计算GARCH(m,s)。请记住,对于某些m和s的组合,它可能不会收敛。
    3.  
       
    4.  
      garchlist(model="sGARCH", #其他选项有egarch, fgarch等。
    5.  
      garchOrder=c(1,2)), #你可以在这里修改GARCH(m,s)的阶数
    6.  
      mean.model , #指定你的ARMA模型,暗示你的模型应该是平稳的。
    7.  
      distribution.model #其他分布是 "std "代表t分布,"ged "代表一般误差分布
    8.  
       

    我们的波动率方程由GARCH(1,2)给出,AIC:-5.5277(注意GARCH可能无法收敛)。

    下面是使用我们的波动率模型对波动率进行的预测。这看起来是一个合理的波动率预测,但是你想改进你的模型。

    现在让我们使用rugarch的标准功能,使用估计的GARCH(1,2)模型来产生σt的滚动预测,并将它们与|rt|作对比。

    最后,我们可以手动编写代码来查看随时间变化的波动率和对数收益率rt,如下图。

    1.  
       
    2.  
      # 这将有助于在对数收益率上绘制sigma随时间变化的图。
    3.  
       
    4.  
      sigma.t #这是你的波动率序列
    5.  
       
    6.  
      ggplot()
    7.  
      geom_line(aes(x=as.numeric(
    8.  
       
    9.  
      theme_bw()+
    10.  
       

    结论

    事实证明,GARCH系列是所谓确定性波动率模型的一部分。还有一个家族叫做随机波动率模型,它允许模型中存在随机性,而GARCH假设我们对波动率进行了完美的建模(如果你对你所分析的序列非常熟悉,这可能是一个好的假设,但实际情况并不总是这样)。随机波动率模型通常是用马尔科夫链蒙特卡洛(MCMC)和准蒙特卡洛方法来估计的,如果你学过随机过程的相关内容,你会知道这是什么。

    参考文献


    最受欢迎的见解

    1.HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频波动率

    2.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

    3.波动率的实现:ARCH模型与HAR-RV模型

    4.R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

    5.GARCH(1,1),MA以及历史模拟法的VaR比较

    6.R语言多元COPULA GARCH 模型时间序列预测

    7.R语言基于ARMA-GARCH过程的VAR拟合和预测

    8.matlab预测ARMA-GARCH 条件均值和方差模型

    9.R语言对S&P500股票指数进行ARIMA + GARCH交易策略

  • 相关阅读:
    【CF720D】Slalom 扫描线+线段树
    【CF724F】Uniformly Branched Trees 动态规划
    【CF725G】Messages on a Tree 树链剖分+线段树
    【CF736D】Permutations 线性代数+高斯消元
    【CF799E】Aquarium decoration 线段树
    【CF739E】Gosha is hunting 贪心
    【CF744D】Hongcow Draws a Circle 二分+几何
    【BZOJ3774】最优选择 最小割
    【BZOJ2138】stone Hall定理+线段树
    【BZOJ4445】[Scoi2015]小凸想跑步 半平面交
  • 原文地址:https://www.cnblogs.com/tecdat/p/15416439.html
Copyright © 2011-2022 走看看