zoukankan      html  css  js  c++  java
  • R语言时间序列TAR阈值自回归模型

    原文链接:http://tecdat.cn/?p=5231

    为了方便起见,这些模型通常简称为TAR模型。这些模型捕获了线性时间序列模型无法捕获的行为,例如周期,幅度相关的频率和跳跃现象。Tong和Lim(1980)使用阈值模型表明,该模型能够发现黑子数据出现的不对称周期性行为。

    一阶TAR模型的示例:

    σ是噪声标准偏差,Yt-1是阈值变量,r是阈值参数, {et}是具有零均值和单位方差的iid随机变量序列。

    每个线性子模型都称为一个机制。上面是两个机制的模型。

    考虑以下简单的一阶TAR模型:

    1.  
       
    2.  
      #低机制参数
    3.  
       
    4.  
       
    5.  
      i1 = 0.3
    6.  
      p1 = 0.5
    7.  
      s1 = 1
    8.  
       
    9.  
      #高机制参数
    10.  
       
    11.  
       
    12.  
      i2 = -0.2
    13.  
      p2 = -1.8
    14.  
      s2 = 1
    15.  
       
    16.  
      thresh = -1
    17.  
      delay = 1
    18.  
       
    19.  
      #模拟数据
    20.  
      y=sim(n=100,Phi1=c(i1,p1),Phi2=c(i2,p2),p=1,d=delay,sigma1=s1,thd=thresh,sigma2=s2)$y
    21.  
       
    22.  
      #绘制数据
    23.  
       
    24.  
       
    25.  
      plot(y=y,x=1:length(y),type='o',xlab='t',ylab=expression(Y[t])
    26.  
      abline(thresh,0,col="red")

     TAR模型框架是原始TAR模型的修改版本。它是通过抑制噪声项和截距并将阈值设置为0来获得的:

    框架的稳定性以及某些规律性条件意味着TAR的平稳性。稳定性可以理解为,对于任何初始值Y1,框架都是有界过程。

    在[164]中:

    1.  
      #使用不同的起点检查稳定性
    2.  
      startvals = c(-2, -1.1,-0.5, 0.8, 1.2, 3.4)
    3.  
       
    4.  
      count = 1
    5.  
      for (s in startvals) {
    6.  
      ysk[1
    7.  
      } else {
    8.  
      ysk[i] = -1.8*ysk[i-1]
    9.  
      }
    10.  
       
    11.  
      count = count + 1
    12.  
      }
    13.  
       
    14.  
      #绘制不同实现
    15.  
      matplot(t(x),type="l"
    16.  
      abline(0,0)

    Chan和Tong(1985)证明,如果满足以下条件,则一阶TAR模型是平稳的

    一般的两机制模型写为:

    在这种情况下,稳定性更加复杂。然而,Chan and Tong(1985)证明,如果

    模型估计

    一种方法以及此处讨论的方法是条件最小二乘(CLS)方法。

    为简单起见,除了假设p1 = p2 = p,1≤d≤p,还假设σ1=σ2=σ。然后可以将TAR模型方便地写为

    如果Yt-d> r,则I(Yt-d> r)= 1,否则为0。CLS最小化条件残差平方和:

    在这种情况下,可以根据是否Yt-d≤r将数据分为两部分,然后执行OLS估计每个线性子模型的参数。

    如果r未知。

    在r值范围内进行搜索,该值必须在时间序列的最小值和最大值之间,以确保该序列实际上超过阈值。然后从搜索中排除最高和最低10%的值

    1. 在此受限频带内,针对不同的r = yt值估算TAR模型。
    2. 选择r的值,使对应的回归模型的残差平方和最小。
    1.  
      #找到分位数
    2.  
      lq = quantile(y,0.10)
    3.  
      uq = quantile(y,0.90)
    4.  
       
    5.  
      #绘制数据
    6.  
      plot(y=y,x=1:length(y),type='o',xlab='t'abline(lq,0,col="blue")
    7.  
      abline(uq,0,col="blue")

    1.  
      #模型估计数
    2.  
       
    3.  
       
    4.  
      sum( (lq <= y ) & (y <= uq) )
    5.  
       

    80

    如果d未知。

    令d取值为1,2,3,...,p。为每个d的潜在值估算TAR模型,然后选择残差平方和最小的模型。

    Chan(1993)已证明,CLS方法是一致的。

    最小AIC(MAIC)方法

    由于在实践中这两种情况的AR阶数是未知的,因此需要一种允许对它们进行估计的方法。对于TAR模型,对于固定的r和d,AIC变为

    然后,通过最小化AIC对象来估计参数,以便在某个时间间隔内搜索阈值参数,以使任何方案都有足够的数据进行估计。

    1.  
      #估算模型
    2.  
      #如果知道阈值
    3.  
       
    4.  
      #如果阈值尚不清楚
    5.  
       
    6.  
      #MAIC 方法
    7.  
       
    8.  
       
    9.  
      for (d in 1:3) {
    10.  
      if (model.tar.s$AIC < AIC.best) {
    11.  
      AIC.best = model.tar.s$AIC
    12.  
      model.best$d = d
    13.  
      model.best$p1 = model.tar.s
    14.  
      ar.s$AIC, signif(model.tar.s$thd,4)
    15.  
       
    16.  
      AICM
    17.  
       
    dAICR12
    1 311.2 -1.0020 1 1
    2 372.6 0.2218 1 2
    3 388.4 -1.3870 1 0

    非线性测试

    1.使用滞后回归图进行目测。

    绘制Yt与其滞后。拟合的回归曲线不是很直,可能表明存在非线性关系。

    在[168]中:

    lagplot(y)

     

    2.Keenan检验:

    考虑以下由二阶Volterra展开引起的模型:

    其中{ϵt} 的iid正态分布为零均值和有限方差。如果η=0,则该模型成为AR(mm)模型。

    可以证明,Keenan检验等同于回归模型中检验η=0:

    其中Yt ^ 是从Yt-1,...,Yt-m上的Yt回归得到的拟合值。

    3. Tsay检验:

    Keenan测试的一种更通用的替代方法。用更复杂的表达式替换为Keenan检验给出的上述模型中的项η(∑mj = 1ϕjYt-j)2。最后对所有非线性项是否均为零的二次回归模型执行F检验。

    在[169]中:

    1.  
      #检查非线性: Keenan, Tsay
    2.  
      #Null is an AR model of order 1
    3.  
      Keenan.test(y,1)
    1.  
      $test.stat
    2.  
       
    3.  
      90.2589565661567
    4.  
       
    5.  
      $p.value
    6.  
       
    7.  
      1.76111433596097e-15
    8.  
       
    9.  
      $order
    10.  
       
    11.  
      1

    在[170]中:

    Tsay.test(y,1)
    
    1.  
      $test.stat
    2.  
       
    3.  
      71.34
    4.  
       
    5.  
      $p.value
    6.  
       
    7.  
      3.201e-13
    8.  
       
    9.  
      $order
    10.  
       
    11.  
      1

    4.检验阈值非线性

    这是基于似然比的测试。

    零假设是AR(pp)模型;另一种假设是具有恒定噪声方差的p阶的两区域TAR模型,即σ1=σ2=σ。使用这些假设,可以将通用模型重写为

    零假设表明ϕ2,0 = ϕ2,1 = ... = ϕ2,p = 0。

    似然比检验统计量可以证明等于

    其中n-p是有效样本大小,σ^ 2(H0)是线性AR(p)拟合的噪声方差的MLE,而σ^ 2(H1)来自TAR的噪声方差与在某个有限间隔内搜索到的阈值的MLE。

    H0下似然比检验的采样分布具有非标准采样分布;参见Chan(1991)和Tong(1990)。

    在[171]中:

    1.  
      res = tlrt(y, p=1, d=1, a=0.15, b=0.85)
    2.  
      res
    1.  
      $percentiles
    2.  
       
    3.  
      14.1
    4.  
       
    5.  
      85.9
    6.  
      $test.statistic
    7.  
       
    8.  
      : 142.291963130459
    9.  
       
    10.  
      $p.value
    11.  
       
    12.  
      : 0

    模型诊断

    使用残差分析完成模型诊断。TAR模型的残差定义为

    标准化残差是通过适当的标准偏差标准化的原始残差:

    如果TAR模型是真正的数据机制,则标准化残差图应看起来是随机的。可以通过检查标准化残差的样本ACF来检查标准化误差的独立性假设。

    1.  
      #模型诊断
    2.  
       
    3.  
      diag(model.tar.best, gof.lag=20)

    预测

    预测分布通常是非正态的。通常,采用模拟方法进行预测。考虑模型

    然后给定Yt = yt,Yt-1 = yt-1,...

    因此,可以通过从误差分布中绘制et + 1并计算h(yt,et + 1),来获得单步预测分布的Yt + 1的实现。 。

    通过独立重复此过程 B 次,您可以 从向前一步预测分布中随机获得B值样本 。

    可以通过这些B 值的样本平均值来估计提前一步的预测平均值 。

    通过迭代,可以轻松地将仿真方法扩展为找到任何l步提前预测分布:

    其中Yt = yt和et + 1,et + 2,...,et + l是从误差分布得出的ll值的随机样本。

    在[173]中:

    1.  
      #预测
    2.  
      model.tar.pred r.best, n.ahead = 10, n.sim=1000)
    3.  
      y.pred = ts(c
    4.  
      lines(ts(model.tar.pred$pred.interval[2,], start=end(y) + c(0,1), freq=1), lty=2)
    5.  
      lines(ts(model

    样例

    这里模拟的时间序列是1700年至1988年太阳黑子的年数量。

    在[174]中:

    1.  
      #数据集
    2.  
      #太阳黑子序列,每年
    3.  
       
    4.  
      plot.ts(sunsp

    1.  
      #通过滞后回归图检查非线性
    2.  
      lagplot(sunspo)

    1.  
      #使用假设检验检查线性
    2.  
      Keenan.test(sunspot.year)
    3.  
      Tsay.test(sunspot.year)
    1.  
      $test.stat
    2.  
       
    3.  
      18.2840758932705
    4.  
       
    5.  
      $p.value
    6.  
       
    7.  
      2.64565849317573e-05
    8.  
       
    9.  
      $order
    10.  
       
    11.  
      9
    12.  
       
    13.  
      $test.stat
    14.  
       
    15.  
      3.904
    16.  
       
    17.  
      $p.value
    18.  
       
    19.  
      6.689e-12
    20.  
       
    21.  
      $order
    22.  
       
    23.  
      9

    在[177]中:

    1.  
      #使用MAIC方法
    2.  
      AIC{
    3.  
      sunspot.tar.s = tar(sunspot.year, p1 = 9, p2 = 9, d = d, a=0.15, b=0.85)
    4.  
       
    5.  
      AICM
    dAICR12
    1 2285 22.7 6 9
    2 2248 41.0 9 9
    3 2226 31.5 7 9
    4 2251 47.8 8 7
    5 2296 84.8 9 3
    6 2291 19.8 8 9
    7 2272 43.9 9 9
    8 2244 48.5 9 2
    9 2221 47.5 9 3

    在[178]中:

    1.  
      #测试阈值非线性
    2.  
      tl(sunspot.year, p=9, d=9, a=0.15, b=0.85)
    3.  
       
    1.  
      $percentiles
    2.  
       
    3.  
      15
    4.  
       
    5.  
      85
    6.  
      $test.statistic
    7.  
       
    8.  
      : 52.2571950943405
    9.  
       
    10.  
      $p.value
    11.  
       
    12.  
      : 6.8337179274236e-06
    1.  
      #模型诊断
    2.  
      tsdiag(sunspot.tar.best)

    1.  
      #预测
    2.  
      sunspot.tar.pred <- predict(sunspot.tar.best, n.ahead = 10, n.sim=1000)
    3.  
       
    4.  
      lines(ts(sunspot.tar.pred$pretart=e

    1.  
      #拟合线性AR模型
    2.  
      #pacf(sunspot.year)
    3.  
      #尝试AR阶数9
    4.  
      ord = 9
    5.  
      ar.mod <- arima(sunspot.year, order=c(ord,0,0), method="CSS-ML")
    6.  
       
    7.  
      plot.ts(sunspot.year[10:289]

    模拟TAR模型上的AR性能

    示例1. 将AR(4)拟合到TAR模型

    1.  
      set.seed(12349)
    2.  
      #低机制参数
    3.  
      i1 = 0.3
    4.  
      p1 = 0.5
    5.  
      s1 = 1
    6.  
       
    7.  
      #高机制参数
    8.  
      i2 = -0.2
    9.  
      p2 = -1.8
    10.  
      s2 = 1
    11.  
       
    12.  
      thresh = -1
    13.  
      delay = 1
    14.  
       
    15.  
      nobs = 200
    16.  
      #模拟200个样本
    17.  
      y=sim(n=nobs,Phi1=c(i1,p1),Phi$y
    18.  
       
    19.  
      #使用Tsay的检验确定最佳AR阶数
    20.  
      ord <- Tsay.test(y)$order
    21.  
       
    22.  
      #线性AR模型
    23.  
      #pacf(sunspot.year)
    24.  
      #try AR order 4
    25.  
       

    例子2. 将AR(4)拟合到TAR模型

    例子3. 将AR(3)拟合到TAR模型

    例子3. 将AR(7)拟合到TAR模型

    参考文献

    恩德斯(W. Enders),2010年。应用计量经济学时间序列


    最受欢迎的见解

    1.在python中使用lstm和pytorch进行时间序列预测

    2.python中利用长短期记忆模型lstm进行时间序列预测分析

    3.使用r语言进行时间序列(arima,指数平滑)分析

    4.r语言多元copula-garch-模型时间序列预测

    5.r语言copulas和金融时间序列案例

    6.使用r语言随机波动模型sv处理时间序列中的随机波动

    7.r语言时间序列tar阈值自回归模型

    8.r语言k-shape时间序列聚类方法对股票价格时间序列聚类

    9.python3用arima模型进行时间序列预测

  • 相关阅读:
    挺好用的SQLSERVER数据库自动备份工具SQLBackupAndFTP(功能全面)
    SQLSERVER中的鬼影索引
    SQLSERVER NULL和空字符串的区别 使用NULL是否节省空间
    SQLSERVER中NULL位图的作用
    SQLSERVER到底能识别多少个逻辑CPU?
    不正常关机引起的数据库置疑
    如何在大型的并且有表分区的数据库中进行DBCC CHECKDB操作
    索引视图是否物理存储在数据库中以及使用索引视图的一些见解
    Oracle非重要文件恢复,redo、暂时文件、索引文件、password文件
    最大匹配、最小顶点覆盖、最大独立集、最小路径覆盖(转)
  • 原文地址:https://www.cnblogs.com/tecdat/p/14223962.html
Copyright © 2011-2022 走看看