一、定义
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。
时间序列简单的说就是各时间点上形成的数值序列。时间序列分析并不是关于时间的回归,它主要是研究自身的变化规律的(这里不考虑含外生变量的时间序列)。
对时间序列进行观察,研究,寻找它变化发展的规律,预测它将来的走势,就是时间序列分析。
二、构成要素:长期趋势,季节变动,循环变动,不规则变动。
1)长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
2)季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动。
3)循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。
4)不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型。
三、作用
1. 反映社会经济现象的发展变化过程,描述现象的发展状态和结果。
2. 研究社会经济现象的发展趋势和发展速度。
3. 探索现象发展变化的规律,对某些社会经济现象进行预测。
4. 利用时间序列可以在不同地区或国家之间进行对比分析,这也是统计分析的重要方法之一。
四、变量特征
非平稳性(nonstationarity,也译作不平稳性,非稳定性):即时间序列变量无法呈现出一个长期趋势并最终趋于一个常数或是一个线性函数。
波动幅度随时间变化(Time-varying Volatility):即一个时间序列变量的方差随时间的变化而变化。这两个特征使得有效分析时间序列变量十分困难。
平稳型时间数列(Stationary Time Series)系指一个时间数列其统计特性将不随时间之变化而改变。
五、时域分析的经典步骤
1.考察序列的特征,检验是否具有平稳性
2.根据序列特征选择拟合的模型
3.确定模型的口径
4.检验、优化模型
5.利用拟合的模型进行预测
以下为转载
————————————————
版权声明:本文为CSDN博主「Python金融量化」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ndhtou222/article/details/100148319
版权声明:本文为CSDN博主「Python金融量化」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ndhtou222/article/details/100148319
六、
1.自相关:相关性一般是指两个变量之间的统计关联性,那么自相关性则是指一个时间序列的两个不同时间点的变量是否相关联。时间序列具有自相关性是我们能够进行分析的前提,若时间序列的自相关性为0,也就是说各个时点的变量不相互关联,那么未来与现在和过去就没有联系,根据过去信息来推测未来就变得毫无根据。时间序列的自相关性一般用时间序列的自协方差函数、自相关系数函数和偏自相关系数函数等统计量来衡量。
2
python计算自相关、偏自相关函数:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
%matplotlib inline
#获取数据为df
import statsmodels.tsa.api as smt
#tsa是Time Series analysis缩写
#tsa的stattools(统计工具)提供了计算acf和pacf以及后面要用到的adfuller单位根检验函数
#使用help(smt.stattools.acf)可以查看相关参数设置
#计算自相关系数,这里设置滞后项为5期,默认是40期滞后
acf=smt.stattools.acf(df,nlags=5)
#计算偏自相关系数
pacf=smt.stattools.pacf(df,nlags=5)
print(f'自相关系数为:{acf}; 偏自相关系数为:{pacf}')
#tsa是Time Series analysis缩写
#tsa的stattools(统计工具)提供了计算acf和pacf以及后面要用到的adfuller单位根检验函数
#使用help(smt.stattools.acf)可以查看相关参数设置
#计算自相关系数,这里设置滞后项为5期,默认是40期滞后
acf=smt.stattools.acf(df,nlags=5)
#计算偏自相关系数
pacf=smt.stattools.pacf(df,nlags=5)
print(f'自相关系数为:{acf}; 偏自相关系数为:{pacf}')
七、平稳性检验
1.平稳性:时间序列分析的主要目的是利用事物特征变量的历史和现状来推测未来可能出现的状况,即假设时间序列的基本特性必须能从过去维持到我们推测的时期,否则,基于历史和现状来预测未来将变得不可靠。时间序列的平稳性,简单理解是时间序列的基本特性维持不变,换句话说,所谓平稳性就是要求由样本时间序列所得到的曲线在未来的一段时期内仍能沿着现有的形态持续下去。金融领域很多变量之所以难以估计,是因为这些变量经常发生突变,不是平稳的时间序列。时间序列的平稳性是经典时间序列分析的基本假设前提,只有基于平稳的时间序列进行的预测才是有效的。平稳性有强平稳和若平稳之分,一般所说的平稳时间序列指的是若平稳时间序列。
时间序列平稳性的判断方法
通过时序图的图形观察和单位根检验可以判断时间序列是否平稳,具体如下:
(1)观察时间序列图的形状来初步判断其平稳性
根据弱平稳的定义,时间序列的均值和方差为常数,因此其时序图应该围绕某一水平线上下以大致相同的幅度波动。如果该时序图存在明显递增、递减或周期性波动,则该时间序列很可能是不平稳的。
(2)观察序列的自相关和偏自相关函数图对于平稳时间序列而言,其自相关或偏自相关系数一般会快速减小至0附近或者在某一阶后变为0,而非平稳的时间序列的自相关系数一般是缓慢下降而不是快速减小。
(3)单位根检验。通过观察时序图、自相关和偏自相关图来判断时间序列平稳性,可能出现因观察者对图形的判断不同而得出不同的结论,为了更加客观的考察时间序列的平稳性,引入统计检验方法,即单位根检验。常见的单位根检验方法有DF检验(Dickey-Fuller Test)、ADF检验(AuGMENTED Dickey-Fuller Test)和PP检验(Phillips-Perron Test)。关于单位根检验和DF、ADF、PP检验的公式原理此处不详细展开,可参考本科计量经济学教材的时间序列分析部分。
通过时序图的图形观察和单位根检验可以判断时间序列是否平稳,具体如下:
(1)观察时间序列图的形状来初步判断其平稳性
根据弱平稳的定义,时间序列的均值和方差为常数,因此其时序图应该围绕某一水平线上下以大致相同的幅度波动。如果该时序图存在明显递增、递减或周期性波动,则该时间序列很可能是不平稳的。
(2)观察序列的自相关和偏自相关函数图对于平稳时间序列而言,其自相关或偏自相关系数一般会快速减小至0附近或者在某一阶后变为0,而非平稳的时间序列的自相关系数一般是缓慢下降而不是快速减小。
(3)单位根检验。通过观察时序图、自相关和偏自相关图来判断时间序列平稳性,可能出现因观察者对图形的判断不同而得出不同的结论,为了更加客观的考察时间序列的平稳性,引入统计检验方法,即单位根检验。常见的单位根检验方法有DF检验(Dickey-Fuller Test)、ADF检验(AuGMENTED Dickey-Fuller Test)和PP检验(Phillips-Perron Test)。关于单位根检验和DF、ADF、PP检验的公式原理此处不详细展开,可参考本科计量经济学教材的时间序列分析部分。