大家以前会听说过AR模型、MA模型、ARMA模型、ARIMA模型,这些到底是什么呢?今天来简易讲解一下,顺便用sas实操一下,由于本文是基于自己学习的归纳总结,若有讲得不对的地方,也希望读者指出,会及时修改。
首先以往的回归模型只能描述出长期的发展趋势,对于局部的循环变动是无法描述的,比如回归就不能解决自回归的情况,自回归指的就是这一时间取值取决前一段时间某些值。很明显我们需要特定的模型来更好的预测及描述这种周期性及自回归的情况,可以看下图使用回归模型来预测是不太好的。
上面说了我们需要一个模型来模拟这种情况,那这个模型应该有哪些因素组成呢
长期趋势(T)季节变动(S)循环变动(C)不规则变动(I)其中季节变动(S)及循环变动(C)时间周期长短有差别,循环变动周期较长,而且有时周期也不固定
我们常考虑两种模型
加法模型(常用):Y=T+S+C+I(四种元素相互独立),一般使用它的时候,整个流程图大概如下
乘法模型:Y=T*S*C*I(元素间并非相互独立,影响会放大或缩小)
一般时间序列模型我们平常只要应用得最多就是平稳时间序列模型,对于平稳时间序列在数学上有比较丰富的处理手段,非平稳的时间序列通过差分等手段转化为平稳时间序列处理。
如何判定为平稳时间序列模型?
随机变量Y t 的均值和方差均与时间t无关随机变量Y t 和Y s 的协方差只与时间差(步长)t-s有关上面是比较官网的描述,我们可以大概看一下图形,图形平均值大概在一条水平线上,以及能用一个长方形框柱图形就行
比如下面这张图都是平稳
下面这种很明显有递增趋势的就很明显不是平稳的序列,后续要使用差分转换为平稳的时间序列模型
在统计分析时,一个时间序列是否平稳可以通过观察它的自相关系数进行判断。如果它的自相关系数随着滞后期的增加迅速收敛于0附近,这个时间序列就很可能是平稳的。如果它的自相关系数随着滞后期的增加虽然逐渐减小,但减小幅度很小,很长时间也没收敛到0附近,那么这个时间序列就很可能是不平稳的。通过对自相关系数的观察我们可以得到一个大概的估计,但这不是一个严谨的科学结论或统计学结论。
在统计学中,判断一个时间序列是否平稳,可通过运行ADF检验可以得到检验统计二值和其对应的检验概率的P值。通过将二值与对应的临界值比较,当它大于临界值时,我们就接受这是一个平稳的时间序列的假设。r值对应的P值则表示这个时间序列是非平稳的概率,也就是P值越接近0,序列越可能是平稳的。一般情况下,当P值小于0.05或0.1时,我们就认为这是一个平稳的时间序列。
由简单到复杂,大概有四种:
白噪声模型自回归模型(AR)
P为阶数,与之前多少历史值有关
滑动平均模型(MA)
q为白噪声阶数
自回归滑动平均模型(ARMA)
可以通过差分,把增长趋势消掉变为平稳时间序列,就是下面的d阶差分,之后再使用处理平稳时间序列的方法ARMA解决,合起来就是ARIMA模型,ARIMA(p,d,q)当d=0即不用差分时,就是ARMA(p,q)模型
首要问题是识别模型的阶数(也就是上面模型提到的p、q),识别主要通过自相关函数(系数)和偏自相关函数(系数)
自相关系数:
偏相关系数(偏自相关函数):
根据上面的自相关系数和偏自相关系数,选择以下模型(下面三个都为平稳的)
截尾和拖尾怎么看:
截尾到达某一阶数后突然降于0附近
拖尾会慢慢趋向于0,但是不会突然降到0
当然啦有一些拖尾和截尾不是很好判断,我们就可以拟合多个模型,来选最优一个,一般根据AIC及BIC(SBC)指标选择
对于以下这种要注意变化幅度特别小的,可能就为非平稳时间序列了,要先差分转换为平稳时间序列
模型拟合(求出参数)
模型诊断(是否通过检验)
检验残差是否为白噪声(为白噪声说明我们把内部规律已经提取完了,剩下来的为随机干扰无研究意义)及残差正态检验
当我们通过模型识别、模型拟合、模型诊断后我们就可以运用模型来预测了