什么是ARIMAX模型?
如果您已经阅读了有关用于估计时间序列数据的模型的系列大数据分析培训课程python时间序列ARIMAX模型教程,则您已经熟悉3种主要方法- 自回归,移动平均值和积分。
所有这些模型的共同主题是什么?
他们仅依靠一个变量。
但是,模型还可以考虑的不仅仅是过去的价格或过去的残差。
这些就是所谓的“ MAX”模型,ARMAX是非集成版本,而ARIMAX是其集成等效版本。
因此,在大数据分析培训课程python时间序列ARIMAX模型中,我们将探索它们的外观,并逐步向您展示如何将其实现到Python中。
让我们开始吧,好吗?
为什么将ARMAX和ARIMAX称为“ MAX”模型?
名称ARMAX和ARIMAX 分别是ARMA和ARIMA的扩展。添加到末尾的X代表“外源”。换句话说,它建议添加一个单独的不同外部变量以帮助测量我们的内生变量。
ARMAX和ARIMAX模型方程式:
由于ARMAX和ARIMAX之间的唯一区别在于两者是集成的,而另一方则没有,因此我们可以检查其中之一,然后强调另一方的差异。
我们在上一篇大数据分析培训课程python时间序列ARIMA模型文章(ARIMA)中探讨了集成模型,因此让我们看一下ARIMAX的方程是什么样的。
ΔP 吨 = C +βX+φ 1个 ΔP T-1 +θ 1 ε T-1 +ε 吨
当然,除了我们将使用实际变量(例如P)而不是其增量之外,ARMAX的方程式是相同的。
P 吨 = C +βX+φ 1个 P T-1 +θ 1 ε T-1 +ε 吨
分解ARIMAX方程:
我们可以将ARMAX视为ARIMAX的特例,其积分阶数为0。
因此,在大数据分析培训课程python时间序列ARIMAX模型的其余部分中,我们将专注于ARIMAX。
我们将从分解其中的不同部分开始。
对于启动器,P t和P t-1分别表示当前时段和1时段之前的值。
类似地,ϵ t和ϵ t-1是相同两个周期的误差项。当然,c只是一个基线常数因子。
的两个参数,φ 1和θ 1,表示是什么值P的部分T-1和误差ε T-1最后一个周期是在估计当前一个相关。
现在,模型的两个新增加项是“ X”及其系数β。就像ϕ一样,β是一个系数,它将根据模型选择和数据进行估算。但是X呢?
什么是外生变量?
好吧,X是外生变量,它可以是我们感兴趣的任何变量。
它可以是随时间变化的度量,例如通货膨胀率或其他指数的价格。或分隔一周中不同日期的分类变量。对于特殊的节日,它也可以是布尔值。最后,它可以代表多种不同外部因素的组合。
这个想法是,只要我们有可用的数据,它就可以是任何其他可以影响价格的变量。
这些外部因素在我们的回归分析中称为外生变量。我们使用它们的值来预测和解释我们感兴趣的值,在我们的案例中恰好是当前价格。
如何在Python中实现ARMAX和ARIMAX模型?
足够方便的是,statsmodels包附带了一种称为ARIMA的方法,该方法完全能够处理此类附加输入。
我们首先指定模型特征和模型顺序:
完成之后,我们还需要指定称为“ exog”的外部参数。
我们希望传递的值必须是某种数组,因为我们希望具有与每个时间段关联的值。
例如,我们可以将标准普尔价格用作该外生变量,因为我们已经在数据中包含了它们。
现在,我们准备适合ARIMAX(1,1,1)模型。
确保以与其他模型不同的方式命名模型变量。在这种情况下,我们选择通过在末尾添加“ X,spx”来表示外部变量是标准普尔。
然后,从片段中可以看出,我们像以前一样将此值设置为等于ARIMA方法,我们像往常一样添加了时间序列和顺序。最后,在两者之间,我们将“ exog”参数设置为等于“ DF SPX”,这表示标普价格。
如果我们拟合此模型并打印其汇总表,我们将看到我们在标准普尔价格中又得到一行。
这就是全部!
我们已经成功地看到了如何在Python中实现ARIMAX模型。
如果您想了解更多关于ARIMAX和其他Python时间序列模型的信息,请务必查看我们的逐步Python教程。
如果您不熟悉Python,并且热衷于了解更多信息,那么这篇有关学习Python编程的综合文章将指导您从安装到Python IDE,库和框架,再到最佳Python职业发展道路,以及工作前景。
准备好迈向数据科学事业的下一步了吗?
立即查看完整的大数据分析培训课程。从我们的统计,数学和Excel课程开始,从基础知识入手。使用SQL,Python,R,Power BI和Tableau逐步积累经验。并通过Python中的机器学习,深度学习,信用风险建模,时间序列分析和客户分析来升级您的技能。你还可以联系在线客服小姐姐申请试听大数据分析培训课程。
摘自:https://www.aaa-cg.com.cn/data/2444.html