云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

中间件_oracle数据库是什么_企业级

小七 141 0

本博客是"SAP Analytics Cloud Smart Predict in Detail中的时间序列预测"的扩展。我建议你在继续之前先看一下。今天我将向你展示如何通过使用额外的变量来提高预测的准确性。它是关于一家公司的差旅费和开支。财务总监认为这些成本太高。它们对公司的财务业绩有负面影响。有两个目标。首先是成本分析,以了解在哪些方面可以降低成本。第二是更好地预测未来成本,避免预算超支。

解决时间序列问题意味着预测被测变量的演变。如果可能,Smart Predict会使用其他变量。这样,智能预测可以更精确地分析信号。其效果是提高了预测模型的质量,淘客返利系统,进而提高了预测结果。在下一节中,为了说明这一点,

我将建立两个预测模型。我就用这个信号来建立第一个模型。对于第二个模型,我将向数据模型中添加候选影响者。然后我将比较结果以证明改进。

设置和训练

我首先创建一个时间序列预测场景。我添加了一个包含旅行和费用成本的第一个预测模型。信号变量是总的旅行成本。日期变量是这些成本的过帐日期。数据集在可变业务线(LOB)上进行分段。然后我选择排除所有其他变量。您可以在图1中看到下面的设置

图1:建立没有候选影响者的预测模型的设置

然后保存模型并进行训练

然后复制第一个模型。我更改它的设置以添加候选影响者。为此,我停止排除变量。设置如图2所示。

图2:用候选影响者建立预测模型的设置

模型也被保存和训练。

候选影响者

通常,数据集不只包含信号。其他变量也在同一时期被捕获,因为人们认为其他变量可能很重要。为过去、现在和未来的值收集这些变量可以带来额外的信息,这将有助于创建更好的模型。

在这个用例中,时间维度是成本的过账日期。利息的变量是成本。但还有其他变量。我把他们分成两组:

工作天数,假日月份,月度和季度结算日,每月的第一天和最后一天每周或每周的排名天数年终。

这是您对应用领域的知识,将指导您选择能够影响模型生成的变量。

智能预测使用这些候选影响因素来增加对信号趋势和周期的检测。它想要的是更好地描述这些组件。请记住,候选人影响者的未来价值必须是已知的(至少在预期的范围内)。趋势和周期描述越精确,预测就越好,如何获得大数据,置信区间也越小。

我比较了每个模型简报中提供的结论。目的是检查质量是否有改进,以及改进的地方。这种比较的结果将指导选择要保留的模型。让我们回顾一下这三种指标

地平线地图

有关地平线地图的定义,租用服务器,物联网企业,请参阅博客。请注意,我的云,视界宽度MAPE越小,预测值应越好。

当您查看两个模型的汇报时,HW-MAPE如图3所示。

图3:地平线范围MAPE的比较

这两个预测模型的差异表明,在信号分析过程中考虑额外变量时,HW-MAPE增加了22%。

不同LOB之间的旅行成本不同。因此,历史数据集是在LOB变量上分段的。最好为每个LOB建立一个特定的预测模型,这样高活动度的预测模型就不会影响那些活动度降低的预测模型。在每个模型的汇报中,我们可以看到(图4)每个段的单个水平宽度图。

图4:每个段水平宽度图的比较

除了三个LOB外,所有模型的精度都显著提高。以附加变量的形式添加知识有助于获得更精确的模型。但效果无法保证。这种影响的强度因不同的部分而异。一个变量对某些细分市场的影响比其他细分市场更大,Smart Predict可以检测出哪些是每个细分市场的影响因素变量。

趋势和周期

如果考虑到候选影响因素,可以改进趋势和周期的检测。让我们看看这对两段的影响。

段"操作"

图5:趋势检测的改进

当只有信号时,检测到的趋势是一条递减的直线。但是,当候选影响因素被添加时,检测到的趋势更倾向于信号。下降至2016年1月,并在

段"销售和营销"

图6:周期检测的改进

在该段,候选影响因素不影响趋势检测。在两个模型中都检测到趋势。但是,当单独分析信号时,没有检测到周期时,当添加候选影响因素时,就会发现一个周期。

这就是这两个部分的模型质量提高的原因。信号成分的检测和表征越好,预测模型的准确性越好。

置信区间

置信区间的定义是,它来自预测值和实际值之间的差异。让我们来精确地计算它。