替换时间序列的最后一行缺失值

赫利俄斯赫利俄斯 成员职位:2学我
大家好!

我只是想对我们公司的销售数字做一个简单的预测。我有一款产品从2012年到2020年的数据,我只是想预测2021年的销售数字,这样我就可以把它和实际的销售数字进行比较。

我只是不想用平均值或其他方法替换缺失的数字。试图用线性插值“替换缺失的数字(时间序列)”算子来做到这一点,但似乎无法替换缺失值的最后一行。我如何解决这个问题,或者我应该使用已知,决策树或神经网络来预测它?

如果我们设法预测数字,我也想比较方法的预测值。如果它是一个简单的解决方案(例如,很难理解和解释均方根误差),比较预测值与实数的接近程度,我会很感激。

也许我做错了所有的过程,但为你的答案,我仍在努力学习。




标记:

最佳答案

  • ceaperezceaperez 成员职位:434独角兽
    解决方案接受
    @Helios

    我给你两个简单的选择
    第一个是在替换缺失值操作符中检查“确保有限值”选项。
    第二种方法是使用一个简单的Arima模型来预测最后一个缺失值。
    附件是修改后的流程

    最好的

    塞萨尔

答案

  • 赫利俄斯赫利俄斯 成员职位:2学我
    @ceaperez谢谢你的回答,

    我查看了您发来的流程,非常感谢。

    对于“替换缺失值(时间序列)”操作符,即使我检查了确保无限值选项,它仍然会像最后一个值一样替换缺失值。所以它仍然不能作为线性插值工作或者我做错了什么。



    Arima模型运行得很好。我得到了这样的结果:



    但是我在ARIMA模型上工作,在我取消选择“估计常数”选项后,我得到了更接近真实值的结果,这是18.085。


    我不知道禁用估计常数选项是否是一个好决定,但我仍在寻找更好的或可选的模型。但是真的非常感谢@ceaperez

登录注册置评。