时间序列 - 错误度量

量化模型的性能以将其用作反馈和比较对我们来说很重要。 在本教程中,我们使用了最流行的误差度量均方根误差之一。 还有各种其他可用的错误指标。 本章简要讨论它们。


均方误差

它是预测值和真实值之间差异的平方的平均值。 Sklearn 将其作为函数提供。 它与真实值和预测值的平方具有相同的单位,并且始终为正。

$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$

其中 $y'_{t}$ 是预测值,

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

从等式中可以清楚地看出,MSE 对较大的错误或异常值的惩罚更大。


均方根误差

它是均方误差的平方根。 它也总是积极的,并且在数据的范围内。

$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$

其中,$y'_{t}$ 是预测值

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

它具有统一的力量,因此与 MSE 相比更易于解释。 RMSE 对更大的错误也有更多的惩罚。 我们在教程中使用了 RMSE 度量。


平均绝对误差

它是预测值和真实值之间绝对差的平均值。 它具有与预测值和真实值相同的单位,并且始终为正。

$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$

其中,$y'_{t}$ 是预测值,

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。


平均百分比误差

它是预测值和真实值之间绝对差的平均值除以真实值的百分比。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$

其中,$y'_{t}$ 是预测值,

$y_{t}$ 是实际值,n 是测试集中值的总数。

但是,使用这种误差的缺点是正误差和负误差可以相互抵消。 因此使用平均绝对百分比误差。


平均绝对百分比误差

它是预测值和真实值之间绝对差的平均值除以真实值的百分比。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$

其中 $y'_{t}$ 是预测值

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。