Симметричная средняя абсолютная процентная ошибка

Статистическая точность измерения

Симметричная средняя абсолютная процентная ошибка (SMAPE или sMAPE) — это мера точности, основанная на процентных (или относительных) ошибках. Обычно она определяется [ требуется цитата ] следующим образом:

СМЭПЕ = 100 н т = 1 н | Ф т А т | ( | А т | + | Ф т | ) / 2 {\displaystyle {\text{SMAPE}}={\frac {100}{n}}\sum _{t=1}^{n}{\frac {\left|F_{t}-A_{t}\right|}{(|A_{t}|+|F_{t}|)/2}}}

где A t — фактическое значение, а F t — прогнозируемое значение.

Абсолютная разница между A t и F t делится на половину суммы абсолютных значений фактического значения A t и прогнозируемого значения F t . Значение этого расчета суммируется для каждой подобранной точки t и снова делится на количество подобранных точек  n .

Самая ранняя ссылка на подобную формулу, по-видимому, принадлежит Армстронгу (1985, стр. 348), где она называется "скорректированная MAPE " и определяется без абсолютных значений в знаменателе. Позднее она была обсуждена, изменена и повторно предложена Флоресом (1986).

Первоначальное определение Армстронга было следующим:

СМЭПЕ = 1 н т = 1 н | Ф т А т | ( А т + Ф т ) / 2 {\displaystyle {\text{SMAPE}}={\frac {1}{n}}\sum _{t=1}^{n}{\frac {\left|F_{t}-A_{t}\right|}{(A_{t}+F_{t})/2}}}

Проблема в том, что он может быть отрицательным (если ) или даже неопределенным (если ). Поэтому в настоящее время принятая версия SMAPE предполагает абсолютные значения в знаменателе. А т + Ф т < 0 {\displaystyle A_{t}+F_{t}<0} А т + Ф т = 0 {\displaystyle A_{t}+F_{t}=0}

В отличие от средней абсолютной процентной ошибки , SMAPE имеет как нижнюю, так и верхнюю границу. Действительно, формула выше дает результат от 0% до 200%. Однако процентную ошибку от 0% до 100% гораздо легче интерпретировать. Вот почему формула ниже часто используется на практике (т.е. без коэффициента 0,5 в знаменателе):

СМЭПЕ = 100 н т = 1 н | Ф т А т | | А т | + | Ф т | {\displaystyle {\text{SMAPE}}={\frac {100}{n}}\sum _{t=1}^{n}{\frac {|F_{t}-A_{t}|}{|A_{t}|+|F_{t}|}}}

В приведенной выше формуле, если , то t-й член в сумме равен 0, поскольку процентная ошибка между ними явно равна 0, а значение не определено. А т = Ф т = 0 {\displaystyle A_{t}=F_{t}=0} | 0 0 | | 0 | + | 0 | {\displaystyle {\frac {|0-0|}{|0|+|0|}}}

Одна из предполагаемых проблем с SMAPE заключается в том, что она не симметрична, поскольку пере- и недопрогнозы не обрабатываются одинаково. Это иллюстрируется следующим примером применения второй формулы SMAPE :

  • Перепрогнозирование: A t = 100 и F t = 110 дают SMAPE = 4,76%
  • Недооценка: при t = 100 и F t = 90 получаем SMAPE = 5,26%.

Однако такого типа симметрии следует ожидать только для мер, которые полностью основаны на разнице, а не на относительности (например, средняя квадратическая ошибка и среднее абсолютное отклонение).

Существует третья версия SMAPE, которая позволяет измерять направление смещения в данных, генерируя положительную и отрицательную ошибку на уровне позиции. Кроме того, она лучше защищена от выбросов и эффекта смещения, упомянутого в предыдущем абзаце, чем две другие формулы. Формула выглядит так:

СМЭПЕ = т = 1 н | Ф т А т | т = 1 н ( А т + Ф т ) {\displaystyle {\text{SMAPE}}={\frac {\sum _{t=1}^{n}\left|F_{t}-A_{t}\right|}{\sum _{t=1}^{n}(A_{t}+F_{t})}}}

Ограничением SMAPE является то, что если фактическое значение или прогнозируемое значение равно 0, значение ошибки резко возрастет до верхнего предела ошибки (200% для первой формулы и 100% для второй формулы).

При условии, что данные строго положительны, можно получить более точную меру относительной точности на основе логарифма отношения точности: log( F t / A t ). Эту меру легче анализировать статистически, и она обладает ценными свойствами симметрии и несмещенности. При использовании в построении моделей прогнозирования полученный прогноз соответствует среднему геометрическому (Tofallis, 2015).

Смотрите также

Ссылки

  • Армстронг, Дж. С. (1985) Долгосрочное прогнозирование: от хрустального шара до компьютера, 2-е изд. Wiley. ISBN  978-0-471-82260-8
  • Флорес, Б. Э. (1986) «Прагматический взгляд на измерение точности в прогнозировании», Omega (Оксфорд), 14(2), 93–98. doi :10.1016/0305-0483(86)90013-7
  • Tofallis, C (2015) «Лучшая мера относительной точности прогнозирования для выбора и оценки модели», Журнал общества операционных исследований, 66(8),1352-1362. архивный препринт
  • Роб Дж. Хайндман: Ошибки в процентах ошибок
Получено с "https://en.wikipedia.org/w/index.php?title=Симметричная_средняя_абсолютная_процентная_ошибка&oldid=1161522045"