Точность прогнозирования спроса
В статистике точность прогноза определяется степенью близости заявленного количества к его фактическому (истинному) значению. Фактическое значение обычно невозможно измерить в момент составления прогноза, поскольку утверждение относится к будущему. Для большинства компаний более точные прогнозы повышают их эффективность в удовлетворении спроса, одновременно снижая общие операционные расходы.
Использование оценок точности
Вычисленная точность предоставляет количественную оценку ожидаемого качества прогнозов. Для оптимизации запасов оценка точности прогнозов может служить нескольким целям:
- выбрать среди нескольких моделей прогнозирования, предназначенных для оценки спроса за время поставки, которую следует отдать предпочтение.
- вычислить резервный запас, как правило, при условии, что ошибки прогноза следуют нормальному распределению.
- приоритизировать товары, требующие наибольшего внимания, поскольку сырые статистические прогнозы недостаточно надежны.
В других контекстах, таких как стратегическое планирование, оценки точности используются для поддержки анализа «что если», с учетом различных сценариев и их вероятностей.
Влияние агрегирования на точность
Распространённое заблуждение — трактовать качество модели прогнозирования как основной фактор, определяющий точность прогнозов: это не так.
Наиболее важным фактором, влияющим на точность прогнозов, является внутренняя волатильность прогнозируемого явления. На практике, в торговле или производстве, эта волатильность тесно коррелирует с уровнем агрегирования:
- более крупные области, такие как национальные прогнозы по сравнению с местными, обеспечивают большую точность.
- то же самое для более длительных периодов, например, месячные прогнозы по сравнению с дневными.
Затем, когда уровень агрегирования определён, качество модели прогнозирования действительно играет основную роль в достижимой точности. Наконец, точность снижается при прогнозировании на более дальние сроки.
Эмпирическая точность против реальной точности
Термин точность чаще всего используется в отношении качества какого-либо физического измерения. К сожалению, такое понимание несколько вводит в заблуждение, когда речь идёт о статистическом прогнозировании. Действительно, в отличие от физических измерений, где результат можно сравнить с альтернативными методами, реальная точность прогноза должна строго измеряться на основании данных, которых у вас нет.
Действительно, как только данные становятся доступны, всегда можно составить абсолютно точные прогнозы, так как для этого достаточно скопировать данные. Этот единственный вопрос озадачил статистиков более века, поскольку удовлетворительная интерпретация была найдена лишь в конце 20-го века с появлением теории Vapnik–Chervonenkis1.
Точность прогнозов может быть практически измерена только по доступным данным; однако, когда данные доступны, эти прогнозы перестают быть настоящими прогнозами, поскольку представляют собой описание прошлого, а не будущее. Таким образом, эти измерения называют эмпирической точностью, в противоположность реальной точности.
Переобучение может привести к большим расхождениям между эмпирической точностью и реальной точностью. На практике правильное использование ретроспективного тестирования может смягчить большинство проблем переобучения при прогнозировании временных рядов.
Популярные метрики точности
Существует множество метрик для измерения точности прогнозов. Наиболее широко используемыми являются:
- MAE (средняя абсолютная ошибка)
- MAPE (средняя абсолютная процентная ошибка)
- MSE (среднеквадратичная ошибка)
- sMAPE (симметричная средняя абсолютная процентная ошибка)
- Pinball loss (обобщение MAE для квантильных прогнозов)
- CRPS (обобщение MAE для вероятностных прогнозов)
На практике, одна метрика должна быть предпочтительнее другой, исходя из её способности отражать затраты, которые несёт компания из-за неточностей прогнозов.
Ловушка Lokad
Лучше быть приблизительно правильным, чем точно ошибаться. По нашему опыту работы с торговыми или производственными компаниями, мы регулярно наблюдаем, что слишком мало внимания уделяется выбору метрики точности.
Действительно, идеальная метрика не должна возвращать значения, выраженные в процентах, а должна возвращать сумму в долларах или евро, точно отражая стоимость неэффективности, вызванной неточными прогнозами. В частности, в то время как большинство популярных метрик являются симметричными (значительным исключением является pinball loss), риски переоценки и недооценки прогнозов на практике не симметричны. Мы предлагаем принять точку зрения, при которой метрика ближе к экономической функции затрат – тщательно смоделированной с учётом бизнес-ограничений – а не просто к сырому статистическому индикатору.
Кроме того, крайне важно не проводить планирование, подразумевая, что прогнозы являются точными. Неопределённость неизбежна в бизнесе и должна быть учтена.
Дополнительное чтение
- Видео. Точность в прогнозировании продаж, Matthias Steinberg, сентябрь 2011
- Лучшая метрика ошибки прогноза, Joannes Vermorel, ноябрь 2012
- Финансовое влияние точности на запасы, Joannes Vermorel, февраль 2012
Заметки
-
Википедия. Теория Vapnik–Chervonenkis ↩︎