Функция потерь Pinball, также называемая потерей квантиля, является метрикой, используемой для оценки точности квантильного прогноза.
Оценка точности квантильного прогноза является сложной проблемой. Действительно, в отличие от классических прогнозов, где целью является максимальное приближение прогноза к наблюдаемым значениям, ситуация с квантильными прогнозами является смещенной (нарочно). Поэтому наивное сравнение наблюдаемых значений и прогнозов неудовлетворительно. Функция потерь Pinball возвращает значение, которое можно интерпретировать как точность модели квантильного прогнозирования.
Формула
Пусть $${\tau}$$ - целевой квантиль, $${y}$$ - реальное значение и $${z}$$ - квантильный прогноз, тогда $${L_\tau}$$, функция потерь Pinball, может быть записана следующим образом:
Скачать: pinball-loss-function.xlsx
В электронной таблице показано, как вычислить функцию потерь Pinball в Microsoft Excel. Фактическая формула не сложнее большинства показателей точности, таких как MAPE.
Иллюстрация
Функция потерь Pinball (красная линия) была названа так из-за своей формы, которая напоминает траекторию шара на пинболе. Функция всегда положительна, и чем дальше от цели $${y}$$, тем больше значение $${L_\tau(y,z)}$$. Наклон используется для отражения желаемого дисбаланса в квантильном прогнозе.
Лучшая модель квантиля имеет наименьшую функцию потерь Pinball
Самый важный результат, связанный с функцией потерь Pinball, заключается в том, что чем ниже функция потерь Pinball, тем более точен квантильный прогноз.
Таким образом, для сравнения относительной точности двух моделей квантиля (например, Lokad против других) достаточно вычислить среднюю функцию потерь Pinball каждой модели на достаточно большом количестве временных рядов, чтобы убедиться, что наблюдаемая разница является статистически значимой. На практике достаточно нескольких сотен временных рядов, чтобы определить, какая модель квантиля является наиболее точной.
Особенность Lokad
Предполагаемая простота понятия точности для классического прогноза (т.е. среднего прогноза) в большинстве случаев преувеличена, на наш взгляд. Прогнозы, как средние, так и квантильные, подвержены переобучению, что значительно усложняет сравнение моделей прогнозирования. Однако функция потерь Pinball представляет собой очень простой способ оценки относительной точности двух моделей квантильного прогнозирования.
Дополнительная литература
- Sequential Quantile Prediction of Time Series, март 2011 года, Жерар Био и Бенуа Патра, Информационная теория, транзакции IEEE
- Continuous Ranked Probability Score (CRPS), обобщение функции потерь Pinball для вероятностных прогнозов