Большинство инженеров скажут вам, что:

Вы не можете оптимизировать то, что вы не измеряете

Оказывается, что прогнозирование не является исключением. Измерение точности прогноза является одним из нескольких основных принципов любой технологии прогнозирования.

Частое заблуждение о измерении точности заключается в том, что Lokad должен ждать, пока прогнозы станут прошлым, чтобы наконец сравнить прогнозы с тем, что на самом деле произошло.

Однако этот подход работает до некоторой степени, но он имеет серьезные недостатки:

  • Это мучительно медленно: прогноз на 6 месяцев вперед занимает 6 месяцев для проверки.
  • Он очень чувствителен к переобучению. Переобучение не следует принимать на легкий рассчет, и это одна из немногих вещей, которая очень вероятно приведет к хаосу в измерениях точности.

Измерение точности доставленных прогнозов является сложной задачей для нас. Измерение точности составляет примерно половину сложности нашей технологии прогнозирования: чем более продвинута технология прогнозирования, тем больше необходимость в надежных измерениях точности.

В частности, Lokad возвращает точность прогноза, связанную с каждым отдельным прогнозом, который мы предоставляем (например, наш Excel-аддон сообщает точность прогноза). Метрикой, используемой для измерения точности, является MAPE (Mean Absolute Percentage Error).

Для вычисления приблизительной точности Lokad проходит (приблизительно) через кросс-валидацию, настроенную для прогнозов временных рядов. Кросс-валидация проще, чем кажется. Если мы рассмотрим еженедельный прогноз на 10 недель вперед с 3 годами (т.е. 150 недель) истории, то кросс-валидация будет выглядеть следующим образом:

  1. Возьмите первую неделю, сделайте прогноз на 10 недель вперед и сравните результаты с оригиналом.
  2. Возьмите первые две недели, сделайте прогноз на 10 недель вперед и сравните.
  3. Возьмите первые три недели, сделайте прогноз на 10 недель вперед и сравните.

Этот процесс довольно трудоемкий, так как мы вычисляем прогнозы около 150 раз всего за 3 года истории. Очевидно, что кросс-валидация требует автоматизации, и мало надежды пройти через такой процесс без поддержки компьютера. Тем не менее, компьютеры обычно стоят меньше, чем ошибки прогнозирования бизнеса, и Lokad полагается на облачные вычисления, чтобы выполнить такие вычисления высокой интенсивности.

Попытки “упростить” описанный процесс очень вероятно приведут к проблемам переобучения. Мы предлагаем быть очень осторожными, так как переобучение не является проблемой, которую следует принимать на легкий рассчет. В случае сомнений, придерживайтесь полной кросс-валидации.


Комментарии читателей (1)

Я хочу рассчитать точность прогноза по сравнению с продажами, где у меня есть один столбец с фактическими продажами и два других столбца с прогнозами. Мне нужно показать точность каждого прогноза по сравнению с фактическими продажами в процентах. Просто показать процентное отличие недостаточно (может быть от -200% до +200%, так как наши продавцы плохо прогнозируют), мне нужно показать точность в виде значения от 0% до 100%. 8 лет назад | acekard 2i