Понятие точности прогнозирования является тонким, действительно тонким. Кажется, что если прогнозы на будущее ближе, то лучше, но здравый смысл может быть совершенно неправильным.

С запуском Shelfcheck, нашим оптимизатором доступности товара на полке, мы начали обрабатывать гораздо больше данных на уровне точек продаж, пытаясь автоматически обнаруживать проблемы с отсутствием товара на полке (OOS). За последние несколько месяцев наше знание о шаблонах OOS значительно улучшилось, и сегодня это знание перерабатывается в нашу основную технологию прогнозирования.

Давайте проиллюстрируем ситуацию. Ниже приведен график ежедневных агрегированных продаж на уровне магазина для определенного товара. Магазин открыт 7 дней в неделю. Прогноз на семь дней составляется в конце второй недели, но в середине третьей недели происходит OOS. Дни, отмеченные черными точками, имеют нулевые продажи.

В этой ситуации прогноз достаточно точен, но из-за проблемы с отсутствием товара на полке прямое сравнение продаж и прогнозов выглядит так, будто прогноз существенно переоценивает продажи, что не является правдой, по крайней мере, не в дни без OOS. Измерение переоценки является артефактом, вызванным самим OOS.

Пока кажется, что OOS может только ухудшить воспринимаемую точность прогнозирования, что не кажется слишком плохим, потому что предположительно все методы прогнозирования должны быть одинаково затронуты. В конце концов, ни одна модель прогнозирования не способна предвидеть проблему с отсутствием товара на полке.

Что ж, OOS может нанести гораздо больший вред, чем просто ухудшить точность прогнозирования, OOS также может улучшить ее.

Давайте посмотрим на график, чтобы проиллюстрировать это. Опять же, мы смотрим на данные о ежедневных продажах, но на этот раз проблема с отсутствием товара на полке начинается в самый последний день второй недели.

Прогноз на третью неделю равен нулю на всю неделю. Прогнозирующая модель предвидит продолжительность проблемы с отсутствием товара на полке. Прогноз не является полностью точным, потому что в последний день третьей недели происходит пополнение и продажи снова становятся ненулевыми.

Очевидно, что прогнозирующая модель, которая предвидит продолжительность проблемы с отсутствием товара на полке, является крайне точной с точки зрения числового сравнения продаж и прогнозов. Однако это действительно имеет смысл? Нет, очевидно, что нет. Мы хотим прогнозировать спрос, а не артефакты продаж. Более того, нулевой прогноз может привести к нулевому пополнению, что, в свою очередь, продлит фактическую продолжительность проблемы с отсутствием товара на полке (и дальше увеличит точность нашей модели прогнозирования, которая так полюбила OOS). Это явно не желательная ситуация, независимо от того, насколько хорош прогноз с наивной числовой точки зрения.

Плохой случай переобучения OOS

Мы обнаружили, что ситуация, иллюстрируемая второй графикой, далека от обычной. Действительно, с 8% недоступности на полке (типичная цифра для розницы) и примерно 30% MAPE на ежедневные прогнозы, ситуации с отсутствием товара на полке обычно составляют 8% x 100 / 30 ≈ 27% ≈ 1/4 от общей ошибки прогнозирования. Действительно, по определению MAPE, ненулевой прогноз в день без продаж (OOS) генерирует ошибку в 100%.

Поскольку доля ошибки, вызванной OOS, значительна, мы обнаружили, что простой эвристический подход, такой как “если в последний день нет продаж у популярного товара, то прогнозируйте отсутствие продаж в течение 7 дней”, может снизить ошибку прогнозирования на несколько процентов, напрямую используя шаблон OOS. Очевидно, что очень мало практиков явно включают такое правило в свои модели прогнозирования, но даже умеренно сложная линейная авторегрессионная модель может выучить этот шаблон в значительной степени и, таким образом, переобучиться на OOS.

Естественно, Shelfcheck здесь, чтобы помочь в этих вопросах с OOS. Следите за обновлениями.


Комментарии читателей (2)

Привет Ларс, Спасибо за ваше продолжение. На уровне магазина все очень шумно. Представьте, что 1 или 2 единицы проданы в день на каждый товар - это типичный случай. Ценообразование, конечно, важно, но на практике на уровне магазина очень сложно точно оценить влияние 5% корректировки цены для конкретного товара. Однако акции (которые также являются эффектом ценообразования, хотя и большим) действительно имеют очень измеримые эффекты даже на уровне магазина. Затем Shelfcheck интегрирует ежедневную информацию о ценах. Однако мы обнаружили, что в сфере пищевых продуктов и напитков очень вероятно значительно превзойти (с точки зрения прогнозирования) точность существующих систем, не используя информацию о ценах. Однако я не говорю, что информация о ценах бесполезна, а просто о том, что вам не нужно ее использовать, чтобы значительно улучшить каждую отдельную настройку, которую мы наблюдали до сих пор в розничной отрасли. Затем в будущем ценообразование, а также детализированные данные о лояльности станут все более важными для поддержания конкурентоспособности на рынке прогнозирования. 6 лет назад | Йоанн Верморель


Привет, в сфере пищевых продуктов и напитков фактическое количество проданных товаров часто имеет сильную корреляцию с фактической ценой продажи. Это часто моделируется с использованием индекса эластичности цены = % изменения количества / % изменения цены. По моему опыту одномерное статистическое прогнозирование, которое рассматривает только фактическое количество проданных товаров без учета фактической средней цены, становится довольно бесполезным = полная трата времени. Вы согласны с этим, и каково ваше мнение по этому поводу? 6 лет назад | Ларс