С момента нашего крупного обновления Тегов+Событий прошлой осенью мы активно работаем над прогнозированием продвижения в рознице. У нас теперь тысячи акций в нашей базе данных, и анализ этих акций привел нас к очень интересным результатам.

Кроме того, неудивительно, что мы обнаружили, что:

  • прогнозы продвижения, выполняемые вручную практиками, обычно содержат ошибки прогноза свыше 60% в среднем. Ваш опыт может отличаться, но типичные ошибки прогноза продаж в рознице обычно составляют около 20%.
  • включение данных о продвижении через теги и события снижает среднюю ошибку прогноза примерно на 50%. Опять же, ваш опыт может отличаться в зависимости от объема данных о ваших акциях.

Как менее очевидный результат, мы также обнаружили, что правила и линейные методы, хотя и широко рекламируются некоторыми экспертами и программными инструментами, очень слабы против переобучения и могут исказить оценку ошибки прогноза, создавая ложное впечатление о производительности в прогнозировании продвижения.

Также обратите внимание, что это улучшение на 50% было достигнуто обычно с довольно ограниченным количеством информации, обычно не более 2 или 3 двоичных описателей на акцию.

Даже грубые данные о ваших акциях приводят к значительному улучшению прогноза, что приводит к существенным экономиям оборотного капитала.

Первый шаг к улучшению прогнозов продвижения состоит в сборе точных данных о продвижении. По нашему опыту, этот шаг является самым сложным и самым затратным. Если у вас нет точных записей о ваших акциях, то мало надежды получить точные прогнозы. Как говорят, мусор на входе, мусор на выходе.

Однако мы заметили, что даже один описатель акции, двоичная переменная, которая просто указывает, продвигается ли товар в данный момент или нет, может привести к значительному улучшению прогноза. Таким образом, хотя ваши записи должны быть точными, они не должны быть подробными, чтобы улучшить ваши прогнозы.

Поэтому мы рекомендуем вам точно отслеживать время проведения ваших акций: когда они начались? когда они закончились? Обратите внимание, что для электронной коммерции отображение на главной странице часто имеет эффект, сравнимый с продвижением товара, поэтому вам нужно отслеживать изменение вашей главной страницы.

Затем важно описание товара. На самом деле, по нашему опыту, даже самые часто продвигаемые товары не будут иметь более десятка акций за всю свою рыночную жизнь. В среднем количество известных прошлых акций для данного товара ничтожно мало, варьируя от нуля до одной прошлой акции в среднем. В результате, нельзя ожидать надежных результатов, сосредотачиваясь на прошлых акциях одного продукта за раз, потому что большую часть времени их просто нет.

Поэтому вам нужно сосредоточиться на товарах, которые похожи на товар, который вы планируете продвигать. С помощью Lokad вы можете сделать это, присваивая теги вашим продажам. Обычно розничные компании используют иерархию для организации своего каталога. Представьте иерархию товаров семьями, подсемьями, товарами, вариантами и т. д.

Преобразование иерархического каталога в теги можно сделать довольно просто, следуя процессу, иллюстрированному ниже для вымышленного продавца конфет:

Теги, связанные с историей продаж средних леденцов с лимонным вкусом, будут LOLLIPOPS, LEMON, MEDIUM

В результате этого процесса обычно создается от 2 до 6 тегов на каждый товар в вашем каталоге - в зависимости от сложности вашего каталога.

Мы сказали, что даже очень ограниченная информация о ваших акциях может быть использована для улучшения прогнозов продаж прямо сейчас. Однако более детальная информация о акциях явно улучшает точность прогнозов.

Мы обнаружили, что два элемента очень ценны для улучшения точности прогнозов:

  • механизм, описывающий характер предлагаемой скидки вашим клиентам. Типичные механизмы - это фиксированная скидка (например, -20%), но существует много других механизмов, таких как бесплатная доставка или скидка при покупке большего количества (например, купи один и получи второй бесплатно).
  • коммуникация, описывающая, как ваши клиенты узнают о акционном мероприятии. Обычно коммуникация включает маркетинговые операции, такие как радио, газеты или местные объявления, а также индивидуальную упаковку (если есть) и видимость продвигаемых товаров в точках продажи.

В случае сетей распространения также следует описать общую доступность акции, если товары не продвигаются повсюду. Такая ситуация обычно возникает, если менеджеры точек продаж могут отказаться от акционных операций.

Общаясь с профессионалами, мы обнаружили, что многие розничные компании ожидают, что Lokad создаст набор правил, которые будут объяснять акции, такие как

ЕСЛИ РЕКЛАМА НА ТЕЛЕВИЗОРЕ И СКИДКА 25% 
ТОГДА ПРОДАЖИ_АКЦИИ = 5 * ОБЫЧНЫЕ_ПРОДАЖИ;

По сути, эти ожидаемые правила всегда следуют примерно одним и тем же шаблонам:

  • Набор бинарных условий, определяющих область применения правила.
  • Набор линейных коэффициентов для оценки эффекта правила.

Мы обнаружили, что на рынке программного обеспечения доступно множество инструментов, которые помогут вам открыть эти правила в ваших данных, что, кажется, заставило многих людей считать, что это единственный доступный подход.

Однако, согласно нашим экспериментам, методы на основе правил далеки от оптимальности. Более того, эти правила очень слабы против переобучения. Эта слабость часто приводит к болезненным ситуациям, когда есть значительный разрыв между оцененной точностью прогнозов и реальной точностью прогнозов.

Переобучение - это очень тонкое, и в то же время очень важное явление в статистическом прогнозировании. В основе проблемы прогнозирования лежит то, что вы хотите построить модель, которая очень точно предсказывает данные, которых у вас нет.

В частности, статистическая теория показывает, что возможно создать модели, которые оказываются очень точными при применении к историческим данным, но все же очень неточными при прогнозировании будущего. Проблема в том, что на практике, если вы не тщательно продумываете проблему переобучения заранее, построение такой модели - это не просто возможность, а наиболее вероятный результат вашего процесса.

Таким образом, вам действительно необходимо оптимизировать свою модель по данным, которых у вас нет. Однако, эта проблема выглядит как полный парадокс, потому что, по определению, вы не можете измерить что-либо, если у вас нет соответствующих данных. И мы обнаружили, что многие профессионалы отказываются от этой проблемы, потому что это все равно не выглядит как решаемая задача.

Наш совет: НЕ СДАВАЙТЕСЬ

Основная проблема с этими правилами заключается в том, что они слишком хорошо справляются с историческими данными. Каждое добавленное правило механически уменьшает прогностическую ошибку, которую вы измеряете на своих исторических данных. Если вы добавите достаточно правил, вы получите видимую практически нулевую ошибку прогнозирования. Однако, эмпирическая ошибка, которую вы измеряете на своих исторических данных, является результатом процесса, используемого для построения правил в первую очередь. Нулевая ошибка прогнозирования на исторических данных не превращается в нулевую ошибку прогнозирования на будущие продвижения. На самом деле, такие модели обычно показывают очень плохие результаты на будущие продвижения.

Хотя, оптимизация для данных, которых у вас нет, является сложной задачей, статистическая теория обучения предлагает как теоретическое понимание, так и практические решения этой проблемы. Центральная идея заключается во введении понятия минимизации структурного риска, которая балансирует эмпирическую ошибку.

Об этом будет рассказано в следующей статье, следите за обновлениями.

(Бесстыдная реклама) Многие из этих современных решений, то есть математические модели, которые осторожно относятся к проблеме переобучения, были реализованы компанией Lokad, чтобы вам не пришлось нанимать команду экспертов, чтобы воспользоваться ими.


Комментарии читателей (1)

Обработка данных о сигналах спроса вызывает те же проблемы, что и реальные данные в режиме реального времени в любой отрасли: как получить доступ и интегрировать большие объемы данных, а затем объединить и проанализировать их вместе с исторической информацией. 9 лет назад | Бизнес-возможности