promotions.jpg

Прогнозирование практически всегда является сложным упражнением, но есть одна область в розничной торговле, которая считается на порядок более сложной, чем остальные: планирование акций. В Lokad, планирование акций является одной из частых проблем, с которыми мы сталкиваемся при работе с нашими крупнейшими клиентами, обычно через специальные миссии по Big Data.

Этот пост является первым из серии о планировании акций. Мы рассмотрим различные проблемы, с которыми сталкиваются розничные компании при прогнозировании спроса на акции, и предложим некоторые идеи решений, которые мы предлагаем.

Первая проблема, с которой сталкиваются розничные компании при работе с акциями, - это качество данных. Эта проблема обычно сильно недооценивается как среди средних, так и среди крупных розничных компаний. Однако, без высококвалифицированных данных о прошлых акциях, вся инициатива по планированию сталкивается с проблемой “мусор на входе - мусор на выходе”.

Проблемы с качеством данных среди записей об акциях

Качество данных об акциях обычно низкое - или по крайней мере гораздо хуже, чем качество обычных данных о продажах. Запись об акции, наиболее детализированном уровне, представляет собой идентификатор товара, идентификатор магазина, дату начала (дату окончания) плюс все измерения, описывающие саму акцию.

У этих записей об акциях много проблем:

  • Записи существуют, но магазин не полностью реализовал план акции, особенно в отношении фейсинга.
  • Записи существуют, но акция никогда не произошла нигде в сети. Действительно, сделки по акциям обычно заключаются за 3-6 месяцев до начала с поставщиками. Иногда сделка отменяется за несколько недель до начала, но соответствующие данные об акции никогда не удаляются.
  • Не записываются “неофициальные” инициативы магазинов, такие как перемещение товара с избыточным запасом на полки в конце прохода. Фейсинг является одним из самых сильных факторов, влияющих на повышение эффективности акции, и не должен недооцениваться.
  • Детали механизмов акции не записываются точно. Например, наличие индивидуальной упаковки и структурированное описание упаковки редко сохраняются.

Исходя из наблюдений за подобными проблемами во множестве наборов данных розничных компаний, мы считаем, что объяснение простое: мало или вообще нет операционных требований для исправления записей об акциях. Действительно, если данные о продажах некорректны, это создает столько операционных и бухгалтерских проблем, что исправление проблемы становится первоочередной задачей очень быстро.

В отличие от этого, записи об акциях могут оставаться крайне неточными в течение многих лет. Пока никто не пытается создать модель прогнозирования на основе этих записей, неточные записи имеют незначительное отрицательное влияние на операции розничной компании.

Основным решением для проблем с качеством данных являются процессы контроля качества данных, и эмпирическая проверка того, насколько устойчивы эти процессы при работе с условиями реальных магазинов.

Однако, лучший процесс не может исправить неправильные данные прошлого. Обычно требуется около 2 лет хороших данных об акциях, чтобы получить приемлемые результаты, поэтому важно вкладываться рано и агрессивно в историзацию записей об акциях.

Структурные проблемы данных

Помимо проблем с записями об акциях, точное планирование акций также страдает от более широких и подлежащих скрытому влиянию проблем, связанных с тем, как информация собирается в розничной торговле.

Усечение истории: Большинство розничных компаний не бесконечно сохраняют свою историю продаж. Обычно “старые” данные удаляются в соответствии с двумя правилами:

  • если запись старше 3 лет, то удаляем запись.
  • если товар не продавался в течение 1 года, то удаляем товар и все связанные записи о продажах.

Очевидно, что в зависимости от розничной компании пороги могут отличаться, но в то время как большинство крупных розничных компаний существуют уже десятилетиями, найти историю продаж за последние 5 лет без усечения - это исключение. Такие усечения обычно основаны на двух ложных предположениях:

  • хранение старых данных дорого: Хранение всей 10-летней истории продаж (до уровня чека) Walmart - и ваша компания, безусловно, меньше, чем Walmart - может быть сделано за менее чем 1000 долларов США хранилища в месяц. Хранение данных не только крайне дешево сейчас, оно было уже крайне дешево 10 лет назад, насколько это касается розничных сетей.
  • старые данные не служат никакой цели: Хотя 10-летние данные, конечно, не служат операционным целям, с точки зрения статистики даже 10-летние данные могут быть полезны для уточнения анализа многих проблем. Просто говоря, долгая история дает гораздо более широкий спектр возможностей для проверки производительности моделей прогнозирования и избегания проблем переобучения.

Замена GTIN собственными кодами товаров: Многие розничные компании сохраняют свою историю продаж, закодированную альтернативными идентификаторами товаров вместо собственных GTIN (также известных как UPC или EAN13, в зависимости от того, находитесь ли вы в Северной Америке или Европе). Заменяя GTIN на специальные коды идентификации, часто считается, что становится легче отслеживать замены GTIN и это помогает избежать сегментированной истории.

Однако замены GTIN не всегда точны, и неверные записи становятся практически невозможными для отслеживания. Что хуже, после объединения двух GTIN более невозможно восстановить два исходных набора записей о продажах.

Вместо этого гораздо лучше сохранять записи GTIN, потому что GTIN представляют физическую реальность информации, собираемой в POS (точке продаж). Затем подсказки для замены GTIN следует сохранять отдельно, чтобы впоследствии была возможность пересмотреть ассоциации - если возникнет необходимость.

Не сохранение информации о упаковке: В продовольственной рознице многие товары предлагаются в различных форматах: от индивидуальных порций до семейных порций, от одиночных бутылок до упаковок, от обычного формата до акционных форматов +25% и т. д.

Сохранение информации об этих форматах важно, потому что для многих покупателей альтернативный формат того же товара часто является хорошей заменой, когда другой формат отсутствует.

Однако, хотя может быть соблазнительно объединить продажи в некий мета-GTIN, где все варианты размеров объединены, могут быть исключения, и не все размеры являются равными заменителями (например, 18 г Nutella против 5 кг Nutella). Таким образом, информацию об упаковке следует сохранять, но отдельно от сырых продаж.

Качество данных - чрезвычайно прибыльные инвестиции

Качество данных - одна из немногих областей, где инвестиции обычно окупаются в десять раз в рознице. Лучшие данные улучшают все последующие результаты, от самых наивных до самых продвинутых методов. В теории качество данных должно страдать от принципа убывающей отдачи, однако наши собственные наблюдения показывают, что, за исключением нескольких восходящих звезд онлайн-коммерции, большинство розничных компаний далеки от того момента, когда инвестиции в большее качество данных не были бы чрезвычайно прибыльными.

Таким образом, в отличие от создания сложных технологий для построения прогнозных моделей, качество данных не требует сложных технологий, а требует много здравого смысла и чувства простоты.

Следите за обновлениями, в следующий раз мы обсудим проблемы процесса планирования акций.