Пару недель назад мы раскрыли наши планы относительно Shelfcheck, нашего будущего оптимизатора доступности товара на полках для (физических) ритейлеров. С тех пор мы уверенно продвигаемся вперёд, обрабатывая огромное количество данных о продажах.

Lokad не единственная компания, пытающаяся решить проблему отсутствия товара на полках, но литературы о том, как оценить достоинства двух детекторов отсутствия товара, крайне мало. В этой статье мы рассмотрим две основные метрики, определяющие насколько хорошо система выявляет отсутствие товара.

Интуитивно понятно, что косвенный детектор отсутствия товара (например, Shelfcheck) основывается на расхождении между наблюдаемыми продажами и ожидаемыми продажами. Поскольку случайные (то есть непредсказуемые) колебания рынка всегда возможны, такой подход по своей природе не может быть идеальной системой (1), это баланс между чувствительностью и точностью.

(1) Неидеальность не означает бесполезность.

Показатель чувствительности представляет процент случаев отсутствия товара (то есть положительных случаев, которые необходимо обнаружить), выявляемых системой. Эта концепция уже широко используется в различных областях – от медицинской диагностики до авиационной безопасности. Чем выше чувствительность, тем лучше система справляется с обнаружением проблемы.

Однако, повышая чувствительность, снижается специфичность системы, то есть процент случаев, когда товары, не находящиеся в состоянии отсутствия, ошибочно отмечаются как отсутствующие (так называемые отрицательные, которые не должны выявляться). На практике это означает, что при увеличении числа сигналов детектор отсутствия товара генерирует всё больше ложных срабатываний, что отнимает время у сотрудников магазина на проверку несуществующих проблем.

Хотя специфичность не является особенно практичным критерием в розничной торговле. Дело в том, что товары, отсутствующие на полках, составляют лишь небольшую долю от всех товаров. Несколько исследований указывают на то, что отсутствие товара стабильно составляет около 8% по всему миру. Следовательно, специфичность обычно очень высока, свыше 90%, даже если детектор отсутствия товара делает чисто случайные предсказания. Таким образом, эти высокие показатели специфичности несколько вводят в заблуждение, поскольку отражают лишь исходный дисбаланс между отсутствием товара и его наличием.

В компании Lokad мы отдаем предпочтение точности, которая представляет процент правильно определённых случаев отсутствия товара среди всех сигналов, выдаваемых системой. Точность напрямую отражает объём усилий, которые не будут потрачены впустую сотрудниками магазина на проверку несуществующих проблем. Например, если точность составляет 50%, то одно из двух срабатываний является ложным.

Ни 100% чувствительности, ни 100% точности добиться невозможно, или, точнее, если у вас 100% чувствительности, то точность составит 0% (все товары будут постоянно классифицироваться как отсутствующие). И наоборот, 100% точности означает 0% чувствительности (сигналы так и не появятся). Компромисс чувствительности против точности неизбежен: если вы хотите что-либо обнаружить, вам придется принять, что часть обнаружений будет ошибочной.

Чтобы сравнить два детектора отсутствия товара, необходимо оценить их чувствительность и точность. Затем, чтобы улучшить и чувствительность, и точность, можно воспользоваться более совершенными технологиями прогнозирования, поскольку лучшие прогнозы повышают как чувствительность, так и точность.

Однако это поднимает ещё один вопрос: как сравнить следующие :

  • детектор A с 70% чувствительности и 60% точности;
  • детектор B с 60% чувствительности и 70% точности.

Оказывается, этот вопрос нельзя решить исключительно статистическими методами: необходимо смоделировать экономические затраты и выгоды, чтобы определить оптимальный выбор.

Следите за новостями.