Несколько недель назад мы раскрыли наши планы относительно Shelfcheck, нашего будущего оптимизатора наличия на полках, ориентированного на (физические) розничные магазины. С тех пор мы продолжаем двигаться вперед, обрабатывая большое количество данных о продажах.

Lokad не единственная компания, которая пытается решить проблему отсутствия товара на полках (OOS), но о сравнении достоинств двух детекторов отсутствия товара на полках практически нет литературы. В этом посте мы рассмотрим два основных показателя эффективности, определяющих насколько хорошо система обнаруживает отсутствие товара на полках.

Интуитивно понятно, что косвенный детектор отсутствия товара на полках (например, Shelfcheck) опирается на расхождение между наблюдаемыми продажами и ожидаемыми продажами. Поскольку случайные (т.е. непредсказуемые) колебания рынка всегда могут происходить, этот подход, по своей сути, не может быть идеальной системой (1), это компромисс между чувствительностью и точностью.

(1) Неидеальность не означает бесполезность.

Чувствительность представляет собой процент обнаруженных случаев отсутствия товара на полках (т.е. положительных результатов, которые должны быть обнаружены) системой. Этот концепт уже широко используется в различных областях, начиная от медицинской диагностики до авиационной безопасности. Чем выше чувствительность, тем лучше охват системы.

Однако, увеличивая чувствительность, одновременно уменьшается специфичность системы, то есть процент неположительных результатов, которые помечаются как таковые (т.е. отрицательных результатов, которые не должны быть обнаружены). На практике это означает, что, выдавая все больше и больше предупреждений, детектор отсутствия товара на полках дает все больше и больше ложных предупреждений, тратя время команд магазина на поиск несуществующих проблем.

Однако, специфичность не является очень практическим критерием в случае розничной торговли. Действительно, отсутствующие товары составляют только небольшую долю отсутствующих товаров. Несколько исследований утверждают, что 8% отсутствующих товаров является относительно стабильным мировым средним значением. Таким образом, специфичность обычно очень высока, более 90%, даже если детектор отсутствия товара на полках случайным образом делает предположения. Такие высокие проценты специфичности вводят в заблуждение, поскольку они отражают только дисбаланс между отсутствующими и неотсутствующими товарами в первую очередь.

В Lokad мы предпочитаем точность, которая представляет собой процент точно определенных случаев отсутствия товара на полках среди всех предупреждений, созданных системой. Точность напрямую переводится в количество усилий, которые не будут потрачены сотрудниками магазина на проверку несуществующих проблем. Например, если точность составляет 50%, то каждое второе предупреждение является ложным.

Ни 100% чувствительность, ни 100% точность невозможны, или, вернее, если у вас есть 100% чувствительность, то у вас 0% точности (все товары классифицируются как отсутствующие все время). В обратном случае, 100% точность означает, что у вас 0% чувствительности (никогда не создается предупреждение). Компромисс чувствительность против точности неизбежен: если вы хотите что-то обнаружить, вам нужно принять, что некоторое количество обнаруженного будет неверным.

Для сравнения двух детекторов отсутствия товара на полках необходимо оценить их соответствующую чувствительность и точность. Затем, чтобы улучшить как чувствительность, так и точность, можно использовать более совершенную технологию прогнозирования, так как лучшие прогнозы улучшат как чувствительность, так и точность.

Однако, возникает другая проблема, как сравнить следующее_:_

  • детектор A с чувствительностью 70% и точностью 60%;
  • детектор B с чувствительностью 60% и точностью 70%.

Оказывается, что на этот вопрос нельзя ответить исключительно статистическим способом: необходимо моделировать экономические затраты и выгоды, чтобы оценить оптимальный выбор.

Следите за обновлениями.