Back to blog

数週間前、私たちは、実店舗小売業者向けの将来の棚上可用性最適化ソリューションである Shelfcheck に関する計画 を公開しました。それ以来、私たちは大量の POS データを着実に処理しながら前進してきました。

OOS(棚欠品)の問題に取り組んでいるのは Lokad だけではありませんが、2つの OOS 検知器の優劣をどのように評価すべきかについての文献はほとんど存在しません。本稿では、システムがどれだけ OOS を正しく検出できるかを定義する 2つの基本指標 を確認します。

直感的に言えば、Shelfcheck のような間接型 OOS 検知器は、観測された売上期待売上 の乖離に依存しています。市場には常にランダム、すなわち予測不能な変動が起こり得るため、この手法は構造上、完璧なシステムにはなりません (1)。ここでは 感度と適合率のトレードオフ が生じます。

(1) 完璧ではないからといって、無価値という意味ではありません。

感度 とは、OOS、すなわち検出すべきポジティブ事象のうち、システムがどれだけ捉えられるかを示す割合です。この概念は医療診断から航空保安まで、さまざまな分野で広く用いられています。感度が高いほど、システムのカバー範囲は広くなります。

しかし、感度を上げると、同時にシステムの特異度は下がります。つまり、OOS ではない商品を誤って OOS と判定しない割合が下がるということです。実務的には、アラートを大量に出すほど、OOS 検知器は 誤アラート を増やし、店舗スタッフが存在しない問題を確認するために時間を浪費することを意味します。

とはいえ、小売の文脈では 特異度はそれほど実用的な指標ではありません。実際、OOS 商品は非 OOS 商品全体のごく一部にすぎません。複数の研究では、OOS 比率の世界平均は比較的安定して約 8% とされています。そのため、たとえ OOS 検知器が完全にランダムな推測しかしていなくても、特異度は通常 90% を超える非常に高い値になります。つまり、高い特異度は一見よく見えても、単に OOS と非 OOS の不均衡を反映しているにすぎません。

Lokad では、代わりに 適合率 を重視しています。これは、システムが出したすべてのアラートのうち、正しく OOS と特定された割合 を表します。適合率は、店舗スタッフが存在しない問題の確認に費やさずに済む労力へと直接結びつきます。たとえば適合率が 50% なら、2件に1件は誤アラートです。

感度 100% も適合率 100% も両立しません。 正確に言えば、感度 100% を達成すると、すべての商品を常に OOS と分類することになり、適合率は 0% になります。逆に適合率 100% は、アラートを一切出さない、すなわち感度 0% を意味します。したがって、感度と適合率のトレードオフ は避けられません。何かを検出したいのであれば、検出結果の一部が誤っていることは受け入れる必要があります。

2つの OOS 検知器を比較するには、それぞれの感度と適合率を把握する必要があります。さらに両方を改善するには、より優れた予測技術を活用する余地があります。予測精度が上がれば、感度と適合率の両方を改善できるからです。

ただし、ここで別の問題が生じます。たとえば次の2つをどう比較すべきでしょうか。

  • 検知器 A: 感度 70%、適合率 60%
  • 検知器 B: 感度 60%、適合率 70%

この問いは、純粋に統計的な観点だけでは答えられません。最適な選択を評価するには、経済的なコストと便益をモデル化する必要があります

続きは次回。