The notion of forecasting accuracy is subtle, really subtle. 常識として、「未来からの予測がより近ければより良い」という考え方がありますが、常識が全く間違っている場合もあるのです。

当社の陳列面在庫最適化ツールである Shelfcheck の導入により、販売時点のデータを大幅に増やして処理し、欠品(OOS)の問題を自動的に検出する試みを始めました。ここ数か月で、欠品パターンに関する知見が大幅に向上し、今日この知見が当社の中核予測技術に再活用されています。

状況を説明するために、以下のグラフは特定商品の店舗レベルでの日別集計売上を示しています。店舗は7日間連続で営業しており、週2の終了時に7日先の予測が作られますが、週3の途中で欠品(OOS)が発生します。黒い点で示された日は_売上ゼロ_です。

この状況では、予測自体はかなり正確ですが、欠品の問題により、売上と予測の直接比較を見ると、あたかも予測が大幅に売上を過大評価しているかのように見えます。しかし、少なくとも欠品でない日にはそうではありません。この過大評価の測定値は、欠品そのものによって生じるアーチファクトなのです。

これまでのところ、欠品は_見かけ上の予測精度_のみを低下させるように見えます。なぜなら、すべての予測手法が同様に影響を受けるはずだからです。結局のところ、どの予測モデルも欠品問題を予見することはできません。

ところが、欠品は単に予測精度を低下させるだけでなく、実は_向上_させることもあるのです。

これを説明するためにグラフを見てみましょう。今回は日別売上データを再び見るのですが、今回は欠品問題が週2の最終日に始まります。

週3の予測は一週間ゼロです。予測モデルは欠品の期間を_予測していた_のです。週3の最終日には補充が行われ、売上が再びゼロではなくなるため、予測は完全に正確ではありません。

もちろん、欠品問題の期間を予測するモデルは、数値としての_売上対予測_の比較においては極めて正確です。しかし、本当に理にかなっているのでしょうか? いいえ、明らかにそうではありません。私たちが予測したいのは、売上の_アーチファクト_ではなく_需要_なのです。さらに、ゼロの予測はゼロの補充を招き、それが実際の欠品期間を延長し(そして、欠品を好む当社の予測モデルの_精度_をさらに高める)、数値上は良好に見えても望ましい状況とは言えません。

悪い例の_欠品過剰適合_

私たちは、2番目のグラフィックで示されている状況が_珍しい_ものでは決してないと分かりました。実際、小売業界で一般的な8%の陳列品欠如と、日別予測の約30%のMAPEを考慮すると、欠品状況は通常、8% x 100 / 30 ≈ 27%、すなわち総予測誤差の約1/4を占めます。実際、MAPEの定義上、ゼロ売上日の非ゼロ予測は100%の誤差を生み出します。

欠品による誤差の割合が大きいため、「トップセラー商品の最終日の売上がゼロなら、7日間の予測もゼロにする」といった単純な経験則が、欠品パターンを直接活用することで予測誤差を数パーセント削減できることが判明しました。もちろん、非常に少数の実務家のみがこのようなルールを予測モデルに明示的に組み込むでしょうが、多少複雑な線形自己回帰モデルでもこのパターンを大いに_学習_し、結果として欠品に過剰適合してしまう可能性があります。

もちろん、Shelfcheckはこうした欠品問題の解決を支援するために存在します。お楽しみに


読者コメント (2)

こんにちは、Larsさん、 ご返信ありがとうございます。 店舗レベルでは物事が非常にノイズだらけです。商品の1日あたり1〜2ユニットの販売が一般的な例だと考えてください。価格設定は確かに重要ですが、実際には店舗レベルで特定商品の5%の価格調整の影響を正確に数値化するのは極めて困難です。しかし、プロモーション(大きな価格効果であるものの)は、店舗レベルでも非常に測定可能な効果をもたらします。

そして、Shelfcheckは日次の価格情報も統合しています。しかしながら、食品・飲料分野では、価格情報を活用せずとも既存システムの予測精度を大幅に上回ることが可能であると判明しました。 ただし、価格情報が全く役に立たないというわけではなく、これまで小売業界で観察されたあらゆるセットアップにおいて、予測精度を大幅に改善するために必ずしも必要ではないのです。今後、価格設定だけでなく、細分化されたloyaltyデータが、予測市場で競争力を維持するためにますます重要になるでしょう。 Joannes Vermorel (6 years ago)


こんにちは、 食品・飲料分野では、実際の販売数量は実際の販売価格と強い相関関係にあることが多いです。これはしばしば、価格弾力性(数量変化率 ÷ 価格変化率)を用いてモデル化されます。私の経験では、実際の平均価格を考慮せずに実際の販売数量だけに注目する一元的な統計的予測は、ほとんど役に立たず、完全に時間の無駄となってしまいます。どう思われますか? Lars (6 years ago)