予測の精度という概念は微妙で、_本当に_微妙です。将来の予測が近ければ近いほど良いと言うのは常識ですが、常識はまったく間違っていることもあります。

Shelfcheckの導入により、販売時点でのデータ処理量が大幅に増加し、棚から商品がなくなる(OOS)問題を自動的に検出しようとしています。過去数ヶ月間で、OOSパターンに関する知識が大幅に向上し、この知識は現在、私たちのコアな予測技術に再利用されています。

状況を具体的に説明しましょう。以下のグラフは、特定の商品の店舗レベルでの日次集計販売を表しています。店舗は週7日営業しています。週2の終わりに7日間の予測が行われますが、週3の中間でOOSが発生します。黒い点でマークされた日は、販売がゼロです。

この状況では、予測はかなり正確ですが、OOSの問題のため、販売と予測の直接比較は、予測が販売を大幅に過大予測しているかのように見えますが、少なくともOOSのない日にはそうではありません。過大予測の測定値は、OOSそのものによって引き起こされる人為的なものです。

これまでのところ、OOSは予測の精度を低下させるだけのようですが、これはあまり悪いことではないと思われます。なぜなら、おそらくすべての予測手法が同じように影響を受けるはずだからです。結局のところ、どの予測モデルもOOSの問題を予測することはできません。

しかし、OOSは予測の精度を低下させるだけでなく、それを_改善_することもできます。

これを説明するために、グラフを見てみましょう。再び、日次販売データを見ていますが、今回はOOSの問題が週2の最後の日に始まります。

週3の予測は一週間全体でゼロです。予測モデルは_OOSの期間を予測しています。予測は完全に正確ではありませんが、週3の最後の日には補充が行われ、販売が再びゼロ以外になります。

明らかに、OOSの問題の期間を予測する予測モデルは、数値の比較である販売対予測において非常に正確です。しかし、それは本当に意味があるのでしょうか?いいえ、明らかにそうではありません。私たちは需要を予測したいのです、販売の人為的なものではありません。さらに、ゼロの予測はゼロの補充を引き起こす可能性があり、それによってOOSの問題の実際の期間が延長されます(さらにOOS愛好家の予測モデルの_精度_が向上します)。数値的な観点から見ても、これは望ましい状況ではありません。

OOSの過剰適合の悪い例

2番目のグラフで示されている状況は、決して珍しいものではありません。実際、店舗での8%の棚からの商品の入手不可(小売業界では典型的な数字)と、日次予測のおおよそ30%のMAPEを考慮すると、OOSの状況は通常、合計予測誤差の8% x 100 / 30 ≈ 27% ≈ 全体の予測誤差の1/4を占めています。MAPEの定義によれば、ゼロ販売日(OOS)における非ゼロ予測は100%の誤差を生成します。

OOSによる誤差の割合が大きいため、"もし最後の日にトップセラー商品の販売がゼロであれば、7日間の販売もゼロと予測する“というようなシンプルなヒューリスティックスは、OOSのパターンを直接活用することで、数パーセントの予測誤差を減らすことができることがわかりました。もちろん、ほとんどの実践者はこのようなルールを明示的に予測モデルに組み込むことはありませんが、比較的複雑な線形自己回帰モデルでも、このパターンをかなり学習し、OOSに過剰適合する可能性があります。

Shelfcheckは、このようなOOSの問題に対してサポートするためにここにあります。お楽しみに


リーダーコメント(2)

ラースさん、 フォローアップありがとうございます。 店舗レベルでは、状況が非常にノイズが多いです。典型的なケースとして、1日あたりのアイテムごとの販売数が1または2個と考えてください。価格は確かに重要ですが、実際には、店舗レベルでは、特定のアイテムの5%の価格調整の影響を正確に定量化することは非常に難しいです。ただし、プロモーション(大きな価格効果ですが)は、店舗レベルでも非常に計測可能な効果を持っています。 そのため、Shelfcheckは日次の価格情報を統合しています。ただし、食品・飲料業界では、価格情報を活用せずに既存のシステムの精度を大幅に上回ることができることがわかりました。 ただし、価格情報が無意味であると言っているわけではありません。単に、小売業界でこれまでに観察されたほとんどのセットアップを大幅に改善するためには、価格情報は必要ありません。 そのため、将来的には、価格だけでなく、細かいロイヤリティデータも予測市場で競争力を維持するためにますます重要になるでしょう。6年前 | Joannes Vermorel


こんにちは、 F&Bでは、実際の販売数量は実際の販売価格と強い相関関係があることがよくあります。これは、価格弾力性指数=数量変化% / 価格変化%としてモデル化されることがしばしばあります。私の経験では、実際の販売数量のみを見る一次元の統計的予測は、実際の平均価格を考慮に入れない場合、非常に無意味であり、時間の無駄です。あなたは同意しますか?また、これについてどう思いますか?6年前 | ラース