Back to blog

予測のパフォーマンスを評価するために利用できる指標は多数あります:

この投稿では、「最高の」予測指標という問題に取り組みます。多くの実務者が予想するよりもシンプルであることが判明しています.

その中で、MAEとMAPEは小売業および製造業の実務者によっておそらく最も広く使用されている指標です。まずは、この2つの指標のグラフを見てみましょう。

平均絶対誤差のプロット。X = 実数(予測は1)。Y = 誤差.

MAEの振る舞いは比較的単純です。数学的観点から言えば、唯一の難点は、この関数がすべての場所で微分可能ではない(上記の例ではx=1で微分不可能)点です.

平均絶対誤差率のプロット。X = 実数(予測は1)。Y = 誤差.

しかし、MAPEはずっと込み入っています。実際、過大 予測と 過小 予測の間の振る舞いは大きく異なり、過小予測の誤差は1に上限がある一方で、過大予測の誤差はゼロに近づくと無限大に達します.

特にこの後者の側面は、在庫切れ (OOS) イベントと組み合わせると混乱を招きがちです。実際、在庫切れは実際の売上が非常に低くなるため、結果としてMAPEが非常に高くなる可能性があります.

実際には、MAPEを選択する前に十分に検討することをお勧めします。なぜなら、結果の解釈自体が小さな挑戦になる可能性があるからです.

最良の指標はドルまたはユーロで表現されるべき

数学的な観点からは、いくつかの指標(例えばL2など)は統計解析においてより実用的と見なされる(例として微分可能であることなどから)が、実際のビジネスシーンに直面すると、この見解は無意味であると私たちは考えています.

予測のパフォーマンスを評価するために使用される唯一の単位お金であるべきです。予測は常に誤りであり、その誤差を定量化する唯一の合理的な方法は、予測と実績の差が企業にどれだけの費用をもたらしたかを評価することに尽きます.

ビジネスコストのモデリング

実際には、このような特注のコスト関数を定義するためには、ビジネスの詳細な検討が必要であり、次のような疑問が生じます:

  • 在庫にはどれくらいの費用がかかるのか?
  • 在庫の陳腐化にはどれほどの費用が見込まれるのか?
  • 在庫切れはどれくらいの費用がかかるのか?

企業の政治に関しては、予測誤差を例えばパーセンテージとしてモデル化し、これらの厄介な疑問を無視することには、唯一の利点として中立である点が挙げられます ― つまり、会社の他の部門に実際に予測を行動計画に変換する負担がのしかかるのです.

合理的なコスト関数を確立するプロセスは難解なものではありませんが、企業内で予測を担当する部門に対し、これらすべてのコストを明示的に書き出すことを強制します。そうすることで、選択がなされ、それは会社のすべての部門に利益をもたらすのではなく、明確に会社全体に利益をもたらすのです.