需要予測の精度
統計学において、予測の精度とは、数量の 記述 がその数量の実際の(真の)値にどれだけ近いかという程度を示すものである。通常、予測が行われる時点では実際の値は測定できない。なぜなら、その記述は未来に関するものであるからだ。ほとんどの企業にとって、より正確な予測は需要に応える効果を高め、全体の運用コストを低減する。
精度推定の利用
予測の精度を算出することで、予測の期待される品質の定量的な推定値が得られる。在庫最適化において、予測精度の推定は次のような目的に役立つ:
- 複数の予測モデルの中から、リード需要を推定する際に、どのモデルを優先すべきかを選択するため。
- 予測誤差が正規分布に従うという仮定のもと、安全在庫を計算するため。
- 生の統計的予測だけでは信頼性が十分でないため、最も注力すべきアイテムの優先順位を決定するため。
戦略的計画などの他の文脈では、精度推定は異なるシナリオとその発生確率を考慮した what-if 分析を支援するために用いられる。
集計が精度に与える影響
予測の精度を左右する主要な要因として予測モデルの質を考えるのは誤解である:実際はそうではない。
精度の値を左右する最も重要な要因は、予測対象となる現象の固有の変動性である。実際、商業や製造業では、この変動性は集計レベルと密接に関連している:
- 全国規模の予測は、地域規模の予測に比べてより高い精度をもたらす。
- 同様に、月次予測は日次予測よりも精度が高い。
そして、一度集計レベルが定まると、達成されうる精度においては予測モデルの質が主要な役割を果たす。最後に、将来が遠くなるほど精度は低下する。
経験的精度 vs 実際の精度
精度という用語はしばしば、何らかの物理的測定の品質を指すために用いられる。残念ながら、この見方は統計的予測においてはやや誤解を招く。実際、測定が他の方法と比較できる物理的設定とは異なり、予測の実際の精度はあなたが持っていないデータに対して厳密に測定されるべきである。
実際、データが利用可能になると、データを模倣するだけで完全に正確な予測を生成することが常に可能となる。この一つの問題は統計学者たちを一世紀以上も悩ませたが、20世紀末にVapnik-Chervonenkis理論1の登場により、非常に満足のいく見解が得られるようになった。
予測の精度は利用可能なデータに対してのみ実用的に測定できる。しかし、データが利用可能になると、それらの_予測_はもはや真の予測とはならず、未来ではなく過去に関する記述となる。したがって、これらの測定値は経験的精度と呼ばれ、実際の精度とは対照的である。
オーバーフィッティング の問題は、経験的精度と実際の精度との間に大きな乖離をもたらす可能性がある。実際、バックテストを慎重に使用することで、オーバーフィッティングの問題の大部分を、時系列の予測時に緩和できる。
一般的な精度指標
予測の精度を測るための指標は多数存在する。最も広く使用されている指標は次の通り:
- MAE(平均絶対誤差)
- MAPE(平均絶対パーセンテージ誤差)
- MSE(平均二乗誤差)
- sMAPE(対称平均絶対パーセンテージ誤差)
- ピンボール損失(分位点予測のためのMAEの一般化)
- CRPS(確率的予測のためのMAEの一般化)
実際、企業が予測の不正確さによって被るコストを反映する能力に基づいて、ある指標が他の指標よりも支持されるべきである。
Lokadの落とし穴
大まかに正しい方が、厳密に間違っているよりも優れている。商業や製造業の企業と取引する我々の経験では、精度指標の選定に十分な注意が払われていないことが常に観察される。
実際、理想的な指標はパーセンテージで表現される値を返すべきではなく、ドルやユーロなど、予測の不正確さによる非効率性のコストを正確に反映する値を返すべきである。特に、ほとんどの一般的な指標が対称的である一方(ピンボール損失はその顕著な例外である)、実際には過大予測と過小予測のリスクは対称ではない。統計的な指標という生の数値ではなく、企業の制約に合わせて慎重にモデル化された経済的コスト関数に近い視点を採用することを提案する。
また、予測が正確であると暗黙の前提で計画を立ててはならない。不確実性はビジネスにおいて避けられないものであり、十分に考慮されるべきである。
参考文献
- 動画. 販売予測の精度, Matthias Steinberg, 2011年9月
- 最良の予測誤差指標, Joannes Vermorel, 2012年11月
- 在庫に対する予測精度の財務的影響, Joannes Vermorel, 2012年2月
注釈
-
Wikipedia. Vapnik–Chervonenkis理論 ↩︎