統計学において、予測の精度とは、数量の「記述」がその数量の実際(真の)値にどれだけ近いかを示すものです。予測が行われる時点では通常、実際の値は測定できません。なぜなら、その記述は未来に関係しているからです。ほとんどのビジネスにとって、より正確な予測は需要に対応する効果を高め、全体的な運用コストを低減させます。
精度推定の利用
精度は、計算された場合には予測の品質の数量的な推定値を提供します。在庫最適化において、予測の精度の推定は次の目的に役立ちます:
- リードデマンドを推定するために役立つ複数の予測モデルの中からどのモデルを選ぶか。
- 予測誤差が正規分布に従うと仮定して、安全在庫を計算するために。
- 統計的な予測だけでは信頼性が十分ではないため、最も専念が必要なアイテムを優先するために。
戦略計画などの他の文脈では、精度の推定値は、異なるシナリオとそれぞれの発生確率を考慮した「もしも」の分析をサポートするために使用されます。
集約の精度への影響
予測モデルの品質を予測の精度の主要な要素と解釈することは、よくある誤解です。実際には、これは事実ではありません。
精度の価値を左右する最も重要な要素は、予測対象の現象の固有の変動性です。実際には、商業や製造業において、この変動性は集約レベルと非常に相関しています:
- 国全体の予測と地域の予測の場合、より高い精度が得られます。
- 月次予測と日次予測の場合も同様です。
したがって、集約レベルが与えられた場合、予測モデルの品質は確かに精度に主要な役割を果たします。最後に、予測が将来に向けて進むにつれて精度は低下します。
実証精度と実際の精度
「精度」という用語は、物理的な測定の品質を指すことが最も一般的です。残念ながら、統計的な予測に関しては、この考え方はやや誤解を招くものです。実際には、物理的な設定とは異なり、予測の実際の精度は、持っていないデータに対して厳密に測定する必要があります。
実際にデータが利用可能であれば、データを模倣するだけで完全に正確な予測を行うことが常に可能です。この単一の問いに対して、統計学者たちは100年以上も悩まされてきましたが、Vapnik-Chervonenkis理論の登場により、より満足のいく視点が20世紀末に見つかりました1。
予測の精度は、実際に利用可能なデータに対してのみ実際に測定することができます。ただし、データが利用可能な場合、これらの「予測」はもはや真の予測ではなく、過去に関する記述であり、将来に関する記述ではありません。したがって、これらの測定は実証的な精度と呼ばれます。
過学習の問題は、実証的な精度と実際の精度の間に大きな差異を生じさせることがあります。実際には、バックテストの注意深い使用により、時系列の予測においてほとんどの過学習の問題を軽減することができます。
人気のある精度指標
予測の精度を測定するための多くの指標があります。最も広く使用されている指標は次のとおりです。
- MAE(平均絶対誤差)
- MAPE(平均絶対パーセント誤差)
- MSE(平均二乗誤差)
- sMAPE(対称平均絶対パーセント誤差)
- ピンボール損失(分位数予測のMAEの一般化)
- CRPS(確率的予測のMAEの一般化)
実際には、企業が予測の不正確さによって引き起こされるコストを反映する能力に基づいて、1つの指標を他の指標よりも優先すべきです。
Lokadの注意点
正確に間違っているよりもおおよその正確さの方が良いです。商業や製造業の企業との取引の経験から、予測の精度指標の選択にはあまり注意が払われていないことがよく見られます。
実際には、理想的な指標はパーセンテージで表される値を返すのではなく、ドルやユーロを返すべきです。これにより、不正確な予測によって引き起こされる非対称な過剰予測と不足予測のリスクを反映することができます。特に、最も一般的な指標は対称的ですが(ピンボール損失は注目すべき例外です)、実際の実務では過剰予測と不足予測のリスクは対称的ではありません。ビジネスの制約に適合するように慎重にモデル化された経済的なコスト関数に近い視点を採用することをお勧めします。これは生の統計的な指標ではありません。
また、予測が正確であると暗黙的に前提として計画を立てることは非常に重要です。ビジネスには不確実性が避けられず、それを考慮する必要があります。
さらなる読み物
- 動画。販売予測の精度、Matthias Steinberg、2011年9月
- 最良の予測誤差指標、Joannes Vermorel、2012年11月
- 在庫に与える精度の財務的影響、Joannes Vermorel、2012年2月
ノート
-
Wikipedia。ヴァプニク–チェルヴォネンキス理論 ↩︎