分位予測 (2012)

最もよく知られている予測の種類は平均予測であり、過大予測と過小予測の重みが厳密に均衡しています。翌日の気温予報は平均予測の典型例です。分位予測はそれとは異なります。 過大予測と過小予測の確率を変えるために、意図的にバイアスを導入します。分位は、小売、卸売、製造など多くの業種において、従来の予測に対する根本的な改善をもたらします。2012年3月、Lokadは産業グレードの分位予測を提供する最初のソフトウェアベンダーとなりました。このページでは、分位予測がなぜ重要なのか、そして従来予測とどう異なるのかを説明します。

序文

「分位予測」という用語は複雑に聞こえるかもしれませんし、統計学に精通していなければ、この言葉を聞いたことがない可能性もあります。しかし、分位予測は、その名称が用いられなくても、小売業や製造業で日常的に使用されています。例えば、在庫の再注文点を定義することは、需要に対する分位予測を作成することと本質的に等しいのです。小売業や製造業における分位予測の抜本的な影響にもかかわらず、これまで市場ではあまり注目されていませんでした。最も単純な説明としては、分位予測のサポートがソフトウェア業界においてほぼ存在しなかったということです。しかし、Lokadを用いれば、これほど重要な技術を見過ごす理由はもうありません。

需要予測は何のために必要か？

小売業者や製造業者にとって分位予測が有用である理由を理解するためには、そもそもなぜ予測が必要とされるのかに立ち返る必要があります。需要予測は、適切な在庫、スタッフ、資金などのリソースが適切なタイミングで確保されるために重要です。しかし、需要に対して適切なリソースを配置することは、通常、非常に非対称な問題です。リソースの過剰配分（すなわち、過大予測）のコストと、リソースの不足配分（すなわち、過小予測）のコストは大きく異なる場合があります。

例えば:

食品小売業者は通常、95％以上という非常に高いサービスレベル（すなわち、在庫切れが非常に稀な状態）を求めます。この文脈では、在庫切れの限界コストが、追加在庫の限界コストをはるかに上回ると推定されています。
自動車メーカーは生産コストを引き下げる圧力が高まっています。その結果、一部のメーカーはゼロ在庫戦略、すなわち車をまず購入し、後に製造するという即時供給がゼロの戦略を採用しています。この状況では、在庫の限界コストが即時供給がないことのコストを上回ると推定されています。したがって、企業にとって、単純な平均需要予測に基づいてリソースを配分することは、時々リソースを不足させる50%のリスクを負うという、事実に即していない見合いの悪い取引となるため、通常利益をもたらしません。したがって、企業は自らの取引に存在する業界特有の非対称性を反映するために、意図的にリソース配分にバイアスを導入しています。この非対称性にうまく対処できることこそが、分位予測の根幹です。

分位予測 (τ, λ) とは、τ（タウ）が目標確率であり、λ（ラムダ）が日数で表されるホライズンである予測を意味し、次のλ日間の需要予測が将来の需要を上回る確率がτ（したがって、下回る確率は1-τ）であることを示します。

外挿された分位数とその限界

分位予測は何十年も知られてきましたが、_ネイティブ_な分位予測モデルの実装は、平均予測モデルの実装に比べてはるかに複雑であると広く、そして当然のように考えられています。その結果、ほとんどの予測ソフトウェアベンダー（*）は平均予測のみを提供しています。

(*) 私たちの知る限りでは、Lokadは2012年3月に、ネイティブな産業グレードの汎用分位予測技術を提供した最初のベンダーとなりました。しかし、学術界では、分位回帰の研究プロトタイプが何十年も前から存在しています。

しかし、企業が分位予測を必要とするため、通常、外挿による回避策を活用して分位予測を作成しています。実務的には、このアプローチは需要が正規分布に従うと仮定し、修正用の安全項を加えることから成り立っています。例えば、従来の安全在庫アプローチはこのパターンに従います。

外挿された分位数とは、外挿法によって変換された従来の（平均）予測を分位予測にしたものです。この用語は、統計モデルが直接分位数を生成するネイティブ分位数に対するものです。外挿は入力データに依存せず、むしろあらかじめ定義された分布に依存します。この分布は通常、正規分布であり、現実と異なるため、外挿プロセスの最も弱い部分となる傾向があります。

残念ながら、外挿には3つの一般的な状況において重大な欠点が存在します:

高い分位数（すなわち、高いサービスレベル）
断続的需要
急激な需要（大量注文）

これらの状況では、ネイティブ分位予測が、最適な外挿分位予測を20％以上上回る傾向があることが分かりました。この比較は、Lokadの分位予測技術と従来の予測技術を活用して行われており、これらがすでに競合他社を上回っていることを踏まえています。

高い分位数（すなわち、高いサービスレベル）

予測に伴う誤差が正規分布に従うという仮定は、通常、平均や中央値に近い分位目標には適しています。しかし、目標パーセンテージが高くなるほど近似の質は低下します。90%を超えるような高い目標パーセンテージでは、外挿そのものが予測の最も弱い部分になることが少なくありません。そのような状況では、ネイティブ分位を優先すべきです。

断続的需要

外挿は、不確実性を反映するために将来需要の上に滑らかな曲線を当てはめようとします。しかし、需要が断続的または希薄な場合、需要には滑らかなものなど何もありません。例えば各期間（週や月）において、販売される単位数、すなわち観測可能な需要は0から5の間の整数として変動します。歴史的には、多くの平均予測モデルが希薄需要をよりよく捉えるよう設計されてきました。しかし、分位の観点から見ると、より根本的な問題は、希薄需要の場合、どの平均予測も適切に外挿されて正確な分位になり得ないことが明らかです。対照的に、ネイティブ分位は需要の small-integers パターンに完全に適合できます。

急激な需要（大量注文）

大量注文が存在する場合、需要履歴の曲線はかなり尖った形状になる傾向があります。この形状は、少数の注文が総需要のかなりの割合を占めていることを反映しています。しかし、断続的需要の場合とは異なり、需要は常にゼロではありません。ここでの根本的な問題は、需要が整数の値を取ることではなく、平均予測がそれらのスパイクを将来に向けて適切に投影できないことです。単純化して言えば、スパイクに対処するには2つの方法があります:

廃棄する: もし企業が事前にリソースを割り当てる価値がないと判断した場合
事前配分されたリソースを調整して、対応するか、あるいは少なくともスパイクの一部に対応できるようにする

どちらの場合でも、平均予測の振る舞いは不十分です。外挿された分位数はスパイクを捉えるには低すぎる一方で、非スパイク需要に対応するリソースを過大評価してしまいます。ネイティブ分位予測は、より直接的かつより正確にスパイクへ対処します。

Lokadによるネイティブ分位予測

これはレガシー記事です。当社の最新世代の予測エンジンは、もはや分位予測では動作しません。詳細については最新のTechnologyページをご覧ください。

Lokadは、時系列を入力として受け取り、ネイティブな分位予測を返す完全自動化されたオンラインサービスを提供します。各分位は、それぞれのホライズンと目標パーセンテージ（在庫最適化の場合はそれぞれリードタイムとサービスレベル）に対応しています。外挿は不要です。分位予測プロセスには統計の専門知識を必要としません。実務上、ほとんどの企業は最適化された再注文点を得るために当社のウェブアプリを利用します。この再注文点こそが、在庫特有の分位予測です。各時系列に対して、分位予測は単一のデータポイントにすぎません。平均予測とは異なり、分位予測は通常、時間とともに進化し、履歴曲線を未来へ延長する曲線として表現されません。統計的な振る舞いは異なりますが、根底にある需要パターン、すなわちトレンド、季節性、製品ライフサイクル、販促などは同じです。当社の classic 予測技術でサポートされるすべてのパターンは、当社の quantile 予測技術でもサポートされています。

クラシック（平均）予測 vs 分位予測

数学的な観点から見ると、分位予測は古典的な予測概念の一般化を表しています。実務的な観点からは、需要の過大評価と過小評価に伴うリスクが対称でないほとんどのビジネス状況において、分位予測の方が通常優れています（より正確です）。しかし、分位予測は読み取りにくく直感的でもありません。したがって、クラシック予測は、マネージャーが自社ビジネスの変化をより直感的に把握するための基本的なツールであり続けます。私たちはクラシック予測を廃止する予定は一切ありません。実際、当社が予測技術に投じる研究開発努力の大半は、この2種類の予測の双方に利益をもたらしています。分位予測は、需要の統計的挙動に関する理解をさらに深める機会です。私たちの最優先事項は、より正確な予測を提供することです。

分位予測における在庫切れバイアス

在庫切れは、サービスを提供できない顧客の忠誠心の低下を招くためビジネスに悪影響を及ぼすだけでなく、歴史的需要の観測値にもバイアスをもたらします。在庫切れがあるため、ゼロの売上が必ずしもゼロの需要を意味するわけではありません。Salescastもこの問題から免れてはいませんが、適切に使用すれば非常に_強靭_なものにすることが可能です。

クラシック予測に対する在庫切れの影響

古典的（中央値）的な意味での予測とは、将来需要を上回る確率も下回る確率も50%である未来の見通しを表します。在庫切れが観測されると、満たされなかった需要が通常計上されないため、履歴記録には下方バイアスが導入されます。

その結果、過去のデータに基づいて作成された予測にも下方バイアスが生じ、さらなる在庫切れを引き起こします。

最も極端な場合、最小在庫レベルが定義されていないと、補充プロセスが在庫凍結状態に収束する可能性があります。この状態では在庫がないため売上も記録されず、在庫の再注文も行われません。さらに悪いことに、この状況では予測が100％正確となり、予測も売上もゼロになります。

在庫切れデータ統合の落とし穴

在庫切れによって導入されたバイアスを修正するためには、在庫切れを考慮に入れる必要があります。これは、過去（および現在）のすべての在庫切れに関する詳細な記録を収集することで実現できます。この考えは魅力的ですが、実際にはこのアプローチには相当な労力が必要であることが分かっています。

多くの企業は在庫切れを正確に追跡していません。いくつかの在庫切れデータがあるだけでは不十分であり、需要予測を改善するためには、在庫切れに関するデータが広範かつ正確である必要があります。
在庫切れは（望むところでは）比較的まれで、ほとんどのビジネスでは通常、発生頻度が10%未満です。その結果、十分な統計分析を支えるためのデータを集めるには、かなりの規模の取引が必要となります。
在庫切れの影響は複雑です。在庫切れは、代替品が存在する場合、利用できない商品のカニバリゼーションを引き起こします。また、一部の顧客が需要を先送りにすることで、商品が再び入荷した際に「需要の急増」をもたらすこともあります。

バイアス耐性を持つ分位予測

その代わりに、分位予測は在庫切れによってもたらされる大部分のバイアスを軽減する、はるかに効率的で簡潔な代替手段を提供します。要するに、分位数を用いることで、あらかじめバイアスがかかった予測として再注文点を算出します。例えば、95%のサービスレベルで算出された再注文点は、需要の95%の確率でわずかに上回るように見積もられており（在庫切れになるのは5%の確率）、その特性を持っています。

分位予測は、実務上90%以上という高いサービスレベルと組み合わせると、従来の予測とは全く異なる挙動を示します。直感的には、95%の分位予測を算出するためには、需要の中で最も極端な上位5%の変動に注目します。過去の在庫切れが極端に多く、観測された上位5%の売上でさえ「通常」の需要のほんの一部である可能性もありますが、実際にはそうでないことがほとんどです。大きな在庫切れがあっても、過去の最大需要は通常、平均需要よりも高くなります。

その結果、分位予測は、在庫切れによってあまりにも大きなバイアスが生じ、そのバイアスがさらに偏った予測を引き起こして在庫切れ問題を悪化させるという悪循環に陥ることはほとんどありません。私たちのクライアントの大多数において、分位予測はバイアスに対してより耐性があるため、在庫切れの頻度を即座に低減し、サービスレベルを再び管理下に取り戻す好循環をもたらします。そして、しばらくすると在庫切れの頻度は定められたターゲットサービスレベルに収束していきます。

サービスレベルの選び方

分位予測を用いる場合、再注文点は予想需要、リードタイム、およびサービスレベルの関数として計算されます。再注文数量は、再注文点から手元在庫と発注中の在庫を差し引いて求められます。サービスレベルは在庫切れが発生しないという望ましい確率を表します。以下の記事は、このテーマの簡単な紹介と適切なサービスレベルの設定方法についての指針を提供します。

この記述に内在する暗黙の前提は、常に手元在庫から注文に対応できることが経済的ではない、ということです。特定の製品に対して_適切な_サービスレベルを決定することは、本質的に在庫コストと在庫切れのコストのバランスを取ることを意味します。したがって、サービスレベルは適切な安全在庫を算出するための重要な変数であり、望むサービスレベルが高ければ高いほど、より多くの安全在庫を保持する必要があります。

残念ながら、この問題を記述するコスト関数は非常にビジネス固有です。在庫コストは比較的容易に算出できる場合が多い一方で、在庫切れのコストはより複雑です。店舗で製品が見つからない顧客は、店内にある代替品を選ぶか、購入を後日に延期するか、あるいは競合他社から購入するかもしれません。たとえば、食料品小売業では、特定の_必需品_の陳列切れが、顧客を店舗から遠ざけ、取引を競合他社に奪われる原因として知られています。

この例が示すように、関連するコスト関数は単にビジネス固有であるだけでなく、製品に固有のものでもあります。ほとんどの製造業者や小売業者が数百から数十万の製品を扱っていることを考えると、過度に_科学的_なアプローチは推奨されず、また実現も困難であることが明らかです。

良いニュースとして、実際には、時間の経過とともに微調整できるシンプルなフレームワークで十分に対処できることが多いのです。

始め方

多くの小売業者はサービスレベルを自社の重要なノウハウの一部として非常に厳重に管理しています。それでも、ある程度の大まかな数字が良い出発点となるはずです。小売業における典型的なサービスレベルは90%であり、優先度の高い商品では95%に達することもあります。私たちは、一律の90%という_出発点_でサービスレベルを設定し、その後、自社のニーズに合わせて改善・調整するという非常に実践的なアプローチを採用して成功している多数の顧客を見てきました。

サービスレベルと安全在庫の関係を理解することは重要です。グラフ1はこの関係を示しています。100%までの距離を半分にすると、安全在庫は2倍になります。たとえば、サービスレベルが95%から97.5%に上がると、必要な安全在庫が倍増します。100%に近づくサービスレベルは非常に急速にコストがかさみ、100%のサービスレベルは数学的に見れば_無限の安全在庫_に相当します。

service-level-graph グラフ1: 安全在庫とサービスレベルの関係

カテゴリの選定

私たちの経験では、必需品から最も低い優先度の商品まで、製品ポートフォリオをカバーするためには、3～5のサービスレベルカテゴリに区分することで十分であることがわかっています。例えば、私たちは3値システムを選択しました:

高: 95%
中: 90%
低: 85%

製品の分類

製品のランキングは、前述したカテゴリに製品を割り当てるための、構造的かつ合理的な手法を提供します。単独または組み合わせでよく用いられるランキングには、売上高、収益性、注文数、COGS（売上原価）などがあります。

売上高による製品ランキングの例

売上高上位80%: 高サービスレベル
売上高の次の15%: 中サービスレベル
売上高の次の5%: 低サービスレベル

粗利益貢献による製品ランキングの例

粗利益上位80%: 高サービスレベル
粗利益の次の15%: 中サービスレベル
粗利益の次の5%: 低サービスレベル

カテゴリが定義され、サービスレベルが割り当てられると、Lokadはこれらの値に基づいて再注文点（安全在庫レベルを含む）を算出します。私たちは、在庫削減の大部分の可能性が、予測の精度だけでなく、サービスレベルのより洗練された手法と頻繁な更新によっても引き出されることをよく見ています。

Lokadに入力する正確なサービスレベルに不安を感じる方は、最初から完璧に調整されたサービスレベルを持つことが重要でなく、また現実的でもないことを覚えておくべきです。重要なのは、この考え方に新たな注目を集めることと、Lokadの予測および再注文点分析が組み合わさることで、現状が大幅に改善されるという高い確実性をもたらすという点です。