金を見せて: ISF 2024に関する考察
“あなたのゲームを向上させるためには、まずエンドゲームを学ばねばならない。なぜなら、エンドゲームはそれ自体で研究され習熟できるが、中盤や序盤はエンドゲームとの関連で学ぶ必要があるからだ。” 出典: カパブランカの最後のチェス講義 (1966), p. 23
数週間前、私はフランス・ディジョンで開催された第44回国際予測シンポジウムでパネルに参加しました。パネルのテーマは 需要計画と新たなAI/MLの世界における判断の役割 でした。
Lokadの大使として、私の視点は次のようなものでした:
-
予測と意思決定は完全自動化されるべきである;
-
予測の質は より良い意思決定 の観点から評価されるべきである;
-
人間の判断は自動化を改善するために用いるべきであり(予測や意思決定を微調整するためではない)。
奇妙なことに、私の自動化に対する立場は、予想されるほど多くの反対意見を引き起こさなかった。議長(Lokadのコミュニケーション責任者、Conor Doherty)と他のパネリスト(iqastのSven CroneおよびSupChainsのNicolas Vandeput)は、ほぼ全会一致でこれが予測の未来であると考えていました。唯一の論点は どれだけ迅速に この状態に到達できるかという点でした(注:私はすでにそこにいると考えています)。
しかし、かなりの反対意見や混乱を招いたのは、予測精度が より良い意思決定をもたらすことほど重要でないという私の主張でした。その意見の食い違いは、パネリストだけでなく聴衆にも見られました。私が考えるに、これには大きく二つの理由があります:
-
ステージ上で話す際、この点を補強するビジュアルがなかったためです。説明にはいくつかの動く要素があり、視覚資料があれば理解が促進されたでしょう。
-
予測精度が意思決定より劣るという考えは、多くの専門家が受けた教育、訓練、経験に矛盾するためです。
このエッセイの最後までに、上記の両点に対処できればと望んでいます。第一の点については、簡潔ながらも体系的な説明と直感的なビジュアルを含めました。第二の点については、今後5〜10分間、サプライチェーン予測に関するこれまでの訓練がゼロであったかのような心持ちで、これらの言葉に接していただくようお願いいたします。
指導となる質問
私の見解では、私の立場を明確にするためには答えるべき基本的な質問が五つあります。このセクションでは、それぞれに対して簡潔な回答、いわば「本質」を提供できるよう努めます。ご安心ください。Lokadには技術的詳細を説明する豊富な追加資料があり、それらはエッセイの最後にリンクしています。
Q1: 予測が「価値を加える」とはどういう意味か?
すぐに例を挙げましょう。企業には意思決定を生み出すためのデフォルトの仕組みが存在すると仮定します(例えば、自動化された統計的予測と自動化在庫ポリシー)。
修正された予測が価値を加えるためには、企業のデフォルトプロセスで生成された意思決定を、企業の財務リターン(すなわち、ドル、ポンド、またはユーロ単位のリターン)に直接的かつ肯定的に影響を与える方法で変更しなければなりません。
もし予測が(実際の需要を予測する点で)より正確であっても、異なるより良い意思決定が下されなければ、それは 価値を加えていない ことになります。
多くの企業は依然として時系列予測モデルを使用していますが、Lokadは確率的予測を好み、リスク調整された意思決定を生み出す手助けとしています。しかし、どちらの予測パラダイムにも同じ標準が適用されます。すなわち、予測が価値を加えるためには、デフォルトの意思決定を、企業の財務リターンに直接的かつ肯定的に影響する形で変更する必要があります。
例えば、新たな(「変更された」)意思決定は、デフォルトの意思決定がもたらすであろう将来の品切れを直接的に回避するかもしれません。
**「直接的に」**という点がここで極めて重要です。非常に単純に言えば、予測が価値を加えるのは、追加の財務リターンに影響を与えた、または財務損失を防いだ正確な_意思決定の変更_を特定できる場合に限るのです(デフォルトの意思決定と比較して)。
因果関係を考え、相関関係ではないことを意識してください。
Q2: より正確な予測は常に価値を加えるのか?
技術的には、そうとは限りません。より正確な予測は、それ自体として必ずしも「価値を加える」わけではありません。前述の通り、何か(この場合は予測)が価値を加えるためには、より良い意思決定を通じて企業の財務リターンに直接的かつ肯定的に影響を与える必要があるのです。
予測とは異なり、サプライチェーンの意思決定には実現可能性の制約(例えば、MOQ、ロット乗数、バッチサイズなど)や財務的インセンティブ(例えば、価格割引、支払条件など)があります。予測の数は、実現可能な意思決定の数を大きく上回ることがあります。
これは、サプライチェーンの意思決定が、時には(実際には多くの場合)予測精度の変化に対して_反応しない_ことを意味します。これは、時系列予測と確率的予測の両方に当てはまるのです。
この反応のなさは、意思決定を制約する要因(例:MOQ)に起因します。たとえば、より正確な予測(例えば10%の向上)が、より不正確な予測と全く同じ意思決定につながる可能性は十分にあります。以下の図がその点を示しています。
上記の例では、コンセンサス予測が55ユニットであり、自動化された50ユニットの予測よりも正確だったとします。しかし、財務的観点からは、精度向上が異なる意思決定(MOQのため)につながらなかったため、より正確な予測は価値を加えなかったことになります。
実際、より正確なコンセンサス予測が負の価値を生んだという強い議論も存在します。これは、標準的な予測価値付加プロセスに沿った追加のレビュー工程が、企業にとって余分なコスト(追加の時間と労力)を要し、より良い意思決定をもたらさなかったためです。純粋に財務的な観点からすれば、これらの手作業のレビューはネットでマイナスとなってしまいました。
また、MOQの制約が存在しない場合も考えてみましょう。
同じ全体シナリオを想像してください。ただし、今回はMOQの代わりにロット乗数が存在します。実現可能な意思決定は50ユニットごとの増分(例:箱やパレットに50ユニット)となります。この状況では、50ユニットか100ユニット(箱やパレット1個または2個)のどちらかを購入しなければなりません。
実際には、コンセンサス予測が示す55ユニットをカバーするために100ユニットを購入するより、50ユニットを購入する方が利益が大きいかもしれません(「より正確な」予測が示す量よりもわずかに少ないためです)。残りの需要をバックオーダーで補うか、単に売上を失う可能性もあります(例:生鮮食品などの消耗性商品の場合)。
経済学的な観点からは、最も良い財務的意思決定は「より正確な」予測に従うことではない場合もあります。このシナリオにおいては、自動化予測(50ユニットの需要)とコンセンサス予測(55ユニットの需要)のいずれも同じ意思決定(50ユニットの注文)につながるため、「より正確な」予測は追加の財務的価値をもたらしませんでした。
もちろん、すべての状況が同様に厳格な制約下にあるわけではありませんが、サプライチェーンはこのようなシナリオで溢れています。確かに、異なる予測は異なる意思決定を生みますが、価値という観点は依然として疑問視されるべきものです。常に、追加で購入するユニットから得られると期待される追加リターンが、予測精度の向上に伴い消費される余分な資源より大きいかどうかを考慮すべきです。
場合によっては、追加の精度向上が価値を生むこともあるでしょう。しかし、予測担当者やサプライチェーンの実務者は、絶対的な意味で価値があると直感的に仮定してしまう傾向がありますが、明らかなシナリオではそうでない場合も存在するのです。
ここで挙げた例と完全に一致しないシナリオを思いついたとしても問題ありません。今日の目的は、追加の予測精度が必ずしも追求する価値があるとは限らないという一般的な点を示すことであり、あらゆるサプライチェーンの意思決定シナリオを詳細に分析することではありません。
Q3: どのようにして、得られた価値が判断介入のコストに見合うかを確認できるか?
ディジョンでのパネルディスカッションの核心の一つは、予測プロセスにおける判断介入(または「人間による上書き」)の価値、あるいはその欠如についてでした。相手側の言葉を借れば、「自動化予測が何かを見落とした際に修正するために、人間を介在させる必要がある」というものでした。
この視点は非常に興味深いものです。なぜなら、それは人間による上書きが価値を加えると前提しているからであり、そうでなければ、誰があえてそれを行うのでしょうか。
ここでは、人間が自動化予測を(正確さの面で)上回るかどうかについての議論は置いておきます。実際、任意のSKUにおいて、人間は自動化予測と同等、あるいはそれ以上の正確さを示す場合があることは認めざるを得ません。
注:しかし、毎日数百店舗で何万ものSKUに対して予測を行う大規模なサプライチェーンの場合、時間的制約からほとんどのSKUを手動でレビューすることは不可能であり、そのため自動化予測は高い技能を持つ予測者や他の専門家チーム全体を大きく上回る性能を発揮するのです。
私が人間の判断が時に自動化予測に匹敵またはそれを上回る可能性があると認める理由は二つあります:
-
私の見解では、そうすることでエッセイがより興味深いものになるからです。
-
私の議論の強さは「正確さ」に依存していないからです。
私の立場は、皆さんもご理解の通り、人間による上書きが財務的価値を加える場合にのみ「価値を加える」とみなされるというものです―その価値は単一の再発注サイクルを超えて持続すべきものです。これは正確さの向上による利益とは全く独立したものです。
この価値は、「元々生成された意思決定よりも直接的に優れた決定を生み出し、より良い決定からの追加利益から上書きのコストを差し引いたもの」と理解できます。
簡単に言えば、判断介入(人間による上書き)はコストがかかるため、企業はその投資に対して著しいリターンを求めるべきです。したがって、予測精度は(意思決定から_切り離して考えた場合_)任意の指標にすぎず、企業は財務的リターンを高める行動に注力すべきだと主張します。
人間による上書きが予測精度を向上させる可能性は十分にあります(この議論のためにその点は認めます)が、必ずしも財務リターンを増加させるわけではありません。これは、ある部屋では最も背の高い人物であり、別の部屋では最も低い人物であるという事実と同様に、決して過激な命題ではありません。
なお、予測精度の向上が必ずしも利益の増加につながらないという証拠を提供する責任は、私にあるのではなく、増加した精度が_それ自体として利益を生む_と主張する側に、具体的で直接的かつ明白な証拠を示す責任があるのです。
改めて申し上げますが、これは決して過激または反主流的な立場ではなく、「当事者」である全ての人が当然採るべき立場だと考えています。
人間による上書きが利益を生むためには、すべての上書きの総体を考慮に入れる必要があるということを念頭に置いてください。つまり、全ての「ヒット」によって生み出された財務価値を評価し、それに対して「ミス」が引き起こした全ての財務的損失を差し引くということです。
この実験は、毎日、数多くの店舗(B2Bの場合は企業クライアント)とその全SKUに対して、かなりの期間にわたって実施されなければなりません。
「この実験はどれくらいの期間実施すべきか、Alexey?」という質問に対して、私自身は曖昧な立場です。例えば1年としましょう。しかし、この点は意思決定サイクルの回数やリードタイムなど、多くの要因に依存するため、議論に開かれている状況です。
とはいえ、この一連の議論は、人間による上書きの許容誤差の閾値がどの程度であるべきかという問題を提起します。
- ヒットがミスをやや上回っている場合、それは許容されるのでしょうか?
- 人間による上書き自体のコストはどう考えるべきか?
- これらの直接的および間接的なコストをどのように計算に組み入れるべきか?
これらは決して些細な問題ではありません。むしろ、STEM(またはSTEMに隣接する)分野の入門講座で新入生が尋ねるような質問です。
誰かが「大規模に展開された人間による上書きが財務的に価値がある」という決定的な証拠を提供するまでは、最も経済的に賢明な立場は、その価値がないと仮定し、自動化予測と自動化意思決定に依存し続けることです。
Q4: どのようにして、より正確な予測が意思決定のための現行予測に取って代わるべきかを判断するのか?
簡単に言えば、新しい予測がより良い意思決定をもたらすかどうかを考えれば良いのです。この場合の評価指標は、財務上の投資収益率(ROI)であるべきです。
より詳細に言えば、置き換えは単なる現時点での精度向上だけでなく、新しいモデルの全体的な有用性(例:ROI、適用性、保守性など)に基づいて行われるべきです。ROIこそが企業を成功へと導く舵取りとなります。適用性は、後述するようにROIを重視して設計されています。覚えておいてください:精度は、切り離して追求された場合、任意のKPIにすぎません。
たとえば、2つのモデルを考えてみましょう。1つは品切れ履歴に明示的に対応するモデルで、もう1つは(いくつかのデータ前処理の工夫を用いて)品切れを無視するモデルです。品切れがあまり頻繁に起こらなかった場合、意思決定の観点からはどちらのモデルもほぼ同等に見えるかもしれません。しかし、品切れに対応できるモデルを優先する方が賢明でしょう。なぜなら、品切れがより頻繁に発生し始めた場合、このモデルの方が信頼性が高くなるからです。
これは、Lokadの哲学のもう一つの側面、正確性をデザインに組み込むを示しています。つまり、設計段階で、起こりやすい事象と起こりにくい事象の両方を積極的に考慮し、対応できるモデルを構築することを目指しているのです。これは、最も大きな財務上のペナルティがしばしば極端な事象、つまり起こりにくい事象に起因するため、非常に重要なことです。
Q5: 本番環境において、どのようにして一つの予測モデルから別の予測モデルへ移行するのでしょうか?
予測は全体の意思決定エンジンの一部に過ぎないことを忘れてはいけません。そのため、一部を更新するだけでも、エンジン全体のパフォーマンスに小さな影響または大きな影響を与える可能性があります。たとえ新しいモデルが最終的により良い意思決定(すなわちより多くの利益を生む)をもたらすとしても、古いモデルから新しいモデルへの移行は問題を引き起こすかもしれません。
これは、理論上は改善された意思決定が、あまりにも急速に実施されると現実では前例のない制約に直面する可能性があるためです。
たとえば、新しい予測モデルは大幅に改善された発注書(PO)を生み出すのに役立つかもしれませんが、追加在庫を保管するためのスペースがまだ存在しなかったり、サプライヤーが増加する需要に即座に対応できなかったりする可能性があります。即時の利益を求めてPOを急いで完了させると、不十分な倉庫スペース(または労働力の制約)により、在庫が損傷したり早期に劣化したりするなど、別の場所で損失が発生する恐れがあります。
このような状況では、モデル間の移行を段階的に行うのが賢明かもしれません。実際には、一度に巨大なPOを発行するのではなく、在庫状況を徐々に修正するために、少し大きめの連続したPOをいくつか発注することになるかもしれません。
ブルウィップ効果(DDMRP 支持者を含む)に取り組んだ経験のある方なら、なぜこれが賢明な戦術なのかすぐにご理解いただけるはずです。
終わりに
ここまでお読みいただき、ありがとうございます。もし途中でご意見が異なったとしても、なおさら感謝いたします。
意見が異なる方への最後の一押しですが、価値とはより多くのお金を意味し、より多くのお金はより良い意思決定から生まれるのです。私にとって、良い(またはより良い)意思決定に勝るものはありません。より正確な予測でも、より効率的なS&OPプロセスでもありません。
もしそれでも意見が合わなければ、それで構いませんが、少なくとも我々がどこに立っているかは明確になっているかと思います。
お読みいただき、ありがとうございました。
お読みいただく前に
以下は、特に私と意見が異なった方にとって有用かもしれない追加のリソースです:
-
Lokadが実際に全ての不確実性(例:需要、リードタイム、返品率など)をどのように予測しているかについては、確率的予測およびリードタイム予測に関するビデオ講義をご参照ください。
-
Lokadがどのようにリスク調整された意思決定を行っているかについては、購買最適化に関する教育用チュートリアルおよび小売在庫割当のビデオ講義をご参照ください。
-
Lokadがどのように需要を構築し、価格戦略を最適化しているかについては、価格最適化に関するビデオ講義をご覧ください。