“ゲームを向上させるためには、まず終盤を研究しなければならない。なぜなら、終盤はそれ自体で研究され習得されることができるが、中盤と序盤は終盤との関係でのみ研究されなければならないからだ。” 出典: カパブランカの最後のチェス講義 (1966), p. 23

数週間前、私はフランス・ディジョンで開催された第44回国際予測シンポジウムのパネルディスカッションに参加しました。パネルのテーマは AI/MLの新しい世界における需要計画と判断の役割 でした。

Lokadの大使として、私の見解がどのようなものだったかご想像いただけるでしょう:

  • 予測および 意思決定 は完全に自動化されるべきである;

  • 予測の品質は より良い意思決定 の観点から評価されるべきである;

  • 自動化を向上させるために人間の判断が利用されるべきである(決して予測や意思決定の調整のためではない)。

チェス盤の写真

不思議なことに、私の自動化に関する立場は、皆さんが思うほど反対意見を引き起こしませんでした。議長(Lokadの広報責任者、コナー・ドハティ)と他のパネリスト(iqastのスヴェン・クローネおよびSupChainsのニコラ・ヴァンデプット)は、ほぼ一致してこれが予測の未来であると同意しました。唯一の意見の相違は、_どれだけ早く_この状態に到達できるかという点だけでした(: 私はすでにその状態にあると考えています)。

一方で、非常に多くの反対意見や混乱を招いたのは、予測精度より良い意思決定ほど重要ではないという私の主張でした。この意見の相違はパネリストだけでなく、聴衆にも見受けられました。私が考えるところ、理由は大きく2つあります:

  1. 私がステージで話した際、この点を補強するためのビジュアルがありませんでした。説明にはいくつかの動的な要素が含まれているため、ビジュアルは理解を助けたに違いありません。

  2. 予測精度が意思決定よりも重要でないという考えは、多くの専門家の教育、訓練、そして経験に反しているのです。

本エッセイの最後までに、上述の両点に対処できていることを願っています。第一の点に関しては、短いながらも体系的な説明と直感的なビジュアルを含めました。第二の点については、読者の皆様に今後5〜10分間、心を開いていただき、サプライチェーン予測に関するこれまでの訓練が全くないかのようにこの言葉に向き合っていただくようお願いするばかりです。

指針となる質問

私の見解を明確にするためには、5つの基本的な質問に答える必要があると考えています。このセクションでは、それぞれに比較的短い回答、言わば「お肉とジャガイモ」を提供するために最善を尽くします。ご安心ください、Lokadは技術的詳細を説明する豊富な追加リソースを持っており、それらはエッセイの最後にリンクいたします。

Q1: 予測が「付加価値をもたらす」とはどういう意味か?

まず例から始めます。例えば、ある企業において意思決定を生み出すためのデフォルトの仕組みが存在すると仮定しましょう(例:自動化された統計的予測 と自動化された在庫ポリシー)。

修正された予測が付加価値をもたらすためには、企業のデフォルトプロセスで生成されたデフォルトの意思決定を、企業の財務利益(すなわちドル、ポンド、またはユーロで表される利益)に直接かつ肯定的に影響を与える方法で変更する必要があります。

もし予測が(実際の需要を予測する上で)より精度が高くとも、それが異なり、かつより良い意思決定につながらなければ、_付加価値をもたらしていない_ことになります。

多くの企業は依然として時系列予測モデルを使用していますが、Lokadはリスク調整された意思決定を生み出すために確率的予測を好みます。しかし、どちらの予測パラダイムにも同じ基準が適用されるのです。どちらの予測タイプが付加価値をもたらすためにも、企業の財務利益に直接かつ肯定的に影響を与える方法でデフォルトの意思決定を変更しなければなりません。

例えば、新しい(「変更された」)意思決定が、デフォルトの意思決定によって引き起こされる将来の品切れを直接排除するかもしれません。

“直接的に” という点がここでは重要です。非常に簡単に言えば、予測は、デフォルトの意思決定と比較して、追加の財務利益に影響を与えた、もしくは財務上の損失を防いだ正確な 意思決定の変更 を指摘できる場合にのみ、付加価値をもたらすのです。

相関関係ではなく、因果関係を考えてください。

Q2: より精度の高い予測は常に付加価値をもたらすのか?

技術的には、いいえ。より精度の高い予測は、それ自体が必ずしも「付加価値をもたらす」わけではありません。なぜなら、前述のとおり、何か(この場合は予測)が付加価値を生むためには、より良い意思決定を通じて企業の財務利益に直接かつ肯定的に影響を与えなければならないからです。

予測とは異なり、サプライチェーンの意思決定には実行可能性の制約(例:最小発注量 (MOQs)、ロット乗数、バッチサイズ等)や財務的インセンティブ(例:値引き、支払い条件等)が存在します。実行可能な意思決定の数よりも、はるかに多くの予測が存在し得るのです。実行可能な意思決定という点にもご注意ください。

これは、サプライチェーンの意思決定が、時には(そして非常に頻繁に)予測精度の変化に対して_無反応_であることを意味します。これは時系列予測と確率的予測の双方に当てはまります。

この無反応性の理由は、意思決定に関する制約(例:MOQs)によるものです。たとえ予測が(例えば10%向上しても)より精度が高くても、全く同じ意思決定につながることは十分にありえます。下の図はその点を示しています。

最小発注量の存在下での予測精度が意思決定に影響を与えないことを示すチャート

上記の例では、例えば55単位のコンセンサス予測が50単位の自動予測よりも精度が高かったとしましょう。しかし、財務的観点から見ると、その向上した精度は(MOQの存在により)異なる意思決定につながらなかったため、より精度の高い予測は付加価値をもたらしませんでした。

実際、より精度の高いコンセンサス予測マイナスの付加価値をもたらしたという強い議論もあります。これは、標準的なForecast Value Addedプロセスに従った追加のレビュー手順が、企業に余分なコスト(時間と労力)を要求する一方で、より良い意思決定につながらなかったからです。純粋に財務的な観点からは、これらの手動レビューは正味でマイナスとなりました。

MOQの制約がない場合についても考えてみましょう。

同じ全体のシナリオを想定しますが、MOQの代わりにロット乗数が存在するとします。この場合、実行可能な意思決定は50単位単位(例:箱またはパレットあたり50単位)となります。この状況では、50単位か100単位(箱またはパレットが1つまたは2つ)を購入する必要があります。

商品の購入時におけるロット乗数の存在下で予測精度が意思決定に影響を与えないことを示すチャート

現実には、100単位を購入する(コンセンサス予測が示す55単位分をカバーする)よりも、50単位を購入する(「より精度の高い」予測が示すよりもやや少ない)ほうが収益性が低いかもしれません。残りの需要をバックオーダーで補うか、あるいは単に販売機会を失う(例:生鮮食品のような傷みやすい商品の場合)可能性もあります。

経済学的観点からは、最も有利な財務的意思決定は、「より精度の高い」予測に従うことではないかもしれません。このシナリオでは、自動予測(50単位の需要)もコンセンサス予測(55単位の需要)も結果的に同じ意思決定(50単位の発注)につながります。したがって、「より精度の高い」予測は追加の財務価値をもたらしませんでした。

確かに、すべての状況が同じ厳しさの制約を持つわけではありませんが、サプライチェーンはこのようなシナリオに溢れています。もちろん、異なる予測が異なる意思決定を生み出すことも認めますが、価値という問題は依然として残ります。常に、追加単位の購入によって得られる期待収益が、予測精度向上のために消費される追加リソースを上回るかどうかを検討すべきです。

場合によっては、追加の精度が価値を持つ状況もあるでしょう。しかし、予測担当者やサプライチェーン実務者は、絶対的な観点で追加精度の重要性を反射的に仮定しているように見受けられますが、明らかにそうでない状況も存在するのです。

制約のない状況下で予測精度の財務影響を評価する難しさを示すチャート

ここで説明した例と完全に一致しないシナリオを思い浮かべたとしても問題ありません。今日の目的は、一般的な主張を示すこと(すなわち、追加予測精度の追求が価値を生まない場合があるということ)であり、あらゆるサプライチェーンの意思決定シナリオを詳細に分析することではありません。

Q3: どのようにして、得られた価値が判断介入のコストに見合うものであると保証できるか?

ディジョンでのパネルディスカッションの核心部分は、予測プロセスにおける判断介入(すなわち「人間による上書き」)の価値(あるいはその欠如)についてでした。相手側の言葉を借りれば、「自動予測が何かを見逃した場合、それを修正するために人間が介在する必要がある」ということです。

これは、もし人間による上書きが付加価値を生むと仮定するなら非常に興味深い視点です―そうでなければ、いったい誰がそれを行うのでしょうか?

ここでは、人間が自動予測を(時には、または頻繁に)上回るかどうか(精度の点で)という議論は割愛します。実際、任意の個別のSKUに関しては、人間が自動予測と同等もしくはそれ以上の精度を発揮できることは認めても構いません。

注: 大規模サプライチェーンにおいて、毎日何千ものSKUを何百もの店舗で予測することを考慮すると、この主張は当てはまらないと私は考えます1。後者のシナリオでは、自動予測は、時間制約のために大部分のSKUを手動でチェックできないという理由から、非常に熟練した予測担当者や各分野の専門家チーム全体を大幅に上回ります。

ここで、人間の判断が自動予測に匹敵する、あるいはそれを上回る場合があると認めるのは、2つの理由からです:

  1. 私の意見では、それによりエッセイがより興味深いものになるから、そして;

  2. 私の議論の強さは『精度』に関する議論に依存していないという点です。

ご想像のとおり、私の立場は、人間による上書きが『付加価値をもたらす』のは、それが…財務的な価値を追加する場合に限るということです―その価値は単一の在庫補充サイクルを超えて持続します。これは、精度向上の利点とは完全に独立しています。

この価値は、「もともと生成されたものよりも直接的により良い意思決定を生み出し、より良い意思決定による追加利益から上書きのコストを差し引いたもの」と理解できます。

要するに、判断介入(人間による上書き)はコストがかかるため、企業は投資に対して顕著なリターンを期待すべきです。したがって、予測精度は(意思決定から_切り離して_評価すると)任意の指標に過ぎず、企業は財務リターンを増加させる行動に注力すべきだと私は主張します。

確かに人間による上書きは予測精度を向上させる可能性があります(この点は議論のために認めます)が、それが必ずしも財務リターンの増加につながるわけではありません。これは、ある部屋で最も背が高い人が別の部屋では最も低い人であるというのと同様に、決して革新的な提案ではないのです。

精度向上が利益の増加に直結しないという証拠を提供する責任が私にあるのではありません。定義上、精度向上が_それ自体で利益を生む_と主張する人々が、この主張を裏付けるための具体的で、直接的かつ論争の余地のない証拠を提供する責任があるのです。

繰り返しになりますが、これは革新的または反対意見を唱える立場ではあるべきではなく、実際にリスクを取っているすべての人にとってデフォルトの立場であるべきだと私は考えます。

人間による上書きが利益を生むためには、全ての上書きを総合的に考慮する必要があることを念頭に置いてください。つまり、全ての「成功」によって生み出された財務的価値を評価し、全ての「失敗」による財務損失を差し引くということです。

この実験は、かなりの期間にわたり、毎日、大規模な店舗ネットワーク(B2Bの場合は大企業のクライアント)と全SKUカタログに対して実施される必要があります。

“この実験はどのくらいの期間実施すべきか、アレクセイ?” この点については私自身迷いがあります。例えば一年間としましょうが、この点については議論に大いにオープンです。これは、年間の意思決定サイクルの数や、当然ながらリードタイムなど多くの要因に依存します。

とはいえ、この全体の議論は、人間による上書きにとっての許容される誤差の閾値が何であるかという疑問を投げかけます。

  • 成功が失敗を僅かに上回る場合、それは許容されるのでしょうか?
  • では、人間による上書きそのもののコストはどうなのでしょうか?
  • これらの直接的および間接的なコストをどのように計算に組み入れるべきでしょうか?

ちなみに、これらは些細な疑問ではありません。これらは、STEM(またはSTEMに隣接する)分野の入門講座で新入生が尋ねるような疑問です。

誰かが大規模に展開された人間による上書きが財務的に価値があるという決定的な証拠を示すまでは、最も経済的に合理的な立場は、それが価値を生まないと仮定し、自動予測と自動意思決定に依存し続けることです。

Q4: より精度の高い予測を、意思決定のために現在の予測と置き換えるべき時期はどのように判断するか?

要するに、最も簡単な方法は次の質問を考慮することです:新しい予測はより良い意思決定につながるか?この場合の評価指標は、財務的な投資収益率(ROI)であるべきです。

もう少し詳細に言えば、置き換えは新モデルの全体的な比較有用性(例:ROI、適用性、保守性など)に基づいて行われるべきであり、単に現在の精度向上だけに依存してはなりません。ROIこそが企業を成功へと導くものであり、以下で示すように適用性はROIを念頭に置いて設計されています。覚えておいてください:精度は、切り離して追求されるならば、任意のKPIに過ぎません。

例えば、2 つのモデルを考えてみましょう:一方は在庫切れの履歴を明示的に取り扱えるモデル、もう一方は在庫切れを無視する(いくつかのデータ前処理の工夫を用いる)モデルです。実際、在庫切れがそれほど頻繁に起こらなかったため、意思決定の観点からはどちらのモデルもほぼ同等の性能を示すかもしれません。しかし、在庫切れに対応できるモデルを選ぶ方が賢明です。なぜなら、在庫切れがより頻繁に発生するようになれば、このモデルの方が信頼性が高くなるからです。

これは、Lokad の哲学のもう一つの側面、設計による正確性を示しています。つまり、設計段階で、私たちは起こりやすい出来事と起こりにくい出来事の両方を積極的に考慮し、それに対応できるモデルを構築することを目指しているのです。これは極めて重要です。なぜなら、最も大きな財務上のペナルティは、しばしば起こりにくい出来事、すなわち極端なケースに潜んでいるからです。

Q5: 本番環境でどのようにして一つの予測モデルから別の予測モデルへ移行するのでしょうか?

予測は全体の意思決定エンジンの一部にすぎないことを忘れてはなりません。そのため、システムの一部を更新することは、エンジン全体のパフォーマンスに小さな影響または大きな影響を与える可能性があります。古いモデルから新しいモデルへ移行することは、たとえ新しいモデルが最終的にはより良い意思決定(すなわちより多くの利益を生む)をもたらすとしても、問題を引き起こす可能性があります。

これは、理論上は改善された意思決定であっても、あまりにも早く実装されると現実には前例のない制約に直面する可能性があるためです。

例えば、新しい予測モデルは大幅に改善された発注書 (PO) の作成を助けるかもしれませんが、追加された在庫を保管するためのスペースがまだ存在しないか、または供給業者が需要増に合わせて即座にサプライチェーンを調整できないかもしれません。今すぐに利益を追求して発注書を急いで完成させると、十分な倉庫スペース(または労働力キャパシティの制限)がないために、在庫が損傷したり早く劣化したりするなど、他の部分で損失が発生する可能性があります。

このような状況では、モデル間を段階的に移行するのが賢明かもしれません。実際には、単一の巨大な発注書をいきなり出すのではなく、在庫状況を徐々に是正するために、やや大きめの発注書を連続していくつか発行することが考えられます。

ブルウィップ効果DDMRP支持者を含む)に実際に取り組んだ経験のある方であれば、なぜこれが賢明な戦略であるか、すぐにお分かりになるはずです。

結びの言葉

ここまでお読みいただき、ありがとうございます。もし途中でご意見が異なったとしても、そのご注意にさらに感謝いたします。

異論をお持ちの方へ、最後に一言申し上げます:価値とはより多くのお金を意味し、より多くのお金はより良い意思決定から生まれるのです。私にとって、良い(またはより良い)意思決定に勝るものは何もありません。より正確な予測でも、より効率的なS&OPプロセスでもありません。

もしそれでも意見が一致しないとしても、それで構いません。ただ、少なくともお互いの立場がどこにあるかは分かっているはずです。

ご一読いただき、ありがとうございました。

退出前に

ここに、役に立つかもしれないいくつかの追加リソース(特に私に反対の方はご参考までに)を示します:

  • Lokad が実際にどのようにして全ての不確実性の要因(例:需要、リードタイム、返品率など)を予測しているのかについては、確率的予測およびリードタイム予測に関するビデオ講義をご覧ください。

  • Lokad がどのようにリスク調整済みの意思決定を実施しているのかについては、購買最適化に関する教育向けチュートリアルおよびretail stock allocationのビデオ講義をご参照ください。

  • Lokad がどのようにして需要の予測と価格戦略の最適化を行っているのかについては、価格最適化に関するビデオ講義をご覧ください。

備考


  1. 最大規模のサプライチェーンでは、100を超える国に何万もの店舗と数百の流通拠点が存在します。そのような巨大企業のカタログには、通常、数十万(場合によっては数百万)の異なる製品が含まれています。 ↩︎