00:00:00 予測精度は気を散らし、経営資源を独占する
00:03:30 時系列的思考は主体性、価格設定、代替を無視する
00:07:00 実際には、より高い精度が利益を減少させる可能性がある
00:10:30 精度は品揃えの抜け落ちや閾値を見落とす
00:14:00 時系列を超えて、粒度と習慣が重要になる
00:17:30 改善された指標は実践で失敗することが多い
00:21:00 予測は手作業の過労を生み出し、自動化は阻まれる
00:24:30 検閲された需要を無視すると?バスケット経済が失われる
00:28:00 運用可能性のためには、安定性が精度に優先する
00:31:30 計画の神話:固定需要、通常のリードタイム
00:35:00 利益と相関するKPIは予測‘精度’ではない
00:38:30 経済的なKPIは整然とした統計誤差に勝る
00:42:00 精度は利益と方向的に関連付けられない
00:45:30 意思決定に集中し、経済的要因を定量化する
00:49:00 サンプル収集、反復実行;無茶な意思決定をゼロに狙う
00:52:30 S&OPを捨て、リソース配分の意思決定を優先する
00:56:00 カテゴリ別パラメータを用いた統一KPI
00:59:30 もし阻まれたら、進展のため企業を変える
01:03:00 損益計算書による提案変更;簡潔な提案
概要
企業は予測「精度」を追求するのは、その測定可能性が理由であり、収益を生み出すからではありません。この指標—MAPE、MAE—はリアクションと点推定を報いる一方で、主体性、価格、カニバリゼーション、リードタイムの変動性、バスケット効果を無視します。精度を向上させることで意思決定が悪化する可能性があります:断続的な需要ではゼロが「勝利」し、不安定な予測はギアのかかったサプライチェーンを揺さぶります。FVAやS&OPはコストと遅延を増加させます。意思決定と経済性、つまり利益率、在庫切れペナルティ、過剰在庫リスク、機会費用(確率的にモデル化)から始め、無茶な意思決定を「ゼロ」に反復改善していくのです。損益に基づく統一KPIを使用し、もし企業が方向転換しないならば、説得力のあるケースを構築するか、企業を変えましょう。
拡張概要
「予測精度」に固執することは、重要なものではなく測定しやすいものを測る古典的な例です。企業は誤差指標(MAPE、MAEなど)を絞り込むために経営資源と予算を注ぎ込み、誤差が小さいほど利益が大きいと仮定します。しかし、実情はそうではなく、相関関係はしばしば弱く、時には逆相関すら見られます。つまり、“より良い”精度を得ても、意思決定が悪化する可能性があるということです。
なぜなら、時系列の精度は未来を過去の非活動的な延長として扱うからです。そこでは主体性、価格変動、カニバリゼーション、代替、リードタイムの変動や返品といった運用上の摩擦が無視されます。顕微鏡で細部を見る一方で、巨大な要素—品揃え設計、顧客行動、アイテム間のバスケット効果—が部屋の中を蹴散らします。小売ファッションにおいて、設計が不十分なコレクションが失敗するという精度の高い予測は、数学の勝利ではなく、依然として経営の失敗です。
精度を追求すると、不安定性が報われることがよくあります。モデルを過剰反応させると、見た目上の誤差が小さく評価される一方で、ギアのかかったサプライチェーンを通じて購買注文が激しく変動します。断続的な需要の場合、ゼロを予測することで指標上は「勝利」するものの、実際のビジネスは失敗します。経済が実際に機能する末端では、平均付近の精度は高コストな現実を見落とします:競合にバスケット全体を奪われる在庫切れ、生鮮品の廃棄となる過剰在庫、航空機の運航を止める20ドルのネジなど。
組織的な付加価値—FVAプログラムや「アライメント」を儀式化する会議(S&OP)—は、気を散らす要素にコストを重ね合わせます。遅く、手作業の同期サイクルは機敏性に対する負担です。同時に、多くのプランナーが、入力が不適切な粒度で表され、適切な不確実性が無視されているために、点予測を実行可能な意思決定に「翻訳」しなければならなくなります。
代替案は神秘的なものではなく、管理上のアプローチです。予測ではなく意思決定から始めましょう:今日、何を購入し、どこに配置し、どの価格で売るかを決めるのです。各意思決定に金銭的な要因—利益率、在庫切れペナルティ、過剰在庫リスク、機会費用、スタッフ制約—を付与し、不確実性を確率的に扱います。実践者と「実験的最適化」を繰り返し、目標を達成するまで反復します:求めるのはゼロの不正確さではなく、ゼロの無茶な意思決定です。すべてのカテゴリが同じ資金とキャパシティを争うため、カテゴリごとにパラメータを調整しながら、統一された経済的レシピを維持しましょう。
KPIに関して言えば、もし数学者があなたの式を「精度」として認識するなら、それはおそらく経済的ではありません。実際の、利益と連動したKPIは混沌としており、事業特有で冗長です—現実がそうであるように。そして、もし企業が構造的に精度フェティシズムに固執しているなら、合理的な選択肢は二つです:経営者向けに明確に包装された、損益計算に基づく変革のためのケースを構築するか、企業を変えるかです。スローガンではなく、インセンティブが成果を決定します。
完全な書き起こし
Conor Doherty: こちらはSupply Chain Breakdownです。本日は予測精度の隠れたコストを解明していきます。私が誰かはご存知でしょう。
私はLokadのマーケティングディレクター、Conorです。そして私の左側には、疲れ知らずのLokad創設者兼CEO、Joannes Vermorelがいます。本日、始める前にぜひコメントしてください:予測精度の向上は追求すべきKPIだと思いますか?もしそうなら、なぜですか?
下のコメント欄にお書きください。今日は直接私に話しかけているのです。どんな質問やコメントも、約20分後に私は直接Joannesに問いかけます。そして—すみません—それではJoannes、始めましょう。最初の質問です:今日、私たちは何に腹を立てているのでしょうか?ビジネスの礎である予測精度にどんな問題があるのでしょうか?
Joannes Vermorel: それをビジネスの礎と呼ぶのは言い過ぎかもしれません—むしろ供給チェーン管理の礎といえます。本当の問題は、ほぼすべての企業において、今やっていることを考えると、それは完全に気を散らすものであるということです。数十年にわたって続いている巨大な気晴らしなのです。
隠れたコストについて話すとき、私が予測精度に対して抱く問題—不満—は、繰り返しになりますが、サプライチェーンを運営するほぼすべての企業にとって、この要素、つまりこのアーティファクトが、僅かな利益に比べて管理リソースの半分以上を消費しているということです。私の言いたいのは、それが巨大な気晴らしであり、人々がこれをさらに精度に関連するプロセスを複雑にする方法で計測し始めると、さらに悪化し得るという点です。
Conor Doherty: もし予測精度という概念が帯域幅を独占していると言うのであれば、その批判やコストは時間や集中力、注意力といった抽象的なものだけに限定しているのでしょうか?多くの人が、確かに、これには具体的な財務面の側面も存在すると主張するでしょう。
Joannes Vermorel: はい。まず、未来を見始めると—再び言いますが、ほぼすべての場合において—未来を見るとき、全く無視される象のような大きな問題がたくさんあります。カニバリゼーションや代替も見えるように、クライアントの視点を採用していますか?もしそうでなければ、あなたの予測で何をしているのか正直よくわかりません。
価格設定は考慮に入れていますか?未来を予測する際には、自社の価格と競合他社の価格の両方を考慮する必要があります。ご覧の通り、私が予測精度に関して抱く奇妙な問題は、従来のサプライチェーンの考え方が、未来を天文学者が惑星の未来の位置を見るように扱う点にあります。過去と未来が完全に対称—時間反転の対称性—であり、未来は単に過去の延長であると仮定するのです。
極めて奇妙なのは、伝統的な未来の見方、すなわち予測精度において、企業が未来に対して何の主体性も持たないかのように振る舞うことです。単なる時系列の視点にすぎません。カニバリゼーションや代替が問題であることは明らかです。価格効果も存在します。そして、企業が需要予測にほぼ全力を注ぐ一方で、他の不確実性の源—リードタイム、返品など—はどうなるのでしょうか?
さらに進めて問うなら、予測における粒度はどうでしょうか?たとえその予測を行う前提を受け入れたとしても、どの粒度について話しているのでしょうか?
時系列の粒度、すなわち未来を日ごと、週ごと、月ごとと等間隔のバケットで見るという前提は、必ずしも合理的ではありません。その前提が成立しないビジネスも多々あります。そして、そこで不確実性も無視されているのです。これが点予測の問題点です。
それは膨大な数です。まるで象の群れのようであり—多くの象を何と呼ぶのが正しいのか私もよくわかりません。
Conor Doherty: 群れか突進か、というところでしょう。そんな感じだと思います。象の大群です。
Joannes Vermorel: この部屋には無視される象が非常に多く存在し、多くの企業が精度に集中しようとしています。それは非常に疑問です。私には、この部屋のことを何も知らずに、全体の部屋を見ていないかのように感じられます。顕微鏡で非常に小さな1平方ミリメートルだけを観察し、「もっと大きな顕微鏡が必要だ」と言うようなものです。私は、本当に必要なのはより大きく、より良い顕微鏡だという考え方に疑問を呈します。
Conor Doherty: ここで二つの重要な点があります。一つは、象の群れであること。二つ目—少なくとも寛大に見れば—最初の発言で、ほぼ全ての企業が莫大な金額や注意、リソース(つまり資源配分)を僅かな利益のために費やしていると述べたことです。
Joannes Vermorel: 利益のリターン、ということでしょうか?了解です。
Conor Doherty: それを深く解析する前に、もっと強固な立場は何でしょう?企業が少なくとも、彼らの行っていることに対してどんな利益があると考えているのでしょうか?
Joannes Vermorel: 彼らは、未来を時系列の点予測で捉え、平均絶対パーセンテージ誤差(MAPE)や平均絶対誤差(MAE)のような一次元的な指標、もしくは典型的な指標を採用することで、この基準の最小化が何らかの形で利益と正の相関があると仮定しています。私はこの立場に強く異議を唱えます。
非常にしばしば、相関関係はほとんどなかったり、全くなかったり、時には逆相関すら見られます。つまり、より不正確な予測が実際には企業をより利益を上げさせる可能性があるのです。ちなみに、これは15年前にLokadで私が最初に発見したことの一つです。我々は予測精度において優れた結果を出していましたが、しばしば混乱を引き起こし、初期のクライアントたちのビジネスを傷つけました。直感に反しますが、実際に起こり得るのです。
一例として、予測プロセスの精度を改善する最も簡単な方法の一つは、予測アルゴリズムを非常に敏感に反応させることです。つまり、直近のデータに小さな変動があった場合に、予測アルゴリズムが非常に強く反応するということです。しかし、その問題は、常に大きく上下する予測になるということです。つまり、より正確な予測ではあるものの、非常に不安定な予測になってしまうのです。
現実のサプライチェーンでは、あらゆる場所でラチェット効果が発生します。海外のサプライヤーに購入注文を出した後、もし翌日、単なる需要予測の一時的な上昇の反動で需要予測が急落すると、その購入注文に縛られてしまいます。これは典型的に、精度の向上が利益に結び付かず、むしろ利益を減少させる状況です。
もう一つあります—これが実際に15年前に確率的予測に至った状況でした。断続的な需要の場合、ゼロを予測すると、統計上は非常に正確な予測となる場合が多いのです。断続的な需要がある場合、予測モデルがゼロ需要を予測することがしばしばあります。統計的視点からすれば、これは非常に正確な予測ですが、ビジネスの観点からすれば、ゼロを予測すれば、補充もゼロになり、販売もゼロとなります。その結果、利益はほとんど生み出せません。
これが、精度を追いかけた結果として生じる種々のごたごたです。他にも多くの問題があります。改めて言いますが、予測精度と収益性に正の相関があるという信念は誤りです。本当に的外れなのです。
Conor Doherty: 以前に「直感に反するかもしれない」とおっしゃっていましたが、あなたや他の方々との議論を通して、あなたが何を達成しようとしているのかという目標を理解することが、感じる直感に反する度合いを和らげるのに役立つと思います。
例えば、もしあなたが、より高い予測精度こそが最適化すべき指標だと信じているなら、精度が低い予測が必ずしもより利益を生むわけではないというのは直感に反するかもしれません。しかし、より良い意思決定を行うこと、それが最終的な目標であるならば、私たちだけでなく、数年前に Stephan Kolassa が Foresight で指摘した「意思決定の鈍感性」という考え方があります。より精度の高い予測と低い予測があったとしても、例えば MOQ のような要因により、結局は同じ意思決定に収束するのです。したがって、追加の予測精度は何の利益ももたらさなかったということになります。市場に比べ、精度の低い予測の方が純利益の点でより有利だったのです。
Joannes Vermorel: 時系列の視点には多くの問題があります。あなたは、いわゆるマクナマラの誤謬を追いかけることになってしまいます。間違ったパラダイムを採用し、誤った指標を選んでいるのです。観客も調べることができますし、アメリカ側のベトナム戦争を指揮した誤った将軍たちについての Wikipedia ページも存在します。
一例を考えてみましょう。あなたはファッション企業、つまりファッションブランドであり、市場に投入しようとしているコレクションが、現在のトレンドに完全に一致するはずの一要素を全く欠いているという問題を抱えています。この問題を想定してみましょう。市場に登場しようとしているコレクションが、テキスタイル、スタイル、パターン—何であれ—超トレンディなものを完全に無視しているのです。
Conor Doherty: 70年代のベルボトム。
Joannes Vermorel: そしてあなたの予測は非常に正確です。あなたの次回のコレクションが惨めな結果になると予測しています。ありがとう。ええ、とても正確な予測ですね。どうもありがとうございます。
ご覧の通り、予測はあくまで予測するだけです―再び申し上げますが、ここで議論しているのは古典的なパラダイム、すなわち時系列での予測です―つまり、あなたが持っている時系列データのみを予測するのです。ところが、もし持っていないのに必要な製品があった場合、それはあなたの精度指標でどう扱われるのでしょうか?答えは:されません。
主な問題は、このパラダイム自体が非常に弱く、多くの事柄を無視しているために、ほぼ全ての企業にとっては関連する指標として成立させるための基盤作りがなされておらず、全くの気晴らしになっている点です。もし、企業が非常に成熟していて、現在の実際の品揃えとは完全に切り離された抽象的な需要という観点で需要を評価できるならば―すなわち、需要、リードタイム、価格、返品などのさまざまな不確実性をすでに考慮し、確率的な視点を取り入れ、さらには未来がまだ下されていない意思決定に依存しているという機能的な視点―つまり逐次意思決定プロセスに戻る―ことができる場合の話です。
もしそのような基盤が整った企業であれば、そこで初めて精度指標について自問し始めることができるかもしれません。なお、その精度指標はおそらくかなり奇妙なものになるでしょう。というのも、私たちはおそらく確率的予測の話をしているからです。しかし、まずはそのような多くの基礎が整備される必要があります。
「予測精度の隠れたコスト」とは、まさにこの基盤が完全に欠如しているために、企業が非常に偏狭な指標、すなわち事業の長期的利益を反映しない指標を追い求める、完全な気晴らしになってしまっているということを意味します。
Conor Doherty: 小売業の例をさらに掘り下げると、以前、品揃えの最適化について言及されていたのを覚えています。例えば、ファッション小売店であれば、明るい黄色のTシャツや鮮やかなピンクのTシャツをコレクションにいくつ入れたいのかという例を出されました。結局のところ、その選択は―まあ、なぜそれらを持っているかによります。販売できると思って仕入れているのであれば、必ずしもそうならないかもしれませんが、売れ行きはあまり良くないかもしれません。しかし、それらがないと品揃え全体が寂しく見え、結局は白いシャツと黒または青のジーンズだけになり、店全体が非常に無機質に見えてしまうのです。
ですから、あのピンクや黄色いTシャツの価値を時系列で捉えようとするのは―「ロスィー」という表現を使います―つまり、価値を失われがちな形で表現している、というか、そのようなものでしょう。私の言い回しが下手かもしれませんが。
Joannes Vermorel: そうです、確かにそれはあなたの店舗に関する情報を非常にロスィーに表現しています。そこで私が問いたいのは、情報の粒度とは何かということです。これらの予測の問題は、通常、あまり賢明でない視点を採用している点にあります。
店舗について考えるなら、実際に在庫管理、品揃えの意思決定―すなわち、品揃え、在庫、価格の各決定―をどのように最適化して、この店舗がうまく需要を捌けるかという視点が求められるのです。これが一つの視点です。もう一つは、すべての個々の顧客の長期的な価値をいかに最大化するか、という視点です。
これは例えばファッション業界において非常に重要です。顧客に割引を提供すると、その習慣が悪影響を及ぼします。顧客は突然、再び戻ってくることを期待し始め、戻ってきた際にも再度の割引を求めるのです。これもまた未来を見据えた行為であり、暗黙のうちに予測をしている状態です。
人々が予測精度について語り始めるとき、それは未来への予測の質に対する評価を表明しようとしているのです。私が言いたいのは、ほぼ全ての企業が陥っている、極端に狭い視野に固定された時系列予測というパラダイムに依拠した性質が、あまりにも制限的で誤っているため、このパラダイムから導かれるあらゆる数値指標が単なる無駄であるということです。それは時間の浪費であり、どれだけ改善されると思ってもそれはただの幻想に過ぎません。
これまでにも、何十件もの逸話的証拠を見てきました。MAPEやMAEなどの指標に基づいて「20%正確な」予測を提案したデータサイエンスチームが存在しましたが、その予測はあまりにも多くの問題を引き起こすため、生産段階に移行されることはありませんでした。Lokadも、15年前にはこうしたデータサイエンス主導の企業の一員でした。問題は今なお続いており、FVA(Forecast Value Added)といった最近の試みは、これをさらに悪化させているだけです。
Conor Doherty: プライベートな質問が寄せられています。もし公開コメントを避けたいのであれば個別に送っていただいて構いません;最後に私が尋ねます。しかし、FVAと精度の考えに関しては、さっき質問された件に戻りたいと思います。引き続き、予測精度の隠れたコストというテーマを掘り下げていきます。
あなたの著書もそのテーマに触れています。経済学はあなたの世界観の大部分を占め、直接費用と間接費用――つまり機会費用としての間接費用――の重要性を繰り返し強調されています。では、非常に具体的な話になりますが、企業が精度の追求に専念する場合、実際にはどのようなコストが発生するのでしょうか?それは日常の経費や損失としてどのように現れるのでしょうか?
Joannes Vermorel: そのコストは、在庫管理者や生産管理者、または実際の意思決定を担っている担当者が、最終的に半ば理にかなった決定に至るために数字をいじるのに多大な時間を費やす、という形で現れます。企業は時折、不思議に思います。「正確であるはずの予測があるのに、何を買うか、何を生産するか、どこに在庫を配置するか、価格はいくらにするかといったシンプルなルールから意思決定を導き出さなければならないとは。」結局のところ、これらの予測を実際の意思決定に転換するためには、膨大な人手が必要になるのです。
なぜでしょうか?それは、予測があまりにも的外れであるため、その予測が適切にカバーできない部分を補うために、莫大な人手や思考力を必要とするからです。実際、そのような人々やチームが未来を正しく考察し、意思決定を合理的なものにするためのすべての業務を担っているのです。
これが隠れたコストのひとつです。なぜなら、エンドツーエンドの意思決定プロセスにおいて、あなたのサプライチェーンが完全自動化されていないのは、予測が非常に機能不全だからであり、これは単に予測が不正確であるという問題よりもはるかに深刻な問題なのです。
それらの予測は、意思決定プロセスに適した形で表現されていない、つまり適切な粒度で表現されず、重要な点に焦点を当てていないため、必要なニュアンスも不足しています。結果として、数値化された未来という幻想に囚われることになってしまいますが、それは単なる幻想に過ぎません。古典的な視点から言えば、あなたは未来を数値化するという幻想を追い求めているに過ぎないのです。
Conor Doherty: 前置きしておきますが、ここではFVAについての論争には深入りしません。ただ、具体的なコストの例として、企業がFVAを導入するためにソフトウェア製品に対して直接的にも間接的にもかなりの資金を費やすことが多いという点が挙げられます。改めて申し上げますが、FVAが効果的かどうかについては論じません;それは重要ではありません。あくまで、ある指標を追求するための追加コストとして列挙されるのです――例えば、精度を増減させる要因を明らかにするため、という具合に。
ですから、単に注目するだけでなく、給与や機会費用も関わってきます。さらに、多くの場合(既に例もありますが)、ソフトウェアによる介入も発生します。つまり、あなたはベンダーに支払いを行っているなど、多くのコストが積み重なっているのです。
Joannes Vermorel: その通りです。そして、例えばS&OPで行われるように、プロセスに人を介在させる場合も同様です。S&OPの基本的な考え方の一つは、何とか同期性や精度を向上させることにあります。あなたは、営業チームが販売しようとしているものやマーケティングがプロモートしようとしているものを実際に生み出すように人々に働いてもらいたいのです。企業全体での同期が求められるのです。ある意味で、それは各部門間のずれを少なくするために精度を追求するということでもあります。
しかし、これには莫大なコストが伴います。この手動による同期作業は非常に遅いのです。多くの企業では四半期に一度、あるいは月に一度行われますが、それでも非常に遅い。たとえS&OPを実践している最先端の企業であっても、それは月単位のサイクルになるでしょう。私の見解では、これは非常に、非常に遅いプロセスです。精度追求に伴うもうひとつのコストは、突然、あらゆる活動が30日以上遅延してしまう点にあるのです。これは良い状況ではありません。
Conor Doherty: 私も同感です。そして、その点について付け加えたのですが。改めて、KPI、特に予測精度という焦点について言うと、あなたはこれが他の多くの不確実性の源、というよりも実質的には需要にしか注目しなくなるため、結果として他の不確実性を見失わせると指摘されました。つまり、需要を予測しているわけですが、その予測は時系列データという非常に特定のレンズを通して行われています。
Joannes Vermorel: その通りです。すべての需要を網羅しているわけではなく、実際には過去の販売実績に基づいて売上をほぼ独占的に投影しているに過ぎません。例えば、過去に大規模な在庫切れがあった場合、実際の需要を観測できなかったのに、どのように精度を考えればよいのでしょうか?在庫が不足していたために販売量が制限された、という検閲が存在したのです。
非常に典型的な例ですが、ほぼすべてのベンダー―またコンサルタントや多くの教科書も―は「問題が発生した期間のデータは無視すればいい」と言うでしょう。私の答えは、そんなことは絶対にない、というものです。例えば、ハイパーマーケットでプロモーションを行い、月曜の朝に2時間後に在庫切れに陥ったとしましょう―オープンして、パッと、2時間後には在庫がなくなる。これは非常に重要な情報です。もしプロモーションが10日間続くはずであれば、9日目の終わりに在庫切れになるのは全く別の状況です。
つまり、在庫切れになる事実が全てを無効にするわけではありません。たとえ複雑な事情が伴ったとしても、その情報は依然として利用可能です。再度申し上げますが、「精度」という概念に関して私が問題視しているのは、ほぼ全ての企業が欠陥のあるパラダイムに基づいてこれを実践しているため、追い求めるコストは膨大で、得られる利益はほとんど―あるいは全く―期待できないという点です。
Conor Doherty: あなた自身の例を取り上げ、隠れたコストの本質を掘り下げるとしましょう。あなたは在庫切れの例を出しました。伝統的な見方では、「店にいるのに卵がない。つまり卵の販売を失った」という考え方です。しかし、ほとんどの商品はセットで購入されるという点はどうでしょうか?
あなたは卵の需要を一定量予測しましたが、実際には卵の在庫切れが発生しました。「つまり、卵自体の価値を失った」ということになります。しかし、パン、チーズ、牛乳、ハム、柔軟剤、洗剤などはどうでしょう?これらはすべて買い物かごに入っていたはずです。卵という特定の商品――私自身も卵をたくさん食べます。見てください。もし店に卵がなければ、私は卵がある店へ行き、そこで他の商品に使ったはずのお金をすべて使ってしまうのです。
Joannes Vermorel: これが確率的予測の典型例です。サプライチェーンにおける経済的価値の大部分は、極端な状況、すなわち非常に高い需要が在庫切れを引き起こす場合や、逆に非常に低い需要が過剰在庫、場合によっては生鮮品の場合に在庫の償却を招く場合に存在します。
古典的な精度に注力するほぼすべての企業では、これらは平均値や中央値に焦点が当たるため見えなくなってしまいます。航空業界でも同様で、AOG(地上に留まる航空機)の事例があります。たった20ドルのネジ一つの不足で、A320が部品不足により1日間地上停機になるのです。
あなたの精度、すなわちポイント予測が経済性を反映または相関するという考えは、ほとんどの場合非常に誤っています。この点で覚えておくべきなのは、しばしば精度を向上させることが文字通り負の相関関係にあるということです。精度を改善することで、状況そのものを悪化させることになるのです。これは非常によくある現象です.
さもなければ、「精度を向上させているのは、少なくとも損はしていないからだ」という反論が出るでしょう。私の答えは、ああ、実際には損をするのです。非常に頻繁にそうなります。これこそが、データサイエンスプロジェクトが本番環境に移行するものが非常に少ない主な理由のひとつです。なぜなら、「より正確な」予測があまりにも多くの問題を引き起こすため、却下されてしまうからです。データサイエンスチームにとっては「でも、見てください。我々の予測は20%正確になったのに!」というフラストレーションが生じます。実務者は決して保守的ではなく、直感的にその数字が企業にとって大きな問題を引き起こすと理解しているのです。彼らは必ずしもエンドツーエンドの定量分析を持ってその理由を説明できるわけではないので、典型的な在庫プランナーは、より正確であるはずの予測が数多くの見えにくい問題を引き起こしているのを見て、「いや、私はそれが気に入らない。たった3年の平準平均を維持していたいだけだ」と言うのです.
データサイエンスチームからすると、それは非常識に映ります―なぜこの3年平均なのか?と。馬鹿げているように見えるのです。しかし彼らが見逃しているのは、時系列の視点を持った高度なモデルが完全に機能不全に陥っており、多くの問題を引き起こしているという事実です。在庫管理者にとっては、この極めて素朴な3年平均には、高い安定性や理解のしやすさといった魅力的な特性があり、未来を正確に捉えるための余分な作業を要するため、他の現実の意思決定業務に支障をきたさないのです.
Conor Doherty: まさに「未来を捉える」と言ったばかりですが、その論点の実質は、特に時系列を利用した需要予測に伴う直接費用と間接費用にほとんど集中しています。あなたは以前、リードタイムや返品などの重要性にも触れました。では、なぜほぼすべての企業が需要予測に関しては非常に熱心で、極めて正確な予測を追求する一方で、この巨大で非常に一般的かつよく知られた不確実性の源については語らないのでしょうか?
Joannes Vermorel: それが私が本に盛り込む部分です―第7章「未来」。ほとんどの企業が実践しているのは、技術的に言えば目的論的ビジョンで、ソ連のゴスプランのように、需要を1年先(あるいはゴスプランなら5年先)に予測して固定するという前提に立っています。そうすると、世界のゲームは資源配分の問題になり、必要な資源をうまく調整すればすべてが確実に行われると仮定されます。もしそうでなければ、それは解決すべき問題となるのです。
例えば、リードタイムについてですが、古典的な理論では「リードタイムを予測するな。信頼でき、時間通りに納品するサプライヤーを選べ」と言います。この見解は現実の世界で通用するでしょうか?通用しません。それにもかかわらず、ほぼすべての書籍でこの考え方が採用されています。さらに、もっとナンセンスな見解もあります。時には著者がリードタイムが変動しうることを認め、「正規分布を採用しよう」と言い、負のリードタイムにも正の確率が割り当てられるという―考えてみれば非常に奇妙です。教科書には「リードタイムは正規分布にしよう」と書かれており、つまりマイナス1日のリードタイム、すなわち「今注文して、昨日製品が届く」なんてことが平然と語られるのです。全く意味をなしません。それにもかかわらず、こうした考え方はソフトウェアや文献に存在します。
Conor Doherty: ヨアンネス、ありがとう。ちょっと言っておくと、裏で私のコンピューターが暴走していたんです。質問がないと思っていたのに、あなたが話している間に突然再起動して、実はかなり多くの質問が寄せられていたことに気づきました。全く気づいていなかったのですが、突然多くあるのを確認しました。少し処理する時間をください―マイクロソフトがちょうどいいタイミングでWindowsアップデートをかけたんです、信じられません。まさにそのタイミングで。コンピューターは完璧に動作しているのに、まさかライブイベント中にこんなことが。
後で結びのコメントに戻りますが、今はすぐにコメントに移ります。こちらはティムールからです: 「もし予測KPIが利益と相関していなければ、その特定の予測KPIは変更されるべきです。相関が見られるKPIに再定義した経験があります。」どう思いますか、ヨアンネス?
Joannes Vermorel: そうですね。しかし、本当に問うべきことは、必要な変更をすべて適用してKPIを利益と相関させたとしても、それを依然として「予測精度」と呼べるのかどうかです。文献で言われている予測精度と同じものなのでしょうか?先進的な計画システムや企業向け計画ソリューションで語られる予測精度と同じものなのでしょうか?私の答えは「いいえ」です。
では、実際に利益と相関するKPIを導入できるとしたらどうでしょうか?もちろん可能です。しかし、もはやそれは「予測精度」とは呼ばれません。この計算を見た誰もが「お、これは精度の一種だ」とは言わないでしょう。確かに、未来への予測の質を利益と相関させることは可能です。しかしそうすると、統計学者がもはや「精度」とは呼ばないほど全く異なるものになってしまいます。我々はあまりにも別次元に進んでしまったのです。
Conor Doherty: 次の質問はヴィヴェックからです: 「精度、つまりボリュームでの精度で測るべきか、パーセンテージでの誤差で測るべきか―ボリュームでの精度か、ボリュームでの誤差か?」
Joannes Vermorel: 問題は、単位で表される絶対的な指標や、パーセンテージで表されるものを持つことではありません。これは全くもって無関係な技術的問題です。同様に、平方根誤差などを選んだとしても同じことです。これらはすべて数学的に定義された道具であり、企業の利益とは何の相関もないのです。
適切なKPIがあれば、つまり統計学者や数学者がそのパフォーマンス指標の式をじっくり見て「これは精度と名付けられるものだ」と認識したとしても、それは経済的基準ではないのです。経済性を考慮に入れると、非常に厄介でビジネス固有の非常に具体的なものになってしまいます。他のビジネスに転用することはできず、そのビジネスの戦略的野望に極めて密接に結びつき、多くの例外が生じるのです。ビジネス特有の複雑さが山ほど存在します。
経済的側面に基づくパフォーマンス指標は非常に有用です。これらを適用しようとする場合、通常は非常に冗長になります。なぜならビジネスの多くの要因を考慮しなくてはならないからです。純粋な数学的基準であるMAPEやMAEのような数学的優雅さはありません。これは一行のコードで書けるものではなく、通常は数百行、場合によっては数千行ものコードが必要となるのです。
Conor Doherty: 先ほど送られた質問に戻ります。これは、より低い―というよりは不正確な―予測がより利益を生むというあなたのコメントに対するものです。以下、逐語で読み上げます: 「OK、10%精度が上がった予測では必ずしもより多くの利益は得られないが、20%精度が下がった予測は確実に損失を招く。では、精度は少なくとも方向性として利益と相関しているのでしょうか?」
Joannes Vermorel: いいえ、そうではありません。それは私がLokadの初期数年間に犯した過ちでした。Lokadのビジネスモデルは、より正確な予測を提供することでした。そして実際にそれを実現しました。今でも私たちは予測精度においてかなり優れているのです。数年前、ウォルマートのデータを用いたM5予測コンペティションでは、LokadはSKUレベルで世界一、全体では5位となりましたが、「より正確なAI予測」などを謳っていた競合他社はトップ100にすら入ることができませんでした。
20%精度が落ちた予測が、あなたの会社をより利益に導くことができるでしょうか?はい、絶対に可能です。これがLokadでの初期数年間に学んだ厳しく痛い教訓でした。では、どうすれば20%精度が高い予測を実現できるのでしょうか?それは、予測をより不安定にすることです。最新のデータの変動に非常に敏感なアルゴリズムを使うのです。これが予測精度を上げる最も簡単な方法のひとつです。しかし、このような不安定でより精度が高い予測を実際のサプライチェーンに投入すると、パフォーマンスが低下してしまいます。結果として、20%精度が低い予測に戻すことで状況が改善されるのです。
断続的な需要に対して予測を「より正確」にする最も簡単な方法の一つは、ほとんどの場合でゼロを予測することです。実際、過去に大手ヨーロッパのディストリビューター向けの大規模な入札で、ゼロだけを返すことで勝利したことさえあります。私たちは、ミニマーケットごと、製品ごと、日ごとに、そして各ミニマーケットごとに五日先の需要を予測していました。その評価基準は、予測値と実際値の絶対差でした。私は全体でゼロを返すゼロ予測モデルを使用し、この入札の予測コンペティションにおいて、2位の企業よりも20%優れた結果を出したのです。
はい、予測の精度を敢えて下げることでビジネスを改善できるのです。時系列分析は全く不十分であり、実際に時系列を用いると、常に奇妙な事態が発生します。だからこそ、予測の上に数字を調整し、微調整し、スプレッドシートで作業する多くの人々が必要になるのです―時系列予測を直接的に意思決定に転換することはできないからです。これが、1970年代後半以降、サプライチェーン自動化が実現しなかった根本的な理由のひとつです。それが問題なのです。
Conor Doherty: 次の質問はドミトリからです―そして、管理面で助けてくれて、また再投稿もしてくれてありがとう。まずコメント、その後質問です: 予測精度は簡単だから広く使われています。では、ヨアンネス、あなたは他のビジネスのステークホルダー、必ずしもすぐに理解するクールなオタクではない人たちに対して、どのようにあなたの概念を説明しますか?
Joannes Vermorel: 私たちのアプローチはこうです: 予測は忘れてしまいましょう。予測は数値的な人工物であり、一時的な値にすぎません。それは目的を達成するための手段です。目的とは何か?それは意思決定、すなわち、何を購入し、何を生産し、どこに在庫を置き、どの価格帯で販売するかということなのです。
では、意思決定を見てみましょう。各意思決定について、ユーロまたはドルで、影響を及ぼす約6つの力を定量化し、それらの力から見た結果が適切かどうか議論してみましょう。例えば、この店舗に1ユニットを配置する場合、本日この追加ユニットを置くことで得られる追加の利益率はどれくらいでしょうか?大まかな評価はできていますか?欠品によるペナルティはどの程度回避できるでしょうか―サービス品質の改善はどれくらいでしょうか?過剰在庫のリスクはどれくらい生じるのでしょうか?より良い製品に使える店舗スペースを占有することの機会費用はどのくらいでしょうか?
これらの経済的要因について合意を形成する必要があります。業界によっては、その要因は非常に多岐にわたるでしょう。作用する約6つまたは12の経済的要因は、企業ごとのビジネスモデルや戦略的意図の違いにより大きく異なります。それにもかかわらず、Lokadでの手法は、それらを将来―金銭的価値評価として組み込まれた未来―を反映する経済ドライバーに落とし込み、その上で実務家とともに、我々が正しい領域にいるかどうかを議論するというものです。
非常に頻繁に、純粋に財務的な視点から見ると、より質の高いフィードバックが得られます。人々はこう言います。「あ、忘れてるよ。今日このユニットを投入すると言っているけど、今日は店舗が人手不足だ。棚に商品を置くリソースが足りない。もし何かを押し出せば、販売現場で誰かが対応しなければならず、顧客サービスが悪化する。だから、ペナルティが必要だ」と。よし、それを追加要因として含めましょう。
このように多くの要素が未来への予測に組み込まれるのです。重要なのは、未来に向けて正しい判断を下すことです。だからこそ、私は「予測精度」ではなく「予測の質」という表現を使うのです。予測精度とは、単なる時系列における一点予測に過ぎません。
Conor Doherty: ドミトリが聞いていたので、続いての質問です: これらすべての経済的要因を5,000SKUのポートフォリオにどのように適用するか、教えていただけますか?あなたはそれ以上の規模も扱ってきましたよね。
Joannes Vermorel: はい、はるかに大規模なものです―我々は5,000万SKU以上に適用しています。重要なのは、数値的なレシピを書くことです。実務家と進める方法はサンプリングです。逸話的な証拠に基づいて進め、平均的な精度や平均的なパフォーマンスなどを追い求めるのはやめましょう―それがあなたを導くべきではありません。
この手法は、本書でも述べているように「実験的最適化」と呼ばれます。例を取って、プランナーが「次、次」と進み、SKUを見て「いや、これは納得できない」と言うのです。もし実際の人々と共にこの手法を始めると、彼らはあなたのレシピ―コードや出力、経済的要因ではなく―を見てすぐに異議を唱えます。「この点には同意できない。例えば、この製品について、あなたは欠品ペナルティがこれくらいだと言っていますが、これはおむつです。若い親にとっては非常に重要です。もしハイパーマーケットで正しいブランドのおむつが見つからなければ、すぐに別のハイパーマーケットに行くでしょう」―ここでのペナルティは大幅に過小評価されているのです。
彼らは逸話的なフィードバックを提供してくれます。そして、その後はサプライチェーン・サイエンティストの仕事となり、一般的なルールを理解し、その根本原因を突き止めるのです。Lokadでの実践的な実験的最適化の経験では、最初の試行でプランナーがあなたの提案の90%に異議を唱えます。どのSKUや意思決定を見ても、反対意見が山ほど出るのです。そして、何度も何度も反復します。非常に頻繁に、2ヶ月にわたって数百回、場合によっては1日に5回もの微調整と反復を経ます。これを、Excelのスプレッドシートで調整するようなアジャイルなプロセスだと考えてください。
時には、顧客がサプライチェーン・サイエンティストと電話で生の議論を交わすことさえあります。サイエンティストはその電話中にコードを修正し、実行して結果を確認します。そして、何度も反復していきます。やがて、実務家が「もう異議はありません」と言い、意思決定を確認して「いい感じで一貫している。もう混乱はない」と判断します。我々の生産目標は混乱ゼロです。精度ゼロではなく、混乱ゼロを目指すのです。これは全く異なる視点なのです。
これらはすべてサンプリングを通して行います。多くのSKUの平均的なパフォーマンスを求めても意味がありません。なぜなら平均を取ると問題点が見えなくなるからです。逸話や、個別に対処すべき特異なケースが見えなくなってしまいます。たとえ収益性を追求しても、非常に高収益なSKUは多数存在します。平均化すると、あるSKUでひどい―常軌を逸した―出来映えになっても、他の健全で利益の出るSKUに埋もれてしまうのです。だからこそ、実験的最適化と逸話的視点が必要で、コードを迅速に修正できるのです。
Conor Doherty: もう2つあります。コメントがたくさんあるので、上にスクロールしなければなりません。ドミトリ、本当に助かりました。さて、ここで―すみません、正しく発音できていることを願いますが―アリフ(またはレイフ)からの質問です: 「あなたの視点から、組織がサイクル内の隠れたコストを発見し対処するのに、どのようなアプローチが役立つでしょうか?なお、ここでいうサイクルとはS&OPのことです。アジリティとコスト効率のバランスも考慮する必要があります。」
Joannes Vermorel: S&OPは捨て去りましょう。そのプロセスにはたった一つの利点しかなく、それはコンサルタントを豊かにすることです。単にやめてしまい、本当に重要な意思決定に集中しましょう。どんな意思決定が行われているのかを特定するのです。本書では、サプライチェーンの意思決定を非常にシンプルに定義しています。それは、物理的な商品の流れを支えるための資源配分であるということです。それだけです。
例えば、あなたは1ドルをサプライチェーン用の原材料に変換します―これが資源配分です。次に、1単位の原材料を取り、それを半製品へと変換します―これも資源配分です。また、在庫の1単位をある場所から別の場所へ移動させる―これも資源配分です。資源配分に注目してください;それこそが意思決定なのです。そこから全てが始まります。
数値的な人工物―中間的なステップ―にプロセスを定義させてはいけません。予測はその一部ですが、完全に一時的なものです。使い捨てであり、取り除いてより優れたものに置き換えることが可能です。予測は意思決定とは異なり、根本的なものではありません。意思決定こそが根本です。50年後にビジネスを見直しても、1ドルが購入されたものへと変換され、生産プロセスを経るという問題は依然として存在するでしょう。そうした意思決定は、あらゆる数値的人工物とは異なり、非常に安定しているのです。
Conor Doherty: これは実に長いコメントで、多くの文脈があります。今回は敢えて質問に絞ります―後ほどより長い回答を送る予定です。大まかに言えば、調達や生産の制約、リードタイムの違いを反映して、サプライチェーンの各カテゴリーごとにKPIは異なるべきだと考えますか?
Joannes Vermorel:「通常はそうではありません。会社の経済性を反映するKPIが必要です。これにはカテゴリに依存する多くの要因が含まれることがあります。非常に大きく、多岐にわたる事業を展開する企業もあります。もしおもちゃと航空部品を扱う会社であれば、それは二つの別々の事業と言えます。おそらくKPIは全く異なるでしょう。
しかし、もし私たちが比較的均一な分野、例えば航空電子機器を扱っている場合、航空電子機器の種類によってKPIを異なる定義にするべきでしょうか?おそらくそうではありません。おそらく、あなたの持つコード、すなわちKPIの論理は全体として同じですが、カテゴリ固有のパラメータを持っています。これが典型的なLokadのアプローチです。時には製品固有またはSKU固有のパラメータも存在します。それで問題ありません。私の提案は、数値レシピをできる限り統一するよう努めることです。
なぜでしょう?結局のところ、あなたが行うすべてのことは同じ資源を巡って競争しているのです。購入するすべてのカテゴリは、最終的には会社の銀行口座にある同じドルを争っています。保管しているすべてのものは、同じ倉庫内の同じ保管スペースを巡って競争することになります。会社全体に共通する制約があるのです。物事が均一でなければ、各割り当て間で適切な裁定取引を行うのは非常に困難です。これは、従来のサプライチェーン最適化の考え方、すなわちカテゴリごとにサイロ的に処理するというアプローチにも問題があります。それは本質を捉えていません。サプライチェーンを最適化するのであれば、エンドツーエンドで行い、資源配分の中で経済的パフォーマンスのリターンが最も高い部分を見極めるべきです。
Conor Doherty:「ティムールの質問には非常に多くの文脈があったと言わざるを得ません。もし彼が聞いていたら、『Conorが私の質問を単純化しすぎた』と腹を立てていたかもしれません。後ほど、より詳細な回答をお送りします。Joannesはその全体の文脈を把握していなかったのです。あれは即席のコメントでした。」
私たちはすでに1時間話してきました。すべての質問とコメントに答えたと思いますが、まだ一つ残っています。このテーマに大いに興奮している人が多いようです。多くの人々は、変革を起こしたいと思いながらも、その制約を守らなければならないフレームワークの中で活動しています。我々は数値レシピや制約を扱っています。彼らはS&OPミーティングを開いていますし、少なくとも現状ではForecast Value Addedソフトウェアに沿って、またはその周りで運用しなければなりません。こういったシステムの中で、あなたが話している変革を始めたいと思っている人々に、どのようなアドバイスをしますか?
Joannes Vermorel:「会社を変えなさい―文字通りに。」
Conor Doherty:「というわけで、皆さん。本日はお招きいただきありがとうございました。」
Joannes Vermorel:「本気です。問題は、『このフレームワーク、この組織は完全に機能不全だ。何か明白にすべきことがあるのに、実行されていない』と言う時、会社を変えるべきだということです。こうすれば大きな変革が起こります。いつか、競合他社がその方法を見つけ、変革を遂行した場合、変革を実行しなかった会社には大きな問題が生じるでしょう。」
アマゾンに直面して破綻したすべての小売業者を思い浮かべてください。彼らは何が起こっているのか全く理解できませんでした。私がLokadを始めたとき、ヨーロッパの多くの小売企業と議論を交わしましたが、その多くはその後破産してしまいました。私がアマゾンを脅威として提示すると、「ああ、Mr. ML、アマゾンはただのニッチ、インターネット上の小さな存在に過ぎない。真剣なものではない。誰もテレビやソファ、ドレス、車などを―(ここに挿入)―インターネットで買うはずがない。人々は外に出るのが好きだ」と言われました。彼らは「これやあれをオンラインで買うことは絶対にない」と考えていたのです。結果は完全に覆されました。
もしあなたが多くの雑務に追われる組織にいる場合、競合他社が大胆な一手を打ち、その業務を自動化するとどうなるか想像してみてください。すべてが一掃されてしまいます。もしその変革を行わなければ、あなたの会社はどれほど長く持つでしょうか?あなたのポジションは依然として存在し続けると思いますか?
多くの人々が行き詰まっているのを見かけます。現代の特権の一つは、一つの場所に縛られずに動けること、特に定量的または分析的スキルを持つ人々にとっては、その需要が高いという点です。多数の企業が採用活動を行っています。Lokadでは採用に苦労しており、それは非常に困難です。なぜ壊れたプロセスによって自分を有効活用できない会社に、人生の何年も費やすのでしょうか?これは非常識です。
私の提案は、非常に丁寧かつ建設的に、変革を促すアイディアを提案してみることです。多くの場合、人々は驚くものです。変化が起こらない理由は、誰もそれを推し進めようとしていないからです。人々は初めから、その変化は却下されるだろうと仮定しているのです。
私の限られた経験から言えば、上層部に提案する余地は多くあります。もしあなたのケースが理にかなっており、しっかりとまとめられ、合理的かつ実行可能なものであれば、変革は実現可能です。これが私の提案です。
しかし、もしあなたが時代遅れのプロセスにとらわれているなら、あなたをより有効に活用してくれる別の会社に移ることが急務です。そうでなければ、10年後に今と同じ時代遅れのポジションに留まっている自分を想像してみてください。あなたの履歴書には、時代遅れの業務に従事した10年分の「忙しい仕事」が記されていることになり、次の雇用主に自分を売り込むのは非常に困難になるでしょう。
Conor Doherty:「これは理論上の話ではありません。ちょうどその理由で最近転職したチャンネルの友人がいて、彼らはそれを明かしました―彼らにとっては良い結果です。」
Joannes Vermorel:「また、市場で見たいと望む変革を自ら生み出す一つの方法でもあります。時代遅れのものを見て、『私はそれに加担しない』と言うのです。より賢明なことを行っている会社、例えば非常に利益を上げているAmazonのような会社に移れば、しばらくしてはずっと高い給料を得られる可能性が高くなります。」
Conor Doherty:「締めくくりとして、ティムールもあなたに同意しています。『Joannesの「会社を変えろ」というアドバイスに同意する。自分が納得することを実行できないのであれば、時間を無駄にするな』ということです。」
Joannes Vermorel:「その通りです。そして、変革を望むなら、自分の提案をしっかりとパッケージ化する努力をすべきです―つまり、ピラミッド型にまとめるということです。上司の上司向けに、半ページ以内の入門的な資料、非常に消化しやすいものが必要です。次に、より長いバージョン―おそらく2ページ―その後、場合によっては10ページ、さらには具体的な例を加えます。もしP&L(損益計算書)で表せる数字があれば、それは上層部に響くはずです。」
『ディープラーニングに進むべきだし、本当に低ランク分解を採用するべきだと思う。これが未来だ』と言うだけのデータサイエンティストにならないでください。経営陣は『一体何の話をしているんだ?』と言うでしょう。非常に現実的でなければなりません。ドルやユーロで表されたビジネスプランを提示された際に『聞く気にもならない』と言う役員には一度も出会ったことがありません。多くの場合、人々は『あなたの計画は面白いが、前提が間違っているため完全に欠陥がある』と言うのを見てきましたが、財務的な動機付けがあれば、経営陣がまったく関与しないということはほとんどありません。
Conor Doherty:「Joannes、我々は70分間話し合って立ちっぱなしでした。質問は尽きました。今日は先に運動もしたので、実際かなり疲れています。質問も時間も尽きました。いつもながら、あなたの洞察に感謝します。そして、参加して質問をしてくださった皆さん、個人的にも公的にも大変感謝しています。」
会話を続けたい方は、遠慮なく私たちに個別に連絡してください。また、このビデオをリプレイでご覧になっている場合(リプレイで利用可能です)、下のコメント欄にコメントを残していただければ、どなたかが返信いたします。では、来週お会いしましょう。そして、はい、仕事に戻ってください。