00:00:00 パネルキックオフ、参加者主導のKPI議論
00:04:00 サプライチェーンは経済学そのもの:希少資源を配分する
00:08:00 情報の価値が予測と財務を結びつける
00:12:00 小さなビーニーベイビーズが精度の誤謬を明らかにする
00:16:00 サービスレベルは非対称性とインセンティブを隠す
00:20:00 ポーカーのような在庫賭け;品切れ予測が重要
00:24:00 オプショナリティ:価格設定、割引、転送が結果を再構築する
00:28:00 リードタイムの不確実性と相関関係が単純な指標を崩す
00:32:00 パープルスワン:テールが未来の品切れを示す
00:36:00 航空宇宙需要:レトロフィットと幻の発注
00:40:00 意思決定からキャッシュへのシミュレーションがKPI追跡に取って代わる
00:44:00 2つのダッシュボード:経営者向け価値とデータの健全性
00:48:00 データ品質の不可解さ:マイナス値、返品、欠落する力
00:52:00 手動の上書きがモデルの欠陥を示す
00:56:00 KPIボーナスが対立とゲーミングを生む
01:00:00 グッドハートの法則:目標は時間と共に腐る
01:04:00 指標の壁を排除せよ;5つの必須要素を維持する
01:08:00 最終的なまとめとサインオフ
概要
サプライチェーンは応用経済学であり、希少資源を最大のリターンのために配分することです。予測精度やサービスレベルのようなパーセント表示のKPIは「科学的」に見えるものの、実際の非対称性をしばしば無視します。品切れは利益率を一掃する可能性があり、過剰在庫は通常、コストや値下げリスクのみを伴います。代替案としては、エンド・ツー・エンドのユーロ建ての意思決定評価があり、確率的予測、モンテカルロシミュレーション、そして予想と実績の財務結果が含まれます。ガバナンスは、モデルの失敗シグナル(特に手動の上書き)とデータの健全性を追跡し、KPIのゲーミングを招くインセンティブ・スキームを避けるべきです。
詳細な概要
議論は、サプライチェーンをその本質である、希少性下での応用経済学と捉えることから始まります。すべての選択―在庫の購入、素材の消費、在庫の移動―は、一度支出したら二度と使用できない限られた資源を費やすものです。したがって、適切な目標は「見た目が良い」パーセンテージを最大化することではなく、投入された資源に対するリターンを最大化することです。
その前提から、パネルは通常崇拝される偶像、すなわち予測精度とサービスレベルを解体していきます。これらの指標は、計算が容易で崇拝もしやすいのは、実際のビジネス現実から乖離しているためです。パーセンテージは科学的に見えるかもしれません―97.17%という数値は安心感を与えます―が、利益、キャッシュフロー、リスクについてはほとんど語りません。さらに、標準の精度指標は、経済学が非対称であるにもかかわらず、過大予測と過小予測を対称的に罰します。なぜなら、ストックアウトは利益率や顧客信頼を破壊する可能性がある一方で、過剰在庫は通常、在庫保持コストや値下げリスクのみを生じさせるからです。
代替案は、意思決定をエンド・ツー・エンドで財務成果に結びつけることです。パトリックはこれを「情報の価値」と位置付け、確率的予測(ポイント推定ではなく分布全体)を用い、モンテカルロによって意思決定をシミュレーションし、不確実性をKPIを介して財務諸表に波及させ、予測と実績を比較します。ジョアネスも同意し、技術的な議論―シミュレーション対密度モデリング―は二次的であり、重要なのはチェーンが抽象的な指標ではなくユーロまたはドルで終わるべきだという点です。
この議論は「静的な予測」マインドセットも批判します。小売において、需要は価格戦略や清算オプションに依存するため、オプショナリティを考慮せずに一つの未来だけを予測することは、計画を早まったコミットメントに変えてしまいます。実際の運用は動的であり、店舗間の在庫移動、割引、その他の手段が初期の意思決定後に結果を変化させます。
不確実性においては、リードタイムや希少なイベントが重要です。分布は長いテールを持つ二峰性になり、大口注文には相関関係が現れ、極端なケースが損失を支配します。「精度」はしばしば高価な1%を無視します―愚かな発注を引き起こす不具合、製品ライフサイクル在庫計画における季節的なミス、レトロフィットや保守のために緊急化する航空宇宙部品です。これらは統計的な珍奇現象ではなく、資金が燃え尽きる場所なのです。
最後にガバナンスについてです。ジョアネスは、最も重要な非財務的シグナルは自動化された意思決定に対する手動の上書きであると主張します―なぜなら、上書きはモデルの無知やデータの失敗を露呈するからです。両者はデータの健全性チェックを強調し、KPIに結びつくインセンティブがゲーミングを招くと警告しています。もし指標を目標とすれば、それは劣化します。したがって、指標は少数に絞り、財務に根ざしたものにし、官僚的なスコアキーピングではなく経営判断に依存すべきです。
完全な文字起こし
Conor Doherty: こちらは Supply Chain Breakdown です。本日のパネルでは、あなたのサプライチェーン-パフォーマンス-テストに最も影響を与えるKPIを分解していきます。私が誰かはご存知でしょう。私はロカドのコミュニケーションディレクター、コナーです。
私の左側には、いつものようにロカドの創設者、ジョアネス・ヴェルモレルがいます。本日の特別ゲストで、リモートから参加しているのはパトリック・マクドナルドです。彼はエボリューションアナリティクスのエグゼクティブアドバイザーであり、本パネルに約30年にわたる極めて関連性の高い経験をもたらしてくれます。
ではパトリック、まずはご参加いただき誠にありがとうございます。
Patrick McDonald: 本当にありがとうございます、コナー。ここにいられることは本当に素晴らしいです。
Conor Doherty: 完璧です。お越しいただき光栄です。
では始める前に、これはライブチャットです。このパネルは参加者の要望に応じて開催されています。ですので、質問やコメントがあればお寄せください。予測精度はあなたのサプライチェーンにとって重要なKPIだと思いますか?なぜでしょうか?サービスレベルはどうですか?議論はここでは控えましょう。
では話を進めましょう。ゲストであるパトリックから最初にお話を伺います。KPIの詳細な検討に入る前に、私たちは皆論理的思考者ですから、最初の質問は、サプライチェーンの意思決定の目的とは一体何だとお考えですか?その後、効果測定のためのKPIについて議論できるでしょう?
Patrick McDonald: それは本当に重要な質問だと思います。先ほど述べた通り、私は30年にわたりマネジメントコンサルティングとデータサイエンスの仕事に携わってきました。この質問に正しく答えることは、思っている以上に難しい場合が多いのです。
私たちは、まず「ここで私たちが正確に何をしようとしているのか?」と問いかけます。そして、定石としての答えは、資源をどのように配分するかという決定を下すことだということです。
非常に多くの場合、それは在庫をどこに配置するかということに関するものです。他の文脈では、努力の集中先や従業員の時間配分などについてになるかもしれません。
しかしサプライチェーンの視点から見ると、本質は「在庫をどのように配分するか?」ということです。それが私たちが下そうとしている核心的な決定なのです。その文脈で行っている決定を見極めなければ、真に焦点を合わせ、最良の結果を得ることは難しいと思います。
それが、私のキャリアを通して取り組んできたことであり、今日の議論の焦点でもあります。楽しみにしています。
Conor Doherty: では、ありがとうございます、パトリック。それでは、ジョアネス、あなたはサービスレベルを単独で最適化することに注力するのが好きだと聞いていますが、それがあなたにとってのサプライチェーンの目標なのでしょうか?要約するとそういうことでしょう?
Joannes Vermorel: そうとも言い切れません。私はパトリックの「意思決定に焦点を当てる」というアプローチを非常に評価しています。
特に私の見解としては、サプライチェーンは応用経済学の一分野であるということです。つまり、限られた資源の配分という一連の選択肢が存在するのです。
在庫:まず、何を購入するかに対してお金を使う必要があります。一度1ドルを何かに使えば、それを他のものに使うことはできません。そして、原材料を持ち、それを消費して何かを生産した場合、一度使用されると再利用はできません。
完成品の在庫を場所Aから場所Bに移動させた場合、移動が完了すると場所Aでは利用できなくなります。こうした希少な資源は、企業にとって最大限有効に活用されるべきです。
そして、これらの希少資源を最大限に活用するとは、要するにリターン率を最大化することです。
本質的には、投入した1ドルまたはその同等の資源ごとに、最大のドルのリターンを確保する必要があるのです。つまり、効果的にリターン率を最大化するということです。
Conor Doherty: では、ありがとうございます。パトリック、続いてあなたに。サプライチェーンが根本的に応用経済学の一分野であるというその見解に賛同されますか?
Patrick McDonald: まったくその通りだと思います。ここ数年私が採用してきたアプローチは、その分野の一概念であり、あまり広く知られていないかもしれません。それは「情報の価値」と呼ばれるものです。
私が主に行っている仕事は、データサイエンスの視点から予測を洞察として利用し、その上で在庫をどのように配置するかという決定を下す、という質問に答える手助けをすることです。
このようにして、モデルに基づいて予測を行います。例えば、在庫をそこに配置すれば、販売はどの程度になるか?販売が予測できれば、在庫レベルがどの程度になるかも予測できるのです。
それが分かれば、KPIがどのようになるかを計算でき、さらにKPIが分かれば、財務項目がどのようになるかも計算できるのです。
この全体の流れについて、私はここ数年検討してきました。通常、予測における不確実性のレベルに基づいたモンテカルロ分析を行っています。
これが重要なポイントの一つです。多くの人はポイント精度を追い求めますが、私はそれにそこまでこだわりません。むしろ、予測そのものの周囲にある実際の確率質量関数や密度関数に、はるかに重きを置いています。
ですので、それを活用しています。モンテカルロ分析を行い、洞察から意思決定、KPI、そして財務諸表に至るまでの全体の流れを追っています。それにより、何が起こっているのかを深く理解し、シミュレーションを実施し、可能な結果とその発生確率を検討することができるのです。
これを財務諸表にまで落とし込むことができれば、それを取締役会に持ち込んで「このような意思決定を行えば、以下のような結果が期待できる」と示すことが可能となります。
その後、実績と予測との差を実際に測定し、本当の価値を見出すことができるのです。多くの企業が行っている、単純なスプレッドシートでの線形回帰分析や、より洗練された予測で個々の予測精度を追い求める方法よりも、はるかに優れたアプローチだと実感しています。
ご理解いただけましたでしょうか?
Conor Doherty: さて、ジョアネス、それでご理解いただけましたか?
Joannes Vermorel: はい。ロカドがサプライチェーンに取り組む方法と非常に一致しています。
確かに、あらゆるシミュレーター―モンテカルロ手法と直接的な密度モデリングによる確率的予測―との間には二重性があります。未来に関する多数の偏差を生成できるものであれば、確率密度を再構築することが可能です。
そして、確率密度があれば、それを反映する偏差を生成することができるのです。つまり、双方を行き来できます。場合によっては、どちらか一方を使用するほうが実用的なこともありますが、それは高レベルの思考というよりも技術的な側面に過ぎません。
どちらの場合も意図は同じです。つまり、本当にやりたいのは、一連の流れを財務結果に結びつけることなのです。
多くのステップがありますが、基本的にはそれらすべてのステップは、単なる手段に過ぎず、最終目標は企業のために最大化すべき財務結果であるということです。
Conor Doherty: では、わかりました。多くの数学的用語が飛び交いましたね。完璧です。理解できました。
しかし、これをもう少し現実的に捉えたいと思います。では、パトリック、元のポイントに戻りましょう。我々は経済的影響こそが重要だという点で全会一致―完全なコンセンサス―に達しているようです。つまり、サプライチェーンは応用経済学なのです。
では、こう言う人に対して、「ちょっと待って、パトリック。もし予測精度やサービスレベルをどんどん向上させれば、サプライチェーンの経済的リターンは最大化されるはずだ」と考えるかもしれません。では、なぜより高い予測精度とサービスレベルが、より良い経済的パフォーマンスにつながらないのでしょうか?
Patrick McDonald: そうです。直感に反するかもしれませんが、それは単に事実ではありません。
数学的原理、すなわち―すみません、ここで少し数学的な話をさせていただきますが―「イェンセンの不等式」というものがあり、それがなぜそうでないかを理解するのに役立ちます。
いくつかの重要な要素があります。まず、伝統的な精度指標では、過大でも過小でも同じ重みが付けられるのです。
しかし、在庫においてはそれは当てはまりません。情報の価値モデルは、もし販売を失えばすべての利益率を失い、在庫が過剰であれば単に在庫保持コストが発生するだけだと示しています。したがって、そこには既に考慮すべき非対称性が存在するのです。
通常、私はそのような評価を精度指標に対して行っています。
もう一つ見落とされがちなのは、予測―すなわち未来の結果―には不確実性が内在しており、その不確実性は基本的に密度関数に関連付けられているという事実です。
この不確実性には様々な対処法があります。長年にわたり行ってきた最も単純な方法は、標準偏差を理解し、それを用いて一定の境界を設定することです。
それは、計算能力が非常に限られていた当時には有効でした。しかし、今では私の個人用MacBookで、大学時代にはクレイ・スーパーコンピュータが必要だったような処理が可能になっています。
今日の計算能力は以前よりもはるかに高いため、私たちはもっと多くのことができるようになりました。情報の価値関数と、確率密度関数の形状の両方を検討する必要があります。
そこで、いくつかの重要な指標が役割を果たすと私は考えています。
少しお付き合いいただければ、私がこの分野に初めて関わった経緯―最初にどのようにこの問題と向き合ったか―そしてなぜそれがキャリアを通じて私にとって重要になったのかという話をさせていただきます。
当時私はキャリアを始めたばかりで、マクドナルドのためにデータウェアハウスを構築していました。私はProcoのコンサルタントをしており、1997年の出来事でした。つまり、当時の私がどれほど若かったかがお分かりいただけるでしょう。
それは彼らが初めてTeeny Beanie Babyのプロモーションを行った年でした。覚えているかどうかは分かりませんが、当時は大ヒットで、ニュースにも取り上げられました。人々はハッピーミールを買い、玩具を手に入れるために食べ物を捨てるほどでした。
実際、配送員の貧乏な男性が、誰かがおもちゃを盗もうとして襲われる事件があり、全国ニュースになりました。本当に大きな出来事だったのです。
プロモーション初週の月曜の朝に私たちが到着すると、経営陣は「店舗品切れ日報が必要だ」と私たちに詰め寄ってきました。
なぜなら、彼らはTeeny Beanie Babyをあっという間に消費していたからです。それはプロモーション商品で、安価である必要があり、市場全体の買い物かごに大きな影響を与えるのですから。
安価でなければなりません。中国から仕入れているため、1年前に注文する必要があり、決まった数量しかなく、補充のチャンスはなかったのです。
プロモーション期間が続く限り、もしTeeny Beanie Babyがなくなればプロモーションは終了し、売上は急落するというわけです。
そこで私たちはレポートを作成しました。そして予想通り、約1週間半で品切れとなりました。
では、それは良いプロモーションだったのでしょうか?潜在的にはそうかもしれませんが、考えてみてください。1週間半の間、売上は予想の4倍になったのに、その後、残りの3週間はプロモーションがなかったために通常以下に急落してしまったのです。
そこで彼らは私たちに戻ってきて「来年は何個注文すべきか」と尋ね、私たちは「4倍にすれば良い」と答えました。しかし、最終的には「いや、それは多すぎる。2倍にしよう」と決定されたのです。
翌年は2.5週間で品切れとなりました。
こうした経験を通じて、私は課題の本質を理解し始めました。その一因は、適切な予測が得られなかったことにありました。
そこで私たちは「暫定予測システム」と呼ばれるものを構築し、それは18年間運用されました。本来はより良いシステムができるまでの仮措置として存在していたものですが、18年間、ハッピーミールのおもちゃやマクドナルドのバーガーパティの予測を行い続けたのです。
本当に苛立たしかったのは、予測ベンダーたちがやって来て「もっと正確な予測を提供できる。正確性が上がればビジネスの成果も向上する」と主張することでした。
それはまるで、ゲイリー・ラーソンのファーサイドの漫画のようでした。全ての方程式が書かれたボードの前に立つ男が、説明できない中央の部分を指しながら「そして奇跡が起こる」と言っているようなものでした。
私は、分析の価値あるいは情報の価値をバリューチェーン全体にわたってモデリングする方法を理解するまでは、これらの点をどうも結びつけられなかったのです。
これが私のキャリアの道筋であり、データサイエンスに取り組んできた30年間の間に私が努め続けてきたことの一つです。
Conor Doherty: ありがとうございます。Joannes、その点はあなたの視点と非常に合致していますね。
あなたの著書『On the Table』では―その言葉を引用させていただきますが―正確性やサービスレベルを気を散らすもの、劣った代理指標、そしてお気に入りの用語である「数値的なアーティファクト」と表現していますね。
では、簡単に言うと、なぜそのように感じるのでしょうか?おそらく、パトリックが先ほど述べた内容の一環なのでしょう。
Joannes Vermorel: 基本的に、サービスレベルを見ると、本質的にはパーセンテージで表される非常に数学的な概念です。それは、ビジネスにおける経済的な価値を反映しているわけではありません。
つまり、パーセンテージに基づくものを扱う際には注意が必要であり、それがビジネスの現実に根ざしているとは必ずしも言えないのです。
これが問題なのです。たとえ測定や数値があって非常に科学的に聞こえたとしても、本当にそうなのでしょうか?
パトリックの「そして奇跡が起こる」というコメントには本当に感謝しています。パーセンテージはあるものの、それがどのように収益性につながるのかは不明なのです。「そして奇跡が起こる」。もしかすると、かもしれませんが、そうでないかもしれません。
問題は、パーセンテージが存在すると科学主義に陥る危険があるという点です。数値も指標もあり、例えば97.17という非常に精密なパーセンテージがあれば、非常に合理的に見えてしまいます。
しかし、実際はそれは単なるパーセンテージに過ぎず、会社の長期的な利益と結びついているとは言い難いのです。
さて、サービスレベルに戻ると、記述的側面と指示的側面の両方が存在します。
記述的とは、過去を振り返るということです。しかし、例えば特定のSKUについて振り返ると、通常高いサービス品質を示しており、多くのSKUが100%である場合、その情報だけではあまり多くを語ることができません。
例えば、プロモーションが始まる前、このBeanie Babyのおもちゃが永続的に100%もしくは未定義であったとしたら、記述的には非常に役に立たなかったでしょう。
そして、在庫がなくなって売上がゼロになると、サービスレベルは1単位の不足と100単位の不足を区別しません。
つまり、「在庫切れだ」と示していても、100個売って1個欠けている場合と、1個売って100個不足している場合では、在庫切れの意味は全く異なるのです。
したがって、記述的側面だけでは状況を十分に説明できないのです。
次に、指示的な側面、つまり「サービスレベルに関して何を見るべきか」という問いについて考えると、まさにあなたが述べた通り、経済的な非対称性が考慮されていないのです。
例えば、マクドナルドのように、売上成長に二桁のパーセンテージで影響を与え、売上を大幅に増加させることができる商品があり、中国からそのおもちゃを1食あたり数セントで仕入れられるとしたら、これは極めて非対称な状況です。
つまり、限られた投資で莫大な成果を得ることが可能になるのです。
このような状況では、「これらのプラスチック製のおもちゃは腐らず非常に安価であり、その上昇余地は非常に高い。過剰在庫のリスクを取るべきかもしれない」と判断するでしょう。
もしうまくいかなければ、時間をかけてそれらを処分すれば済むのです。例えば、マクドナルドでは最悪の場合、顧客は1ヶ月間にハッピーミールとともに2個のおもちゃが付く程度です。
たとえ2個目のおもちゃがそれほど優れていなくても、ハッピーミールに2個のおもちゃが付いているからといって、多くの顧客が激しく不満を示することはないでしょう。
つまり、1食あたりのコストが抑えられている限り、過剰在庫を抱えるリスクはそれほど大きくないと考えられます。
Patrick McDonald: まさにその通りです。まず、正確性を数学的な人工物と捉えるあなたの考え方がとても好きです。
私は基本的に、少し違った視点でこの問題を見ています。これを「誘惑的な六つの仮定」の一つと呼んでいます。データサイエンティストが陥りがちな六つの仮定のうちの一つです。
その一つが局所最適解と大域最適解の問題です。つまり、もし「それは数値的な人工物だ」とするなら、正確性に注目することは、局所的な数学的な人工的最適解に偏ってしまい、本来注目すべきは「どれだけのキャッシュフローや利益を最大化できるか」という点なのです。
これが局所対大域の問題です。
この点について考えると、もう一つ浮かぶのは、実際にどの意思決定を下そうとしているのかということです。
在庫の意思決定は、まるでポーカーをしているかのようなものだと思います。不確実な情報に基づいて、テーブルにチップを投入し賭けを行うのです。
できるだけ多くの情報を持ちたいものですが、その分リスクも伴います。
私の現クライアントはオランダに拠点を置く企業です。彼らはソフトウェア・アズ・ア・サービスを提供しており、小売業向けに予測を行い、小規模小売業者の在庫配置を支援しています。
彼らの予測アプリケーションで分かったのは、まず正確性を追求したものの、それが特定の小売業者にとっては最も重要な要素ではなかったということです。
最も重要だったのは、在庫切れになるか否かを予測できる能力でした。なぜなら、小売業者は出荷を行うからです。
例えば衣料品の場合、通常、スタイル、色、サイズごとに1つ、あるいはせいぜい数個しか保有せず、出荷は週に一度です。
つまり、補充するかどうかが重要です。倉庫に在庫があっても店舗に置いてあっても、運営費用は大差ありませんが、店舗の床にあまり多くの商品が並びすぎるのは避けたいのです。
しかし、十分な在庫は必要です。だからこそ、彼らの予測能力は「この1単位が売れるか、在庫切れになるか」を把握することに重点が置かれているのです。
これが、物流センター(DC)から小売店へ在庫を移すべきかどうかという問いへの答えとなります。
これは非常に良いアプローチです。何個売れるかという具体的な数字を狙うのではなく、別の観点から意思決定にアプローチしているからです。
要は、「出荷するかどうか」という決断を下すということです。
この点を真に理解することで、どの質問に答えようとしているのか、そしてどの指標を使うべきかが明確になるのです。
そのため、彼らは数値的な「何個売るか」というよりも、「在庫切れになるかどうか」というカテゴリー的な決断において、リコールと精度をより重視しているのです。
これは、実際の意思決定においてより良い情報をもたらす予測指標の別の一形態だと私は考えています。
ご理解いただけますでしょうか?
Conor Doherty: 全くその通りです。本当にその通りです。
Joannes Vermorel: 意思決定の視点から物事を見ると、もう一つの利点が出てきます。例えば需要予測の場合、運用方法によっては、良い答え―正確な答えすらも得られない可能性があるのです。
例を挙げると、ファッション小売ネットワークでは、コレクションの終わりやシーズンの終わりに、現在のコレクションを処分するためにディスカウントを行う機会があります。
したがって、「この需要レベルを予測する」と言った場合、問題はどの価格帯でその予測を行っているか、という点にあります。
現行価格がある一方、ディスカウントを行う選択肢も存在します。さまざまな戦略を検討する必要があるのです。
もしシーズン終了までその商品を倉庫に保管するなら、どこかでディスカウントをせざるを得なくなりますし、
それを店舗に移せば、ディスカウントを行う前にシーズン終了前に販売できる可能性が出てきます。
しかし、もしかするとその特定の店舗は、ディスカウントに関して市場力が低く、地域の顧客層が他の店舗と比較して割引に対して反応が乏しいかもしれません。
ですからご覧の通り、局所対大域の問題だけでなく、未来を静的なものと捉えてしまうと、自分たちが未来を形作るための能動性を完全に失ってしまうのです。
つまり、予測第一の考え方の問題は、企業として持つべき能動性を奪ってしまう点にあります。すなわち、「これが計画であり、これがコミットメントである。これを実行する」というふうに固まってしまうのです。
それに対して、「これは正しい決断であり、その決断に合わせて多くの選択肢を保持しておく」という考え方とは異なります。
私は決断以上に拘束される必要はなく、下す決断こそが唯一のコミットメントであり、その他はオープンなままであるべきだと考えています。
これが予測の問題点であり、企業を完全に選択肢の余地のない軌道に閉じ込めてしまうのです。
例えば、後で店舗間での転送を行いたい場合はどうでしょうか。可能な選択肢かもしれませんし、そうでないかもしれません。しかし、意思決定という視点で考えれば、その考え方は非常に自然に浮かび上がるのです。
一方、特に時系列の予測として物事を考えると、これはほとんど表現することが不可能なものとなってしまいます。
Patrick McDonald: 実は、私の現クライアントはそのようなことも行っています。転送モジュールを使い、ある店舗で売れやすいと思われる特定のバリアントを、別の店舗に転送するべきかどうかを検討しています。
また、価格に関する分析も進めており、基本的な価格弾力性の分析を行って、「ディスカウントすれば販売量は増えるのか、それとも単にマージンを失うだけなのか」を検証していました。
その問いに答えられるようになってきています。
動的なものか静的なものかについて触れていただける点が非常に気に入っています。これは私たちが常に考えている「神聖な六つの仮定」の4番目に該当します。私たちはすべてを静的な均衡問題として捉えがちですが、実際の多くの事象は動的なのです。
したがって、これらは極めて重要な意思決定であり、選択肢の余地を十分に考慮に入れる必要があると考えています。
もう一つ、あまり十分に議論されていない分野があると思います―私自身もまだ深く踏み込んでいないのですが、問題は非常に複雑で、既に他の人たちが取り組んでいるとも聞いています―それは、配送時間に関する大きな不確実性です。
特に製造業においては、サプライヤーからの供給があり、全体のビルオブマテリアルズを待たなければならない場合があります。
納品が定刻通りに行われることもあれば、そうでないこともあります。その不確実性は、モデリングする必要があるのです。
その点についてはうまく対応している人たちもいますが、計算能力の面で、より深く検証できるようになったと思います。
だから、供給側においても、その状況がどのようなもので、どこに向かうのかを理解する上で機会があると思います。
Joannes Vermorel: はい。ちなみに、YouTubeで確率的リードタイムモデリングに関する講義も行っています。
我々は長年にわたり多くの不確実性の情報源を組み合わせる技術を構築してきたため、通常、古典的な精度はそのままでは役に立たなくなります。
それらの非対称的な懸念があるため非常に困難です。あなたは多くの不確実性を組み合わせていますが、それぞれが全く直感に反する非対称性を持っています。
それらは組み合わさることがあります。例えば、リードタイムは…ほとんどのリードタイム分布は二峰性です。すべてが順調に進んだ場合の通常期待される日に対するモード(ピーク)があり、計画通りにいかない場合には非常に長い裾野が現れます。
さらに、しばしば平均さえも存在しない分布であり、なぜなら一部の物は決して納品されないからです。つまり、数学的には平均すらも存在しません。ちょっと奇妙です。
加えて、納品時間が完全に予測不能になるのは、大きな注文を出す場合です。これは案外当然のことで、大きな注文を出すと供給業者が苦労するのです。
つまり、相関関係が生じます。
私が言いたいのは、精度やパーセンテージに基づいた古典的なサプライチェーンのパラダイムに従うと、これらすべての効果を組み合わせた場合、実際にコストがかかる要素がパーセンテージの観点からは全く明確でないことに気づくということです。
結果的に非常に愚かな結果になる可能性があります。例えば、クリスマスに販売するための新鮮で傷みやすい製品―例えば牡蠣―がある場合、非常に時間に敏感です。
もしクリスマスと新年を逃せば、終わりです。手持ちの品を80%割引で販売せざるを得なくなり、それが最良のシナリオになるかもしれません。
すべてが惑星の配置のように意図的にあなたを苦しめるわけではありませんが、実際には多数のエッジケース、すなわち各製品固有のエッジケースが山ほど存在します。
だからこそ、最終的にはすべてをドルまたはユーロに結びつける必要があると最初に述べたのです。
これらの不確実性を組み合わせると、予測モデルの弱点が非常に直感に反する形で現れることに気づくのです。一見、統計学者が「まあ、かなり正確で調整されている」と言うようなものであっても、結局のところ問題が発生するのです。
例えば、中国から発注書を出すべきかどうかを判断するために毎日ロジックを再実行し、100日のうちの1日―すなわち1%の確率で―数値的不安定性が原因で急上昇する場合、モデルの数値的不安定性のせいで年間に約3回の注文を中国の供給業者に出すことになるのです。
今日、その数値が急上昇し、まるで幽霊を追うようになるのです。それは、その日のモデルの数値的不安定性による数値的な人工産物です。
精度の観点から言えば、この種の問題がたった1%の確率でしか発生しないなら、他の要素に完全に埋もれてしまい、平均精度にはほとんど現れません。
つまり私が言いたいのは、予測モデルの弱点はドル単位で評価されるべきだということです。そうしなければ、大部分のパーセンテージベースの指標では取るに足らないものに見えても、ドルで評価すると「おっと、これ小さいと思っていたのに、実際は大きい」と気づくのです。例えば、中国の供給業者への発注書におけるラチェット効果を忘れた場合などです。
Patrick McDonald: 私たちはその点について考え始めています。タレブが最初に著書『ブラック・スワン』でそれについて語りました。ご存じでしょう?
今ではグレー・スワンやブラック・スワンがあります。私自身は「パープル・スワン」と呼んでいる、非常に独特な要因によって発生する奇妙な分布も存在します。これがエッジケースです。
それらは標準的な分布には収まらず、数値的に記述することすら困難です。実際の確率密度関数を用い、値の配列として扱わなければなりません。
その最初の例は、航空宇宙企業の概念実証のために予測ソリューションを実施していた際、彼らからsafety stockの計算を依頼された時のことです。これはこれまで経験したことのないものでした。
私はそれを少し異なる視点で検討しました。スタンフォード大学のSam Savageによる確率管理の研究を活用し、彼は確率密度関数を使って計算を行うための小さなExcelツールを持っていました。
そこで、非常に単純な手法をとりました。予測の信頼区間を取り、基本的な正規分布として扱ったのです。
これが、情報価値モデルのマッピング全体を実際に行い、それに基づいてどのように安全在庫を設定するかを初めて検討した時でした。
個々の時系列データを見て、正規分布、正規分布、正規分布と進む中で、突然、見たことのない分布が現れ、こんな感じでした―ブーム。
一体全体、これは何ですか?
理由が分かりました。つまり、私が行ったことは、売上は在庫水準と需要のうち小さい方であるという関数を用いたのです。
需要は正規分布でした。在庫水準はここにあり、もし需要が在庫水準を超えると、その分布―裾野―が現れるのです。これは単に品切れリスクを示しています。
その確率分布を見たことで、11ヶ月先までその状況を予測することができました。
これが、いわゆるパープル・スワンの一例です。
あなたの指摘に関連して、精度を追求する際、多くの人は精度指標を単独で取り扱います。信頼区間を計算するものの、それを活用せずに捨ててしまうのです。
それを用いてシミュレーションに組み込むことで、初めてエッジケースが現れ、より深い理解が可能となります。
Joannes Vermorel: はい、全くその通りです。航空宇宙分野では、多くの実績があるため非常に興味深いです。
いくつか例を挙げると、精度にこだわると時系列の視点に固執してしまい、この場合には特に誤ったアプローチとなります。
航空宇宙分野での最初の発見の一つは、レトロフィットの概念でした。つまり、修理が必要なために需要が発生し、部品が必要になる場合があるということです。
しかし、その後、OEMが「もはや古い部品は信頼できないので、航空機の交換用として新しい部品を投入すべき」と主張するレトロフィットが存在することに気づきます。
そのため、時系列データ上では、修理用に引き出される部品と、レトロフィット用に押し出される部品という、実際には二種類のユニットが混在しています。
しかし、それだけでは終わりません。
もう一つの要素として、航空宇宙分野の需要を見ると、例えば小規模なメンテナンスでは、航空機が修理を8時間以内に完了する必要があることが非常に多いのです。
その結果、クルーは実際に必要な部品以上の部品を要求します。なぜなら、修理に8時間しか与えられていないからです。
つまり「その部品を100個欲しい」と言うかもしれませんが、その翌日には大量の部品が返品されるものの、実際には使用されないのです。
したがって、需要のシグナルを正しく理解する必要があります。
これらは非常に複雑ではありませんが、考慮に入れるべきであり、航空宇宙に詳しい視点を持って、本当に「彼らは何をしようとしているのか?」と理解する必要があります。
彼らは航空機の修理を試みており、作業のタイミングに懸念を持っています。ですから、少し余分に要求し、多くのものを返品するのです。
一部の部品は実際にクルーから要求され、また一部はOEMによって投入されます。
このように、細やかなニュアンスを考慮する必要があるのです。
だからこそ、これらのアイデアはパーセンテージとは異なり、そもそも航空機をいかに修理するかという理解から生まれるのです。それは全く異なる知識領域です。
ここで私が伝えたいのは、これらの指標に関して、経験則として、純粋数学の世界から直接得られる指標に対しては非常に懐疑的であるべきで、現場で実際に達成しようとしていることに基づくものとは大きく異なるということです。
残念ながら、私が目にするほとんどのKPIは、定義が非常に容易であるため、大量の数学に依存しているのです。
航空宇宙分野に話を戻すと、クルーが「100個欲しい」と言いながら、実際には80個しかなく、最終的には30個を返品するという、いわば厄介な状況です。
需要は満たされたのか? はい、いいえ、はい?
クルーは、不足するのではないかと非常に緊張していましたが、最終的には不足しませんでした。
つまり、ここで問題となるのは、平均二乗誤差、MAPE、絶対誤差などの理論的基準とは別に、状況そのものの詳細を理解しなければならないということです。
Conor Doherty: さて、紳士諸君、その点について、パフォーマンス追跡における主流のアプローチを徹底的に批判したと思います。
しかし、代替案として何を提案しているのかは、まだ少し不明瞭です。
例えば、パトリックに戻ると、あらためて、予測精度を単独で追求するのは愚行だと言いましたね。議論のためにそれを認めましょう。
では、次に何を追跡すべきなのでしょうか?「単にお金を追跡しよう」というのは、人々にとっては少々不明確です。
では、従来のKPIに代わる実際の主張は何でしょうか?
Patrick McDonald: そうです。私はいわゆる情報価値分析を行う傾向があります。
実際に検討している意思決定とその実施方法に基づいて、キャッシュフローをシミュレーションしたいのです。
そのためには、情報価値モデルを明確に理解する必要があります。
品切れになった場合、販売が行われなくなるコストはどれくらいか? それに伴う保有コストはどれくらいか?
予測であれ、納品時間との畳み込みであれ、シミュレーション内のその他の要因であれ、その不確実性はどのような形をしているのでしょうか?
「これが私の洞察、これが私が下す決定、これが私がビジネスに投入するレバー、これが私のポジショニングの設定場所、これが私の努力の投入先」といったように追跡してみてください。
私が期待する結果は何でしょうか?
そのシミュレーション―つまりモンテカルロ分析―を実施し、結果の確率分布がどうなるかを確認してください。
その上で、実際の結果と予測結果をその観点から比較して測定してください。
これが私の採用しているアプローチです。かなりうまく機能する傾向がありますが、経営層には一定の高度な理解が求められます。
ビジネス経営者は物事を非常に線形かつ単純な方法で捉えようとする傾向があり、これも私が懸念している6つの問題の一つです。
しかし、これが私の採用しているアプローチであり、本当にお勧めするのは、情報価値モデルとその適用方法について考えることです。
従来の予測指標は、統計学的な観点から見ればまだ有用でしょうか? はい、有用な場合もあります。
私はそれらに重みを付けるようにしています。例えば、加重精度、加重リコール、そして加重されたピンボール指標は、単純な精度指標よりもはるかに有用だと考えています。
ピンボール指標は、全体の需要プロファイル、つまりその密度関数全体に渡る精度を評価するのに役立ちます。
それを適切な位置に配置し、情報価値の歪みを加え、適切に重みづけすれば、追求している価値分析に向けた洞察を提供できるのです。
これらは、私が今やっと実装し始めたばかりのものです。実践しながら学んでいる段階です。
これまでの30年以上の経験の中で、毎日オフィスに行くたびに新たな知見を得ています。
これが私の現状です。現在採用しているアプローチであり、一部のクライアントに対して実際に効果を発揮しているようです。
Conor Doherty: ありがとう、パトリック。
ジョアンネス、同じ質問です。あなたも非常に具体的な財務の視点からアプローチしていると推察します。
Joannes Vermorel: 私が言えるのは、通常、全く異なる目的と対象向けに、大きく2つの指標セットを生成し、監視しているということです。
最初の対象はサプライチェーンマネジメント、つまりサプライチェーンの経営者層です。彼らにとっては、本質的に経済的推進要因となります。
我々は、すべての意思決定の投資収益率を最大化することを目指します。しかし、その効果を在庫コスト、期待利益率、予想される在庫評価損、品切れペナルティといった一連の影響に分解する必要があります。
そこで、このような分解を行うのです。
この領域では、予測モデルに依存する前向きな指標と、実際に起こったことを示す純粋な記述的指標の両方があります。
ここで話しているのは、多くてもせいぜい12個程度の指標です。純粋な記述統計のものと、予測モデルの正確性に依存しているエンベディングのものがあります。
例えば、「この在庫はこの金額分の在庫評価損リスクがある」と伝えた場合、それはまだ実際には発生していないのです。つまり、何らかの予測モデルのおかげで構築した数値なのです。
これは経営者や実務者向けです。
そして、次に、データサイエンティスト自身向けに、通常は非常に膨大な、場合によっては何百にも及ぶ指標セットがあります。
ここでは、データが取得されるため、処理チェーン全体で何かがうまくいかなくなる兆候を探しているのです。通常、ERP(場合によっては複数)の中から抽出された何十ものテーブル、WMSやCRMなど、ばらばらなプロセスを扱っています。
そのため、企業のアプリケーション環境から多数の情報を統合しなければならず、問題が発生する可能性のある要素が非常に多いのです。
例えば、突然ある日、サプライヤーが5%増加するという変動があった場合、それは重要なものなのか、そうでないのか、重複が発生したのかどうか、といった疑問が生じます。
サプライヤーが20%多いというのはどういうことですか?うーん、20%―おそらく重複か、もしくはバグでしょう。
つまり、データ処理パイプラインに潜む多くの問題を監視しなければならないということです。
ほぼすべて、つまりSKUの数やサプライヤーの数を監視します。
時には、ほぼ不変なものを特定し、それを利用してdata pipelineにバグが発生しているかどうかを検出しようとします。
例として、私たちの自動車部品を販売するeコマースサイトがあります。数年前、バスケットあたり「2個と半分」という非常に安定した数値であることに気づきました。
夏も冬もクリスマスも、信じられないほど安定しており、すべて非常に、非常に安定していました―バスケットあたり2個と半分です。
つまり、非常に安定した何かが存在するということです。ビジネス自体は大きく変動しているかもしれませんが、この数値は非常に安定しています。
つまり、これに偏差が見られる場合、多分パイプラインにバグがあるということです。例えば、注文行が消え、各注文の最初の注文行だけになっていたり、そんなナンセンスなことが起こっている可能性があります。
そのため、サプライチェーンサイエンティストはダッシュボードを作成しますが、ここでは決して価値重視ではありません。我々の視点からは、これを「狂気に駆動されている」と呼んでいます。
計算を台無しにし、モデルを完全に損なう可能性があるすべてのものに目を光らせておく必要があります。ありとあらゆる愚かな問題が潜んでいるのです。
例えば、商品説明ラベル内の文字と数字の比率である場合もあります。突然、数字だけで構成されたラベルになってしまったら、多分もはや正しい説明ラベルではないということです。
これは、大規模に自動処理されるデータが依然として健全であることを確認するための多くのヒューリスティックです。
これは、いわゆるサプライチェーンサイエンティストにとってのみ興味深いものであり、彼らは毎日、規模の大きな意思決定における狂気が0%であることを保証したいのです。
私が狂気と定義するのは、誰もがその決定を見て「狂った決定―ああ、そんなのはおかしい、してはいけない」と言うものであり、データパイプラインのどこかで何かがうまくいっていないことを示しています。
私たちにとって、こうした狂気的な決定の数がゼロであることを保証するのは非常に重要です。
完全な精度は達成できなくても、破滅的な狂気を排除することは可能です。
Conor Doherty: Patrick、進む前に何か追加はありますか?
Patrick McDonald: 少し手短に言わせてください。私のデータサイエンスのキャリアを通じて、データの正確性やデータ品質は常に問題でした。
奇妙なことも見ました―負の在庫レベル。どうして在庫レベルが負になるのでしょうか?全く意味がありません。
大手FAANGクライアントの一つでは、データセンターディレクターが新しいデータセンターに入ると、電力レポートを確認し、電力が一切使用されていないと表示されました。
彼は周囲を見渡し、もちろん全ての機器が稼働しており、ライトが点滅しているのを見て、レポートが間違っていると察知しました。何が起こったのでしょうか?
というわけで、データ処理の観点からは、本当に多くのことが起こりうるのです。
統計的プロセス管理は、そのような問題に対処するために使えるものだと思います。皆さんもそれを使用しているようで、それが正しい方法です。
良いデータがなければ「ゴミが入ればゴミが出る」という原則が適用されます。ビッグデータでは、多くのゴミが混じっているということです。だから、それに対処しなければなりません。
Joannes Vermorel: はい、全くその通りです。
時には、最も良いことは、データが実は正確であるということです―ただし非常に、非常に奇妙な方法で。例えば、SAPは30年前に返品をマイナス売上として計上することに決めました。
つまり、売上がマイナスになる日があるということです。実際、販売された商品数よりも返品数が多かったということです。
例えば、ドイツのeコマースでは、出荷された商品の約40%が返品されるため、膨大なマイナス売上が発生します。
しかし、それは非常に重要な情報です―ただし、マイナス売上ではなく返品であるという点に注意してください。
そんな感じです。
しかし私も同感です。データは非常に混沌としており、それをしっかり管理することが極めて重要です。
Conor Doherty: 素晴らしい。
さて、皆さん、閉会の質問はあるのですが、今回はそれを最後に回し、代わりにいくつかの聴衆からの質問を優先したいと思います。
これらはこのスレッド内のダイレクトメッセージからの質問や、先週の興味深い質問からも引っ張ってきたもので、今日にも十分当てはまると思います。
では、Miguel Laraからの質問から始めましょう。パネルの皆さんへ。Patrick、まずはあなたからお願いします。
財務結果に必ずしも影響しないにもかかわらず、依然として大きな影響力や何らかの有用性があると考えられるKPIはありますか?
Patrick McDonald: ええ。
我々が注目する多くの標準的な指標は、依然として見るべき重要なものだと思います。
MAPEは、予測モデルがどれだけ上手く機能するかを理解する上で重要な指標です。
MAEやMASEも、私が注目し利用する指標です。
それらが重要でないとか、気にかけていないわけではありませんが、最も重要な指標ではなく、追い求めるべきものではないのです。
そんな観点が、私の考え方です。
指標が何を伝えているのかを理解し、その目的に沿って活用してください。
「そして奇跡が起こる」という前提を立て、本来意図されていない方法でそれらの指標を適用し、財務的な価値を得られると考えないでください。
ですので、それが私の回答です。すべてにおいて目的適合性(Fit-for-purpose)を念頭に置くことをお勧めします。
Conor Doherty: ありがとうございます。
Joannes、同じ質問です。繰り返しましょうか?
Joannes Vermorel: Lokadにとって、最も重要な非財務指標は、自動化されるべき意思決定に対する1日あたりの手動オーバーライドの回数です。それが最重要事項です。
つまり、これは財務的なものではありませんが、私たちにとってはゼロを超えるものはすべて問題であり、欠陥と見なしています。
問題は、欠陥があるということは、モデル自体に何か誤りがあることを意味するからです。もし間違っていれば、経済モデリングさえ信頼できなくなります。
定義上、人々がそのようなオーバーライドを行っているということは、彼らが私たちには見えていない何かを見ている証拠なのです。
つまり、我々が持つすべての経済的な測定は、この不正確さの証拠によって完全に損なわれる可能性があります。
ですから、私たちにとって最重要なのは手動オーバーライドです。発生するたびに、モデルそのものに何かが誤っていることを意味し、結果として経済分析全体を台無しにしかねないからです。
だからこそ、これに非常に注意を払う必要があります。私たちはそれをバグとして扱っています。そのバグを理解しなければ、どれほど深刻な問題か分からないのです。
Patrick McDonald: 私もそれが本当だと感じました。
私が抱く疑問は、常にそうであるのでしょうか?ほとんどのオーバーライドが間違っていると分かったのはいつのことですか?
もしくは、誰かが介入してオーバーライドし、確かにモデルに問題があり、それを発見し修正したケースもあったのでしょうか?
Joannes Vermorel: まず、プロジェクトの初期段階では、残念ながら多くのオーバーライドが実際の問題であることが非常に多いのです。見逃した事柄や理解していなかった事柄があるからです。
つまり、プロジェクト開始時には、ほとんどのオーバーライドが未知の問題を反映しているのが通常です。
例えば、航空宇宙在庫予測を始めたのは約15年前でしたが、その時はレトロフィットとは何か、その重要性すら知りませんでした。
多くの人々が数値を調整しており、ある時点で「何が起こっているのか?」と尋ねたところ、彼らはそれがレトロフィットだと言いました。私は「何ですって?」と。
その後、振り返ってみると、モデリングを担当していた人物が非常に重要な点について無知であったことが分かりました。
しかし、時間が経つにつれて、理由もなくオーバーライドを行う新しいメンバーが現れ、以前の会社での習慣を引きずって「オーバーライドすべきだ」と言うようなことも起こります。しかし、実際にはそれは全く意味がありません。
私はそれを…重要な報告の割合が大幅に減少するものとして捉えています。
しかし、これはソフトウェア会社のバグ報告に似ています。ユーザーから多くの却下があり、「バグだ」と言われることもありますが、実際には機能が意図通りに動作しているのです。
それでも、ナシーム・タレブによれば、時折正しいと証明されるものが非常に重大な影響を持つ可能性があるため、私たちはこれらを非常に注意深く監視しています。
つまり、たとえ99%が「ユーザーが間違っている」とされても、残りの1%が非常に大きな影響を持つ可能性があるのです。
だからこそ、私たちは注視しているのです。
成熟したプロジェクトでは、大部分は本質的にノイズですが、いくつかはそうではなく、そこに我々が本当に懸念を抱いているのです。
Conor Doherty: 分かりました。ありがとうございます。
次の質問は―正しく発音できていることを願いつつ―Lucio Zonaさんからのものです。これは先週の安全在庫の議論に関するもので、非常に関連性があります。
では、これを読み上げます。質問は2つあります。
少し背景を説明すると、LucioさんはほとんどのサプライチェーンマネージャーのボーナスがKPIに連動していること、例えば納期遵守率や完全出荷率に依存していることを指摘しました。その結果、過剰在庫で解雇されることはなく、納期遵守率や完全性が悪い場合のみ解雇されるのです。
それは自然と、人々が在庫を膨らませるように駆り立て、もしくはインセンティブを与える結果となります。
理論上は、不足する各単位あたりや欠品イベントごとの実際の経済コストを用いて安全在庫を算出できるはずですが、そうした数値は曖昧なため、企業は単純なKPIに頼らざるを得ないのです。
さて、2つの質問です。KPIは実際に誰にとって重要なのでしょうか。そして、システム操作を助長しないように、どのようにインセンティブ構造を設計すべきでしょうか?
Patrick、まずはあなたからお願いします。
Patrick McDonald: 難しい質問ですね。いや、実はシンプルな質問で、私を非常に苛立たせるものです。
私が関わった大手組織における矛盾するインセンティブの量は、実に衝撃的なほどです。
それは、私が直面してきた最大の課題の一つです。
全く別の話題ですが。
私は、組織が業務運営する際に注目すべき全く異なる一連の指標があると考えています。
特に、矛盾する行動を促すような相反する指標は、問題を孕んでいます。
それが、セールスアンドオペレーションズプランニングを導入している理由の一つでもあります。オペレーションとサプライチェーンは、様々な理由で独自の問題を抱えています。
特筆すべきは、全員がそれぞれ「予測」と呼ぶ複数の予測が存在することで、各組織に少なくとも7種類の予測があるのです。
一つは供給計画、もう一つは需要計画、そして統計的予測、売上目標、マーケティング計画、財務計画など、それぞれが「予測」と呼ばれていますが、整合性が取れていません。
その結果、組織はなぜ調和が取れていないのかと疑問に思うのです。
その一因は、個々の指標に遡ることにあります。人々のボーナスが基づく指標が、彼らの行動を促すからです。
ですから、これは大きな問題です。解決するのは些細な挑戦ではなく、大規模な経営コンサルティング、もしくは大きな経営問題として取り組む必要があります。
対処可能ですが、それを実現するためには組織内部で真のリーダーシップが必要となるでしょう。
では、これで最初の質問の部分はカバーできたでしょうか?第二の部分は何でしたでしょうか?何か見落としはありませんか?
Conor Doherty: KPIは実際に誰にとって重要なのでしょうか―正確には、誰に対してKPIが重要なのでしょうか?そして、どのようにすれば人々がシステムを操作するのを防ぐインセンティブを与えられるのでしょうか?
Patrick McDonald: 指標が一致し、矛盾していないことを保証するのです。それがその方法です。
Conor Doherty: 分かりました。ありがとうございます。
Joannes、同じ質問です。
Joannes Vermorel: 私のアプローチは少し異なります。
「ターゲットとして設定された良い指標は、もはや良い指標ではなくなる」という企業法則があります。
私の見解では、指標に基づいて人々にインセンティブを与えるという考えは、労働力の幼稚化を招くものであり、必ず裏目に出るのです。
人々は必ずその指標を操作します。それはまるで、災害が起こるのを待っているかのようです。
一見良さそうに見えても、時間とともに必ず壊滅的な結果を招く考え方です。
どの指標であっても関係ありません。人々は「適切な指標を選べば、今回は操作されない、今回は良い結果になり、会社の長期的利益に沿うはずだ」と考えます。
しかし、実際はそうならないのです。
どういうわけか分かりませんが、チームメンバーに数か月与えれば、彼らは指標を操作してあなたの生活を地獄にし、会社の利益を減少させる方法を見つけるでしょう。
再度言いますが、これは人間の最大の強みの一つです。人間は独創的です。素晴らしいことですが、同時にその独創性ゆえに、色々な問題が起こり、事態は悪化していくのです。
私の提案は、このナイーブな合理主義を放棄することです。「非常に明確な指標さえあれば、人々はそれを最大化し、長期的利益に沿う。問題は解決だ」という考えは、私にとって非常にナイーブな合理主義です。
「人を管理する必要はなく、インセンティブに任せればよい」という考えは、私には非常に幼稚な人間性の見方に思えます。そんな風には機能しません。
インセンティブは非常に強力ですが、タレブが『ブラック・スワン』や『アンチフラジャイル』で議論しているように、人間は二次、三次、四次の影響まで考慮する生き物です。
人々は、次の雇用主が自分たちのことをより良く評価してくれると考え、あれこれ行動します。
その結果、彼らはあなたの予想をはるかに超える長期的な計画を実行するのです。
スタッフに指標を用いて接近するのは、一次的な推論に過ぎません。二次、三次の影響は考慮されないのです。
結論として、もしあなたの会社にそのようなインセンティブがあるなら、最優先すべきはそれらを完全に撤廃すること―全てです。
唯一、ある程度許容されるのは、ストックオプションのようなものだけです。ストックオプションを取得し、5年間権利確定させれば良いでしょう。会社の長期的利益とほぼ一致しているので、それで終わりです。
非常にシンプルで具体性を持たないようにしてください。
次に、経済的最適化のような最適化を始めると、目的関数の半減期は約1週間であることを認識しなければなりません。
目的関数は、岩上に置いて「これが全てだ」とするものではありません。それは大きく進化していきます。
例えば、トランプ政権が関税を1日に5回も変更できると決定したとき、突然ゲームが変わったのです。
アメリカではその後、約400回もの関税の更新がありました……私たちは今、非常にアンチフラジャイルな状況にあります。そうでなければなりません。
つまり、そんな感じです。新しいルールにより、目的関数が変動するのです。
今では、大統領の意向を完全に把握することは不可能なので、関税分布の確率的予測を導入して先を見越さなければなりません。
要するに、関税がどこに設定されるかの確率的予測しか持つことができず、それは0%から200%の間になるということです。
私の見解としては、経済機能は急速に進化していることを理解すべきです。アメリカの関税ほど急激ではないにしても、とにかく急速です。そのため、チームの評価指標は年に一度、または二年に一度見直されるものになるという問題があります。
収益の仕組みを毎月変更すれば、皆を発狂させることになるでしょう。それは全くもって常軌を逸しています。
実際のところ、心理的安全のために、人々は少なくとも12か月先の収入予測があり、「これが自分の収入だ」と感じられるものを必要としています。
しかし、サプライチェーンでは日単位で考え、非常に反応的でなければならず、その二つは両立しません。
だからこそ、これらのインセンティブを取り除くべきだと言います。実際には、経済機能を更新する速度が、従業員や幹部に提供する制度を見直す速度よりも速いため、逆効果になるでしょう。
Conor Doherty: かっこいいね。ありがとう。
ここで2点あります。まず、私は「グッドウィンの法則」と言ったと思っていました。ゴッドウィンの法則、それは全く異なるものです。本来言いたかったのはグッドハートの法則です。これは全く異なる現象です。
実際のところ、いくつかのコメントが寄せられており、基本的には同意の意見です。Miguel Laraは、もしインパクトを生まないKPIを作れば、それは余分な作業に過ぎず、最終的には実質的な価値がないと指摘しています。
Joannes Vermorel: ちなみに、大企業は足し算的なものしか考えず、引き算的なものは考えないというのを踏まえると、
あらゆる種類の指標、主要な指標であれ、パフォーマンス指標であれ、何であれ、ただ積み重ねられていくだけです。
10年後には、私が「メトリクスの壁」と呼ぶものが現れます。それは誰も読まない100もの数字です。
それにもかかわらず、パフォーマンス指標が多すぎるため、毎月初日にBIツールがフリーズしてしまいます。
約100の指標があり、BIシステム全体が一日中フリーズしてしまうのです。
月初には、ERPが半分フリーズしてしまうために、特定の業務を停止しなければならない企業も見たことがあります。
そのため、ERPが報告処理を行うために工場の操業を一時停止することもあったのです。
Conor Doherty: さて、皆さん、1時間余りが経過しました。Patrick、これについて何か他の案があるとおっしゃっていましたね。
しかし、要約すると、Miguelからのコメントがありました—これをまとめとして、皆さんはそれに対する締めくくりの意見を述べてください。
多くのKPIが存在するからといって、すべてを一度に追跡すべきというわけではありません。アプローチや現在のフォーカスに基づいて、本当に重要なKPIだけを選ぶべきです。
逆の順序で、これに関する皆さんの締めくくりの意見をお願いします。Joannes。
Joannes Vermorel: はいともいえますし、いいえともいえます。
問題は、これは現代企業の常識であるということです。額面的に捉えると、この常識が私たちをどこへ導いたのかを見てみましょう。
ほとんどの企業では、メトリクスの壁が存在します。数十、いや場合によっては数百の、誰も気にかけない指標があるのです。
それは全く不透明で、誰も理解していません。
平均的なサプライチェーン担当者を例にとると、15個の数字が表示された画面しかなく、そのうち半分について何が計算されているのかすら説明できません。
彼らは「これはおそらく過去30日間の平均在庫レベルを計算しているのだと思う。多分。よくわからない」と言うでしょう。
ですから、これは常識ですが、私のアプローチはもっと積極的であると言いたいです。
大きな組織では、官僚主義や無駄なものが除去されるよりも、はるかに簡単に蓄積されることが分かっています。
浄化、すなわち容赦なく、重要でない数字を全て排除することに倍の力を注がなければなりません。
典型的なサプライチェーンの幹部にとっては、10個の数字を上限と考えるべきです。新たな数字を導入するなら、既存の数字を一つ削除する必要があります。
それを維持しなければなりません。
次にデータサイエンティスト側に目を向けると、何百もの数字を持っていても構いませんが、その場合は numerical recipe が、データサイエンティスト、すなわちサプライチェーン・サイエンティスト自身の独自の業務を遂行するためのものとなります。
組織の他の部分はその対象ではありません。それは、組織全体が負担すべきものではなく、あくまでサイエンティスト自身に影響を与える負担に過ぎないからです。
その常識は、一見合理的に思えるかもしれませんが、再度言います、注意が必要です。
10年後、私の観察では、この常識に従うと通常は非常に悪い状況に陥るという結論に至ります。
Conor Doherty: Patrick、締めの意見をお願いします。それについてどう感じますか?
Patrick McDonald: もし5つ以上あるならば、多すぎるということです。
私はもっと厳格です。具体的に注目しているのは5つで、すべて財務諸表に結びついています。
まず一つ目は市場シェアの指標です。私はこれをブランド・エクイティと呼んでいます。
売上が伸びていても、市場の成長がそれを上回っているなら、市場シェアは失われています。ですから、単に売上を追うだけでなく、市場での自分の位置も追跡すべきです。
顧客の需要を確実に満たしているか確認したいのです。そこで、信頼性の指標があります。
資源が効率的に配分されているかを確認したいので、効果性の指標があります。
効率性について話すのは嫌いです。なぜなら、効率性は常に局所最適に終わるからです。なので、かわりに生産性について話します。
そして最後の指標は、まだ模索中のものです。まだ十分に優れた指標は見つかっていませんが、それは機敏性、つまり市場で日々起こる急速な変化にどれだけ迅速に対応できるかというものです。
この5つをカバーすれば、ビジネスの観点から理解したいほとんどの点が網羅されると思います。
もちろん、それらを捉える方法はいろいろありますが、これが私の5つです。それぞれに大きな重複はなく、財務に直結する重要な点に到達しています。
Conor Doherty: 了解です。
さて、皆さん、本当にありがとうございました。これ以上質問はありません。ライブチャットで全て対処したので、もう時間がほぼ尽きたと思います。
Joannes、いつもながら、ご参加いただき本当にありがとうございます。
Patrick、リモートでご参加いただき、またお時間を割いていただき感謝します。あなたの洞察は本当に素晴らしかったです。
Patrick McDonald: 光栄です。またいつかできることを願っています。ありがとうございます。
Conor Doherty: ご覧の皆さん、参加していただき、本当にありがとうございました。プライベートメッセージやコメントにも感謝します。
議論を続けたい場合は、いつも通りJoannes、私、そしてPatrickに連絡してください。新しい方々と話すことはいつでも歓迎です。
以上です。本当にありがとうございました。来週お会いしましょう、そしてお仕事に戻ってください。