00:00:00 ゲストの紹介
00:01:27 Optimal DynamicsでのWarrenの役割と著書
00:03:06 トラック荷物輸送における課題と予測
00:04:31 Warrenの論文と不確実性の理解
00:06:41 Joannesのキャリアとソフトウェア分野での成功
00:08:12 不確実性の受容とサプライチェーンにおける学術的視点
00:09:39 逐次的意思決定と業界協力の困難
00:11:13 確率的予測 vs 決定論的予測
00:13:27 確率的予測の指標と理解の難しさ
00:15:28 予測のカバレッジと精度の重要性
00:17:09 確率的予測におけるLokadの歩みと課題
00:19:15 不確実性問題の難しさと統一されたコミュニティの欠如
00:21:05 数学プログラミングにおける意思決定と不確実性
00:23:03 多様な研究室での経験とADP書籍の応用
00:25:07 サプライチェーンにおけるツールボックスの必要性と新しいアプローチへの移行
00:27:35 決定論的最適化と費用関数の近似
00:29:57 Googleマップを先行例として
00:31:51 確率的先行視と価値関数の近似
00:33:21 Joannesの意思決定に関する視点と課題の定義
00:35:29 正しい状態、遷移関数、費用関数の重要性
00:37:28 問題の次元性と大規模問題の考慮
00:39:15 解の脆弱性とスーパーマーケット網の比較
00:41:16 問題解決へのアプローチとサプライチェーンアナリティクス書籍の執筆
00:43:44 モデル設計のシンプルさと様々な不確実性の種類
00:45:13 迅速な反復と現実世界の制約の重要性
00:47:51 計算可能性の重要性とGraphicsツールの開発
00:50:27 最適化における計器の役割と業界の課題
00:53:11 運送業者との協働と学術的アプローチへの批判
00:55:23 予測から意思決定へと至るJoannesの歩み
00:58:28 データアクセスの難しさと将来予測への対応
01:00:32 大規模な混乱を考慮し、悲観的なモデルを受け入れる重要性
01:02:45 サプライチェーンとファッション業界における変動性
01:04:43 製品の年次更新と新製品の予測
01:06:27 不確実性のモデリングの重要性と企業ルールへの批判
01:08:16 確率的最適化と在庫管理に対するWarrenのアプローチ
01:09:56 偶発事態の計画と不確実性下での意思決定
01:11:39 トラック運行におけるリアルタイムディスパッチの重要性と適切な荷送の選択
01:13:27 不確実性下での意思決定の課題と教養ある個人に関する問題
01:15:45 エクセルの不確実性処理の限界とCEOの理解
01:19:30 サプライチェーン書籍の限界とユーザーフレンドリーなツールの重要性
01:21:46 Lokadの教育的取り組みと関連データセットの作成
01:25:01 問題解決における三つの重要な質問と意思決定カテゴリーの開発
01:27:48 定量的でないMBAの課題と企業がワークフローに意思決定を埋もれさせる問題
01:30:26 シンプルさの代償と逐次学習が意思決定のツールとして
01:32:33 より高みを目指す概念の教授と硬直した方針の課題
01:34:34 探求概念の理解の難しさと積極的学習の重要性
01:37:41 トラック輸送とサプライチェーンの違い、そしてトラック輸送ビジネスの規模
01:40:04 書籍のタイトル、目的、教授スタイル、そしてモデリングの五要素
01:42:39 Optimal Dynamics、Lokad、そして学術的アイデアの共有への称賛
01:43:22 締めくくりの言葉と感謝
ゲストについて
Warren B PowellはPrinceton大学の名誉教授であり、39年間教鞭をとりました。現在はOptimal Dynamicsの最高イノベーション責任者を務めています。彼は、貨物輸送、エネルギーシステム、ヘルスケア、電子商取引、金融、そして研究科学に応用される確率的最適化に注力したCASTLE Labの創設者でありディレクターでもあり、政府や産業界から5000万ドル以上の資金提供を受けました。彼は任意の逐次意思決定問題をモデリングするために使用できる新しい普遍的フレームワークを切り開き、その中で意思決定のあらゆる方法を網羅する4つのポリシーのクラスを特定しました。これはJohn Wileyとの最新書籍「Reinforcement Learning and Stochastic Optimization: A unified framework for sequential decisions」に記録されています。彼は250以上の論文、5冊の書籍を発表し、60人以上の大学院生やポスドクを育成してきました。彼はTransportation Science and Logistics Societyから2021年にRobert Herman Lifetime Achievement Awardを、2022年にはSaul Gass Expository Writing Awardを受賞しています。彼はInformsのフェローであり、他にも数々の賞を受賞しています。
要約
最近のLokadTVのインタビューで、Conor Doherty、Joannes Vermorel、そしてゲストのWarren Powellは、確率的予測とサプライチェーンにおける意思決定について議論しました。引退したPrinceton大学の教授でありOptimal Dynamicsの最高イノベーション責任者であるWarren Powellは、自身のキャリアの軌跡と不確実性下での計画に関する洞察を共有しました。LokadのCEOであるJoannes Vermorelは、決定論的手法から確率的予測への移行について語り、現実世界での適用が不足している学界を批判しました。両者とも、複雑さにもかかわらず、企業がその適用に苦しむ中で、確率的予測の優位性に同意しました。この議論は、不確実性に対処するためのより広い視点と、意思決定における統一的なアプローチの必要性を浮き彫りにしました。
詳細な要約
Lokadの広報責任者であるConor Dohertyが主催する最近のインタビューで、Princeton大学からの引退教授でかつOptimal Dynamicsの最高イノベーション責任者であるWarren Powellと、LokadのCEOで創業者であるJoannes Vermorelは、不確実性が存在するサプライチェーンにおける確率的予測と逐次的意思決定について、考えさせられる議論を交わしました.
複雑な分野における意思決定の熟練者であるWarren Powellは、まず自身のキャリアの歩みを共有することから始めました。彼の仕事は、アメリカにおける貨物輸送の規制緩和から始まり、それが不確実性下での計画に焦点を当てるきっかけとなりました。また、彼が携わるスタートアップであるOptimal Dynamicsでの役割についても語り、元博士課程の学生たちを指導しながら会社の新たな方向性を模索していることを明かしました.
その後、議論はPowellの著書「Reinforcement Learning and Stochastic Optimization」に移り、分布的または確率的予測の領域に踏み込んでいきます。Powellは、将来の荷量を予測できれば荷主に割引を提供する価値を理解したいという企業に関する逸話を共有しました。これが彼のこのテーマへの関心を呼び起こし、確率的な性質を持つためにトラック輸送における予測の課題を探求するに至りました.
一方、Joannes Vermorelは、決定論的手法から確率的予測への転換に至る自身の歩みを共有しました。彼は、決定論的手法が機能しなかったという認識と、供給チェーン問題において不確実性を受け入れる必要性について語りました。また、理論の証明や数値実験に偏重し、現実世界での適用が欠如している学界を批判しました.
その後、議論は決定論的予測と確率的予測の違いに移りました。Powellは、決定論的予測が単一の実行可能な数値を提供する一方で、現実の変動性を反映できないと説明しました。彼は、可能な結果の範囲を提供する分布的予測の方が優れていると主張しましたが、企業がこの概念を理解し適用するのに苦労しているとも述べました.
VermorelはPowellに同意し、確率的予測はより複雑な指標と確率分布に対する深い理解を必要とすることを付け加えました。彼は、決定論的予測を顕微鏡で机のごく一部を見るようなものに例え、一方で確率的予測はより広く、完全な視野を提供すると述べました.
議論は、VermorelがLokadにおける確率的予測の実装経験を共有することで締めくくられました。彼は、これらの予測に基づいて意思決定を最適化する方法を見出すのに数年を要したと述べました。また、意思決定における不確実性に対処するための統一されたコミュニティやパラダイムの欠如についても議論しました。Powellも同意し、さまざまなコミュニティ、言語、記号体系の多様性から、意思決定と不確実性の分野を「ジャングル」と表現しました。彼は、貨物輸送からエネルギーシステムに至るまで様々な分野での多様な経験を共有し、これらの経験が特定のアプローチの限界と、より広い視点の必要性を認識させるに至ったと語りました.
完全な書き起こし
Conor Doherty: お帰りなさい。実行可能なサプライチェーンの意思決定を特定し評価することは、特に従来の指標を用いている場合、非常に困難です。本日のゲストであるWarren Powellは、さまざまな複雑な分野における意思決定の分析に40年を費やしてきました。その上、彼は5冊の書籍、約250本の論文を執筆し、Princeton大学の引退教授でもあります。さて、Warren、まずはLokadへようこそ。さらに、もし初登場を見逃した方がいれば、ご自身の紹介とこれまでの活動について簡単にお話しいただけますか?
Warren Powell: お招きいただきありがとうございます。非常に興味深いキャリアを歩んできました。私のキャリアは、アメリカにおける貨物輸送の規制緩和が始まった時に始まり、そこからトラック輸送と呼ばれる業界に飛び込むこととなりました。当初の議題のひとつは不確実性と、それにどのように対応して計画を立てるかという問題であり、これが私のキャリアをほぼ決定づけることとなりました。私は様々な応用分野を巡ってきました.
I 私はキャリアの始まりとなったトラック輸送分野で、自身のスタートアップOptimal Dynamicsを支援することでキャリアを締めくくっています。さまざまな手法を用いていますが、幸いにも多くの応用例に取り組むことができ、不確実性というツールボックスには一つ以上の道具が存在することに気づきました。ですから、この議論を楽しみにしています。不確実性のモデリングに情熱を共有する他の方々と話すのは素晴らしいことです.
Conor Doherty: ありがとうございます。そしてOptimal Dynamicsについてお話しがありましたね。あなたは最高イノベーション責任者、つまりCIOです。その用語は初めて聞きました。そこで具体的にどのような役割を果たしているのか説明していただけますか?
Warren Powell: 彼らは私のことをヨーダと呼んでいます。私は経営には関与しておらず、私に直属して働く者はいません。元博士課程の学生が5人そこで働いており、私はほとんど、研究室の教授時代と同じように彼らと共に仕事をしています。彼らが「助けが必要だ」と手を挙げるのを待っています。それ以外の時は、物事について考えたり、機会があれば会社の新たな方向性について模索したりしています.
Warren Powell: しかし、時折問題解決のために呼び戻され、新たな革新をいくつか考案して貢献しています。ただ、基本的には、彼らが助けを求めた時にサポートするためにここにいるのであり、それ以外の時は邪魔にならないようにしています。学者として、特に優秀な人々と共に働く場合、いつ支援すべきか、いつ手を引くべきかを見極めることが最大の課題の一つであると学びました。そのおかげで、書籍の執筆などに多くの時間を割くことができています.
Conor Doherty: それに書籍執筆の話が出ましたが、あなたの著書「Reinforcement Learning and Stochastic Optimization」は、我々が最もお話を伺いたかったテーマの一つです。あなたの意思決定へのアプローチ、そしてLokadが実践している分布的または確率的予測への関心についても存じ上げています。そこで、インタビューを本格的に始めるにあたり、分布的予測のどの点にこれほど魅力を感じ、今日の議論へと導かれたのかを教えていただけますか?
Warren Powell: さて、私がトラック輸送の問題のモデリングに取り組んだ際の最大の課題は、トラック輸送が非常に希薄であるという点でした。例えば、ある都市間で荷が運ばれる場合もあれば、運ばれない場合もあります。シカゴからアトランタへドライバーを派遣した場合、アトランタに到着すると、さまざまな方向へ荷物が向かっている状況が見られます。テキサス行きの荷物がある場合もあれば、ない場合もあります。つまり、状況は0か1かということになります。では、あなたは何を予測するのでしょうか?0か1を予測するのか、それともより現実的な期待値である0.2を予測するのか、ということです.
I アメリカのSchneider Nationalという企業は、1970年代に規制緩和の到来を見越し、シンシナティ大学の教員と共に初期の最適化モデルを構築しましたが、それらはすべて決定論的なものでした。そして、Schneiderの一人がPrincetonを訪れ、私を見てこう言いました。なお、その人物はオペレーションズ・リサーチの修士号を持っていましたが、「Warren、トラック輸送は確率的だ」と.
明日にもどんな貨物が利用可能になるかは分かりません。もし出荷業者が将来の貨物情報を教えてくれたなら、彼に割引を提供する価値がどれほどあるのか知りたいのです。
1980年代後半、私は自ら「博物館論文」と呼ぶ論文を書きました。実際、インターネット上ではその論文が博物館論文として公開されています。トラック貨物輸送の問題を扱うために、不確実性を異なる方法で取り入れた5つのモデリング手法を提案しましたが、そのどれもが実際には機能しないことは十分に分かっていました。そして1980年代後半、学界から何も成果が出ない中で、「他にどうすればいいのか」と途方に暮れていました。
これが数十年にわたるプロセスの始まりとなり、私自身が物事の本質をつかみ、次々と「aha!」というひらめきを得るようになったのです。2000年代初頭に大きなひらめきがあり、シュナイダー社が「ウォーレン、我々は本当に助けが必要だ。このモデルを構築できるか?」と私に依頼してきました。そのモデルは最終的にOptimal Dynamicsの基礎となるソフトウェアへと発展しました。そして、そのモデルが構築された以降、不確実性に対応できたことが私の近似動的計画法への取り組みの始まりとなったのです。
数年ごとにまた新たな大きなひらめきを得ることができたと言えるでしょう。実際、卒業してからもいくつかのひらめきを経験しており、この分野は驚くほど豊かで、「ああ、こんな見方があったのか」といった瞬間が次々と訪れるのです。
Conor Doherty: ジョアネス、それはあなたが確率的予測にたどり着く過程と一致していますか?たくさんのひらめきがあったのですか?
Joannes Vermorel: ええ、ある意味そうですね。私の場合、2008年にLokadを始めた際に、実際には主流のサプライチェーン理論をそのまま採用していました。ですので、誰かが私のもとに来て、『stochastic』という言葉すら発音せずに、まったく違う意味で受け取られていたのです。私が長年出会ってきた多くの人々は、私が『stochastic』と言えば、まるで弾性の変種か何かを語っているのかと思ったことでしょう。
ともかく、彼らは賢かったのですが、統計学者でも確率論者でもありませんでした。そのため、Lokadの初期数年間、私はenterprise softwareベンダーとして、決定論的手法を用いながらも、かなりの成功を収めることができました。つまり、実際に製品が機能しているかどうかとは別の尺度で、単に販売が成功しているという意味です。
これだけでキャリアを築いている競合他社もありました。しかし、数年かけて気付いたのは、この手法は決してうまくいかず、成功が目前にあるわけでもないということでした。完全に決定論的なサプライチェーンの視点、不確実性を無視した主流のアプローチでは、成功は見込めず、1%のforecast accuracyを追加しても問題は解決しなかったのです。
いや、予測を改善しプロセスを進歩させたとしても、成功が目前に迫っているという考えを捨てるまでには、実に4年ほどの歳月がかかりました。そして、そのひらめきは、誰かとの素晴らしい対話の結果ではなく、むしろ絶望感から生まれたものでした。ともかく、時間はかかりました。しかし、振り返ってみると、Lokadでの最初の数年は、不確実性を受け入れずにサプライチェーン問題に取り組んだため、完全に行き詰まっていたのだと言えます。
Warren Powell: ここで私が見つけた課題についてお話しします。学界の立場から発言する私としては、ジョアネス、あなたと話しているとまるで同僚の学者と話しているように感じますが、あなたは業界出身です。私の研究室は初めから普通ではなく、街に出て企業と話し、資金を調達しなければならなかったのです。多くの学者に資金を提供するNational Science Foundationは、私の分野において、「我々は研究に直接資金を供給するのではなく、祝福する。産業界から資金を調達しなさい。その後、NSFの天使の粉をばら撒こう」という明確な方針を持っていました。
しかし、学界にはあまりにも多くの学者が存在し、今日に至るまで産業界との連携をせずに、作り話のモデルだけで定理を証明し、数値実験を行い、すべてが学界内部で完結しているという現状が続いています。これは特に確率的最適化において顕著ですが、machine learningの分野では、機械学習者が実際のデータセットを使い、モデルにフィッティングしていくため、この問題は少し異なります。
決定論的最適化においてさえ、同じことが言えます。現実の決定論的最適化におけるshortageは存在しません。しかし、私が今『逐次意思決定』と呼ぶもの、ちなみにこの呼び方により「stochastic」という言葉から離れることができるのですが、その分野には、産業界との協力が難しいために、学者たちが現実の問題を正しく理解できずに作り上げた論文が氾濫しているのです。そして、企業と共同で何がうまくいくか、何がうまくいかないかを学ばなければならないという現実があります。
要するに、これは学者たちの働き方そのものに問題があるのです。私自身、出版界では成功したキャリアを歩んできましたが、終盤になるにつれ、「これは一種のゲームだ」と感じるようになりました。論文を発表するには、学術誌が求める特定のスタイルに従わなければならず、確率的最適化のコミュニティは一つではなく、十数にも及んでいました。各コミュニティは独自の言語やスタイル、ツールや技法を持ち、それを誇りに思いながら定理を証明し、数値実験を行いますが、実際にはそのほとんどが機能していないのです。
Conor Doherty: ありがとうございます。ここで、純粋な学問的アプローチと実用的なアプローチの違い、すなわち決定論的予測と分布的あるいは確率的予測の違いを強調したいと思います。便宜上、私は確率的という用語を使います。ウォーレンさん、あなたの視点から、この二つのアプローチの違いは何であり、なぜ確率的予測が優れているとお考えなのでしょうか?
Warren Powell: では、ビジネス関係者で「forecast」という言葉を使う人に会うたび、すぐに彼らがポイント予測、つまり単一の数字を意味していると理解します。彼らは「500個のウィジェットが売れる」や「2台の車が売れる」、「6回のトラック輸送がある」といった具体的な数字が好きなのです。なぜなら、行動に移しやすいからです。例えば、「トラックが6台必要だから、6人のドライバーを用意しなければならない」といった具合です。
問題は、そしてこれはトラック貨物輸送において毎日起こるのですが、有力な出荷業者がいて、自身がトップクラスであると認識している彼が、あるディスパッチャーの言葉を引用して「この業者は10台から20台のトラックが必要だと言ってくる」と電話してくることです。確かに苛立たしい状況ですが、これが配車現場の現実なのです。しかし、予測モデルでは、すべての数学的手法が単一の数字を導き出すために設計されています。
人々は単一の数字を好みます。それは行動に移しやすく理解もしやすいからです。仮に「10台から20台」と範囲で示されても、実際にどれだけのドライバーを用意すればよいのか分かりにくくなります。そこでトラック運転手たちは、「重要なトラック運転手であれば、20台全ては必要ないかもしれないが、17台は確保する。しかし、もし実際には12台だけなら、余った5台は別の仕事に回す」といった対応策(recourse)を採用するのです。
しかし、誰もがそのポイント予測を好むのです。私が1990年代にYellow Freight社と仕事をしていたとき、初めて分布的予測に挑戦したのですが、「信頼区間を設けたい」と提案すると、彼らは「うちの担当者にはその扱いができない」と返答しました。以前、大手出荷業者と協力していた際、彼らは分布的予測に非常に興奮したものの、「では、実際の精度はどれほどか」と問い返したのです。ジョアネスが微笑むのが見えます。つまり、「分布的予測は素晴らしいが、精度はどうなのか?」という問いにどう答えるかが問題なのです。
Joannes Vermorel: ええ、例えばクロスエントロピーや、確率的予測に有効な他の指標、CRPSなどがその例です。しかし、確率分布の世界に入ると、指標自体は存在するものの、中学生でも理解できるような直感的な指標とは異なります。標準的なノルム1やノルム2であれば分かるものの、確率分布の場合、そもそも「距離」という概念を求められるため、形式的な手続きを踏まなければならず、それには半時間、場合によっては全くの素人なら2時間ほどかかるかもしれません。
実際、確率分布に入ると決して非常に難しいというわけではありません。例えば、最大尤度法などを用いると、統計学の博士号がなくても理解できるレベルですが、直感だけで理解するには2分以上はかかります。そして、形式的な手続きに沿って理解するには、半時間、場合によっては全くの初心者なら2時間ほど必要になるでしょう。
Warren Powell: そうですね、その時点でビジネス関係者の顔は曇り始め、「ああ、なるほど。ところで精度はどれほどなんですか?」と訊ねてきます。
Joannes Vermorel: それが非常に奇妙な点です。これはより豊かな予測、すなわちあなたの未来予測の視野の奥行きをどれだけ確保できるかという問題です。未来に対する予測、すなわち未来についての声明を行う際、単に精度を問うのではなく、どれだけ完全で広範囲にカバーできているかが重要なのです。
これは非常に特異な現象です。ポイント予測では、例えるなら顕微鏡で机の一部を1000倍に拡大して、その1平方ミリメートルを完璧に見ることができるのに、机全体は全く見えないのです。そして人々は「もっと大きな顕微鏡が必要だ」と考え、既に鮮明に見えている一点に固執するのではなく、机全体を見渡すべきだと主張するのです。これが確率的予測の考え方です。
Warren Powell: ここで、小売業などのビジネス関係者なら必ず理解できる概念、すなわち需要カバレッジの問題があります。彼らは「97%の需要を満たしたい」と言います。これは決して異常な要求ではありません。しかし、どうやって97%の需要を満たすのかというと、分布的予測の概念がなければ不可能なのです。つまり、「需要の97%をカバーするには、余分に20ユニットが必要か、あるいは200ユニットが必要か」という問いが出てくるのです。これこそ、非常に馴染み深いビジネス要件を「もしこれを実現したいなら、分布的または確率的予測を用いなければならない」という形で最適化に落とし込むための導入部といえます。
Joannes Vermorel: 面白いことに、Lokadでそれを始めたのは2012年のことで、あなたの本へのつなぎとして言えば、確率的予測を実施し始めてから、洗練された最適化手法を構築できるようになるまで、実際に数年を要したのです。確率的予測の必要性に直面するのが非常に難しかったからです。これが私のLokadでの旅の最初の一歩でした。
2012年には、deep learningの分野で全く異なる理由により、確率的予測が非常に人気を博していたことが判明しました。深層学習では、クロスエントロピーのような指標が急峻な勾配をもたらし、最適化に大いに役立つため、Deep Learningコミュニティは確率的予測を利用していたのです。彼らは確率そのものには全く興味がなく、ポイント予測のみを求めていましたが、クロスエントロピーによって得られる非常に急な勾配は、数値的に非常に優れた特性をもたらし、モデルの機能性を高める要因となっていました。
つまり、これは少し逸脱した方向に進んだと言えます。最初は勾配を得るための巧妙な数値的手法として確率的予測を利用していたのですが、その後、一度その手法を手に入れると、最適化すべき意思決定があることに気づくのです。最良の選択肢を取るために、反復的な意思決定の連続が存在することに気づいたのです。
そして最終的には、「それを解決するためのソフトウェアツールとして何が必要なのか?」という問いに行き着きます。ここがあなたの本へのつなぎでもある非常に難しい問題で、私が直面した最大の課題は、パラダイム自体がほとんど存在しなかったことにあります。おっしゃる通り、発表できるコミュニティは半ダースほどあったものの、私の感じるところでは、今日に至るまで、不確実性を伴う問題に対して最適化を実施し、それを実行できる真に統一されたコミュニティはまだ存在していないのです。
つまり、成功もあれば失敗もあったのです。私は強化学習や古典的最適化にも取り組みましたが、真の挑戦はパラダイムの欠如にありました。そして、この1100ページにも及ぶ非常に重厚な本の中で特に興味深いのは、自分自身でパラダイムを提案し、その領域を徹底的に解析し、細分化している点です。いや、今でもこの本は唯一無二の存在であり、同種の著作はほとんどありません。
つまり、たとえば分類器に関する本が欲しいなら、機械学習の分野では、線形分類からサポートベクターマシン、勾配ブースターツリーなど古典的な分類器を網羅する500冊ほどの本が存在しています。分類の問題設定について枠組みを示す本も同様に500冊ほどあり、ここでは、正直に申し上げると、私の長い回答になってしまいますが、コミュニティはまだその問題に本格的に取り組んでいないと言えるでしょう.
Warren Powell: ええ、意思決定と不確実性の問題は非常に豊かな分野です。もし決定論的数学プログラミングに目を向ければ、確かに多くの決定論的数学プログラムが存在しますが、それらはすべてジョージ・ダンツィグによって確立された基本的なパラダイムに従っています。目的関数があり、制約があり、意思決定変数があり、アルゴリズムがある。そういう枠組みに収まるため、機械学習や統計学、改めて言えば機械学習では、ある関数をデータに合わせようとするのです.
もちろん、さまざまな問題設定は存在しますが、基本的には同じアプローチに基づいているので、ある関数のファミリーの一例として捉えることができます。そのため、人気のある統計学の本のほとんどは、さまざまな関数について触れており、統計学や機械学習のコースを受講すれば、誰もがほぼ同じツールセットを得ることができます。そして、それにより公共領域のソフトウェアを利用できるのです.
意思決定と不確実性を組み合わせたところで、2014年にINFORMSで講演とチュートリアルを行い、そのタイトルを「確率的最適化のジャングルを切り拓く」と呼んだのを覚えています。そして、チュートリアル記事を書く必要がありました。ある審査員の報告書に「まあ、そんなに悪くはない。『確率的最適化の庭園』と呼んだほうが良いかもしれない」と書かれていたのが印象に残っています。私は大笑いして、「この分野で論文を発表しようとしたことがないんですね。ここは異なるコミュニティが十数もあり、それぞれが異なる言語を話している。根本的に異なる記法体系が八種類もあると数えました。それに、当然、そこから派生も生まれるのです」と返しました.
そのため、強化学習はマルコフ決定過程の記法を採用しましたが、確率制御は独自の記法を持ち、確率的プログラミングでは決定木の記法が用いられています。まさに混沌としています。しかし、それぞれにはかなり堅実なコミュニティが存在し、同じ言語を話す仲間が集まっています。そして、論文を書く際には、彼らは特定のことを期待するのです.
私は十分に大規模で多様な研究室を運営していました。貨物輸送でキャリアを始め、終えたものの、その途中でエネルギーシステムの研究室も運営しました。最適学習や材料科学の分野で多数の研究を行い、一時は非常に興味深い経験をしました。電子商取引、金融にも取り組み、プリンストンでは学部生の卒業論文が必須だったため、約200件の論文を指導しました。十分な数の学生を指導し、幅広い問題に取り組むと、ADP本を書いた当時、「わあ、ADPは素晴らしい。見てください、トラック運送会社の最適化ができるし、これは偽りではなく本物の産業応用だ。すべてをこなせるはずだ」と言っていたことを思い出します。しかし、ああ、それは全くの間違いだったのです.
実は、ADP本の第2版で第6章を書いた際、「実は政策には4つのクラスが存在するようだ」と述べました。しかし、実際は4つ全部揃っていたわけではなく、3つしか正しく捉えられていませんでした。4つ目は間違っていました。出版社に原稿を送って6ヶ月後、「おお、4つ目の政策クラスが分かった!」と思ったのです。そして、それから2022年の大作が出版されるまで進化を続け、2016年には別のチュートリアル記事を書き、さらにEuropean Journal of Operational Researchからレビュー記事の執筆を依頼されたのです.
その主要編集者の一人であるRoman Slowinskiが依頼してくれたもので、その論文がこの大作のアウトラインとなりました。その論文を書き終えたとたん、「これが新しい本だ」と思い、ADP本の第3版を出そうとしましたが、「無理だ。ADP、すなわち価値関数近似は、非常に少数の問題に対して非常に強力なツールであり、皆それぞれお気に入りのハンマーを持っている。学界の誰もが自分のお気に入りのハンマーを持っているのだから、自分のハンマーに合う問題を見つければよいのだ」と考えたのです.
しかし、もし応用の現場から来るのであれば、例えばサプライチェーン管理のような豊かな応用分野では、ツールボックスが必要となります。どんなハンマーを持っていようとサプライチェーン管理に臨む際は、ハンマー一つでは不十分で、完全なツールボックスが必要です。なぜなら、分布予測を行うのは良いことですが、最終的には意思決定、すなわち不確実性の下での意思決定を行う必要があるからです.
Conor Doherty: では、そこで私も続けさせていただきます。ツールボックスの話と、確率的予測に重点を置き、実行可能な何かを提供するという点について語っておられるのですが、人々は実用的なものを求めています。そこで、ツールボックスの中身を詳しくご説明いただけますか?特にサプライチェーン管理の文脈で、あなたの普遍的な連続意思決定フレームワークが、どのようにより良い意思決定へと導くのか教えてください.
Warren Powell: ええ、私の大きな転機の一つとして、私が大好きなPowerPointスライドがあります。そこには、何らかの連続的意思決定問題を扱う15冊ほどの本が取り上げられており、その中のひとつ、私のADP本も含めて、どの本も「釘を探すハンマー」のようなものです。私たちは皆、意思決定のためのお気に入りの手法を持っているので、これらの本は1つまたは2つの基本的なハンマーを中心に書かれているのです.
応用現場から見ると、これらのハンマーはどれも良いものでありながら、どのハンマーもすべての問題に適用できるわけではないと気づくでしょう。現場では、問題を自分で選ぶことはできず、「これが問題だ。どう解決するつもりだ?」と言われるのです。学者たちは、手法を試すための問題を自ら選ぶことができますが、現場ではそのような選択が許されません。私のキャリアの大きな成果は、すべての手法がこれら4つのクラスに分類されると気づいたこと、そして2019年の論文で、その4つのクラスが実は大きく2つのカテゴリに分けられることに気づいたことです.
より単純なカテゴリは、将来を考慮せずある関数に基づいて意思決定を行いますが、その関数には将来もうまく機能するように調整可能なパラメーターが含まれているのです。サプライチェーンでの最も単純な例は在庫発注です。在庫がある水準を大きく下回ったときに、別の水準まで補充する。将来を見据えて計画を立てているわけではなく、ただのルールですが、その補充レベルは時間とともにうまく機能するように調整しなければなりません.
もう一つの比較的単純なものは、ほぼ常に簡略化された決定論的最適化モデルであり、そこには調整可能なパラメーターが組み込まれています。これは私が「コスト関数近似」と名付けたもので、私の大作以外ではあまり見かけませんが、業界では広く用いられています。業界の人々は「はい、私たちは常にそれをやっている。単なる業界の工夫だと思っていた」と言います.
たとえば、複雑な確率的問題の近似として線形計画法を用い、その上で安全在庫や歩留まり補正、あるいは余裕分を捉えるための調整可能なパラメーターを導入すれば、航空会社などは「アトランタからニューヨークへ飛ぶ際、天候による遅延があるかもしれないので、20分余分に加える」といった対応を取ります.
このように調整可能なパラメーターを用いる決定論的問題の解法は非常に強力です。学者たちは「ただの決定論的なナンセンスだ」と片付けがちですが、私はそれがパラメトリック予測に似ていると考えました。予測を行う際、需要は価格の関数であると知りたいです。すなわち、価格が高ければ需要は低くなるはずです。下向きの関数、たとえば直線やS字曲線を仮定し、最適な関数をフィッティングするのです。同じことをパラメータ化された決定論的モデルでも行うことができます.
さて、学者たちはまた、将来を計画に入れて今意思決定を行う別のクラスの政策を好みます。例えば、今決定を下せば、その時点で行動を起こすものがあります。例えば、ある一定量の在庫があるとします。私は在庫を補充することで、その行動により将来的な状態に移り、その状態にあることの価値を得るのです。これが動的計画法、すなわちベルマンの方程式と呼ばれるものです。学者たちはベルマンの方程式を非常に好み、工学出身者であればハミルトン・ヤコビ方程式と呼びます。さらに、不確実性の中で時系列的に意思決定を行う方法を教える優れた大学のコースでは、最初にベルマンの方程式が紹介されるのです.
私はベルマンの方程式の近似に基づく500ページの本を書きました。それをとても誇りに思っていました。非常に多くの問題に適用できる強力な技法です。正直なところ、実際のビジネスコミュニティに出向いて連続的な意思決定をしている人々に「ベルマンの方程式を聞いたことがある人は何人いますか?」と尋ねると、ほとんどの人が知らないのです。誰もベルマンの方程式を使っていません.
最後のクラスは、完全に先を見通すアプローチです。例として私はGoogle Mapsを挙げます。目的地への経路を計画する場合、最初から最後まで計画を立てなければなりません。将来を見据えた計画モデルは数多く存在し、価値関数を使うことなく明示的に将来全体のモデルを構築します。これは価値関数の近似に頼るよりもはるかに頻繁に用いられる手法です.
このように、学者たちはより高度な技法を好む一方、実際の現場に出ると、ほとんどの場合見かけるのは3種類の政策です。すなわち、「発注上限」や「安く買って高く売る」、あるいは「コートを着る」といった単純なルール、より複雑な問題に対しては、あまり複雑でない決定論的モデルに調整可能なパラメーターを加え、それを最適化するもの、そしてGoogle Mapsのような決定論的先読みです。これらの3種類が主要な選択肢となります.
もしあらゆる状況下で全ての意思決定を列挙できたとしたら、その97%はこの3種類の政策で行われていると私は考えます。でも、驚くべきことに、それらは書籍ではあまり強調されていません。ここからが私の話の方向性です。多くの考察はあなたに帰する部分もありますが、その議論は私の大作にも見られないので、第2版まで持ち越すしかありません.
これが私の「アハ!」という瞬間で、つまり、4つの政策クラスのうち先読みのアプローチを決定論的先読みと確率的先読みに分けたのです。結果、政策は5つになり、どれが最も使われるかと問われれば、第一のカテゴリ、すなわち広く使われるのは、単純なルールのような政策関数近似、パラメータ化された決定論的コスト関数近似、そして決定論的先読みの3種類なのです。これらが大きな3種類です.
しかし、時には確率的先読みが必要となる場合もあります。たとえば、中国からの注文の場合、通常は5週間かかるものが、場合によっては7週間かかることもあるでしょう。もし「7週間かかると見込もう」と計画すれば、これは実際、確率的予測を用いたロバスト最適化という、確率的先読みの一形態なのです。なぜなら、通常の期間ではなく、最悪のケースを計画に盛り込むからです.
価値関数近似、すなわち以前の本のテーマでもあるこの技法は、多くの問題に対して素晴らしいツールだと正直思っています。本当に必要なら専門家に相談すべきですが、日常業務では結局ほとんど使われることはありません。それは使いこなすにはあまりにも難しすぎるのです.
さて、中には強化学習について語る人もいます。初期の強化学習は、実は近似動的計画法の別名に過ぎず、同じことを異なる言葉で表現していただけでした。ORLコミュニティは、私が発見したのと同じことに気づき、「おや、これは必ずしも機能するわけではない」と実感しました。サットンとバルトの本の初版では近似動的計画法しか紹介されていなかったのに対し、第2版では、探し方を知っていれば4種類の政策クラスすべてが見つかります。しかし、私が依然として考えるのは、多くの人が強化学習を使うと言うとき、実際には近似動的計画法を意味しているということです。コンピュータ科学者は、自分たちのツールのマーケティングにおいて、我々他の分野の者よりもはるかに巧みなのです.
Conor Doherty: では、ありがとうございます。すぐにジョアンネスにお聞きしますが、こちらでの意思決定の方法について、あなたの見解と一致していますか?
Joannes Vermorel: まあ、必ずしもそうではありませんが、公平を期すならば、あなたが領域を細かく分ける方法は非常に技術的に正しいと思います。その点には異議を唱えません。そして、ここでいう領域とは、状態遷移関数や報酬関数といった、合意された知的モデルを持ち、それに基づいて意思決定を最適化するという枠組みのことを指しています。この視点から見ると、あなたの説明は正しいと言えるでしょう.
しかし、私自身が問題に取り組む方法は、かなり異なる角度からのアプローチです。手法のリストを考える前に、まずは問題文そのものはどうか、という視点があります。問題文に至るプロセスが極めて重要なのです。この本に対する少々不当な批判かもしれませんが、すでに1100ページにも及んでおり、どうやら出版社は3000ページの本を望んでいなかったようです.
Lokadでは、取り組みの初めに「状態をどこまで近似すべきか」という疑問を投げかけます。人々はそれが当然だと思うかもしれませんが、実際はそうではありません。常に現実世界をモデル化している以上、すべての原子の位置まで再現するわけにはならず、何を状態と見なすかについては大きな裁量が存在するのです。その次に、状態間の遷移関数があり、こちらもどのようにある状態から別の状態へ移行するかの決定に大きな自由度があります.
これは問題解決の一部だと私は信じています。もしこの段階で誤った判断、つまり状態があまりに細かすぎたり、遷移関数が複雑すぎたりすれば、その後のツールはすぐに崩壊してしまうでしょう。だからこそ、私にとって最初に重要なのは正しい判断を下し、それを実現する適切なパラダイムを持つことです。コスト関数や報酬関数についても同じことが言えます.
私たちは、在庫切れのコストや割引を提供するコストを評価する必要がある顧客にとって、典型的なケースを抱えています。一度割引を与えると、利益の一部を放棄することになります。それ自体は問題なく、測定もできるし、かなり単純です。しかし、その割引がまた適用されると人々が期待するようになり、結局は後で自分自身に問題を抱え込むことになります。
これは、人々が以前の割引をどれだけ覚えているかなど、行動を正確に評価するのは非常に難しいということです。これがいわゆる遷移関数であり、それを近似する必要があります。私の場合、このフレームワークでアルゴリズムプロセスの各歯車を近似する前に、まず近似手法自体を考えることから始めます。
私の視点は、モデルの定義そのものから始まります。一般的に最適化したいモデルが既定であるという考え方は取り入れず、むしろそれ自体を方法論の一部と捉えています。それが最初のポイントです。すみません、まだ終わっていません。第二のポイントは、少し私のコンピュータサイエンスのバックグラウンドにも関係しますが、問題の次元を考えることです。
例えば、数百件の配送がある都市のルートのような、数千の意思決定という小さな問題に取り組む場合と、全く異なるケースがあります。私にとっては、千件の意思決定は非常に小さな問題です。しかし、我々が扱う問題には、十億もの変数が登場するものもあります。大規模なサプライチェーン、例えばハイパーマーケットでは、1つの店舗で100,000 SKUが存在することもあり、もし1000のハイパーマーケットがあれば、1億SKUになります。各SKUにつき半ダースの意思決定があり、それを未来の数週間にわたって繰り返していくのです。結果として、ルート最適化のような非常に小さな問題から、メモリにすら収まらないほど非常に大きな問題まで、幅広いスケールの問題が生じ得ます。
私にとって、問題に取り組む際にはまずその主要な特性を把握することが重要です。その一つが次元性です。もう一つ非常に重要なのは、より良い解へと導く際の困難さです。例えば、ルート最適化は非常に非線形で脆弱な問題です。単に2ヶ所の位置を入れ替えるだけで、極めて悪い解から非常に優れた解へと変わる可能性があります。つまり、解は結晶のような性質を持ち、極めて壊れやすいのです。良い解から非常に悪い解へと簡単に崩れてしまうのです。
一方で、私のスーパーマーケットのネットワークのような問題では、例えば、あるべき場所から1ユニットだけずらして配置しても、問題への影響は非常に少なくなります。つまり、大きな余裕を持って対応でき、方向性さえ正しければ大丈夫ということです。この問題の性質は、結晶のような特性から泥のような特性まで幅広いと言えます。結晶は脆く壊れやすいのに対し、泥は形がなく、方向性さえ正しければ大丈夫なのです。これが第二の考慮点です。
第三の要素は、求められる時間特性です。時間特性は、倉庫内でロボットを操作するようなシステムで、ミリ秒単位で一定時間・一定メモリ内で応答を出さなければならない場合などから、中国からの輸入で10週間かかるようなケースまで存在します。もし「10ミリ秒以内に答えを出さなければならない」と言われ、できなければさまざまな問題が生じますが、計算に24時間かかっても大した問題ではありません。24時間であれば余裕があり、全く制約はありません。
このように、私がドメインを分析する方法について少し説明しました。私のこのアプローチが、使うべきアルゴリズムそのものについて多くを語るわけではないのですが、興味のある問題に対してどのような解決策すら検討すべきかを排除するための一助となっています。
ウォーレン・パウエル: あなたがアプリケーションドメインからアプローチしている点が大好きです。私がサプライチェーン・アナリティクスの本、つまり問題クラスに焦点を当てた初めての本を書き始めたとき、他の本が基本的に手法に関する内容であったのに対し、非常に楽しい経験をすることができました。
さて、私の大作に一点だけ功績を認めてもらいたいのですが、そこにはモデリングに関して90ページにも及ぶ1つの章があり、非常に汎用的なモデリング手法について扱っています。あなたが説明していたプロセス全体を私は心から評価しています。これが状態変数です。複雑な問題において、私のチュートリアルでは「問題は5つの要素から成り立っており、状態変数から始まる」と言っていますが、実際にモデリングを行う際には、状態変数は最後に扱うのです。
さらに、これは実際に反復的なプロセスです。モデリングを進める中で、状態変数は単なる情報に過ぎません。モデルを進めながら、「この情報が必要だ、あの情報も必要だ、さらにこちらも―あ、そこに状態変数がある」と判断します。しかし、例えばどのように意思決定を行うかは、不確実性のモデル化の仕方に依存します。不確実性をどうモデリングするかは、意思決定の方法に左右されるのです。
そのため、私は不確実性のモデリングと意思決定のプロセスを、まるで2つの梯子を登るようなものだと説明しています。不確実性下での意思決定のために、もしモデルが非常に基本的な確率モデルにとどまっているなら、極めて洗練された意思決定手法を持ち込むべきではありません。我々の複雑な問題では、不確実性のモデルを好きなだけ複雑に構築することが可能です。
一般的に、最初から最も複雑なモデルで始めることはありません。もっと基本的なものから始め、それから意思決定を行う仕組みが必要となります。基本的なモデルであるため、極めて複雑なものにする必要はありません。十分な意思決定モデルができあがったら、不確実性のモデルに再び取り組むことができるのです。なぜなら、今となっては他のリスク指標を得たいと思うかもしれないからです。
そして今度は、リスクを反映した意思決定が求められます。こうしてこの梯子を登っていくのです。Lokadでのあなたの全プロセスが反復的であることは十分に理解しています。我々は常に、問題を解決する最もシンプルなモデルを望んでいます。重要なのは、ビジネス上の目標を達成するために何が必要かということであり、それは一連の学習プロセスなのです。
ヨアンネス・ヴェルモレル: 全くその通りです。あなたの本には大いに敬意を表しています。確かに、例えば15種類ほどの不確実性を列挙していると思いますが、これはこれまで見た中でおそらく最も長いリストであり、それだけに非常に現実的な懸念事項でもあります。不確実性と言われると、人々は「点予測の不正確さについて話しているだけだ」と思いがちですが、決してそうではなく、不確実性には非常に多くの要因が存在するのです。たとえば、依存するコモディティの価格が変動することや、依存する労働力がストライキを起こす、または単に資格がなかったり存在しなかったりすることなどが挙げられます。
また、拠点における住宅問題の可能性も考えられます。不確実性を、販売の不正確さという一面だけで捉えるのは極めて狭い視野です。私はあなたに完全に同意します。Lokadで非常に反復的な開発を行うことは、まさに我々が実践していることであり、それと同時に、より迅速な反復作業を進めるために投入するエンジニアの生産性という大きな課題も浮上するのです。
Lokadでは、確率的最適化問題に取り組む際、通常はプログラミングパラダイムを特定するアプローチを取っています。これらのパラダイムは一つのコレクションとして存在し、統一されたものではなく、むしろ利用可能な小さなライブラリのようなものです。こうしたパラダイムは、ソルバーの実装を比較的迅速に進めるための視点を提供してくれます。ここでも、反復的なプロセスに完全に同意します。ビジネスの立場から見ると、クライアントが非常にせっかちであることが我々の課題となっています。
我々は迅速な反復を求められますが、同時に、非常に複雑でハードコアなアルゴリズムを扱っているのです。クライアントは、アルゴリズムを有限の時間内に実装する必要があります。さらに、本で目にする多くの手法は、アルゴリズムの実装に10年もかけられるほどの超優秀な大学教授がいる場合には機能しますが、実際の現場では100時間で実装しなければならず、いくつかの手法は実装レベルで正しく動作させるのが極めて困難です。だからこそ、これらのプログラミングパラダイムが役立つのです。それらは、反復作業を行いながら、製品環境で有限の時間内に動作するコードを書ける方法を提供してくれます。
ウォーレン・パウエル: 第11章の終盤、恐らく最終セクションにおいて、ポリシー評価に関するソフトな側面についての小節があります。本書のあらゆる箇所で、ポリシー最適化とは「ポリシー全体での最大化、何らかの期待値」と記述しています。ウェブサイトからダウンロード可能な第11章の終盤には、方法論的複雑さなど、約5種類の特性について触れており、あなたが述べたように、計算可能性や透明性が極めて重要です。私たちは皆、アルゴリズムを実装し、結果が出たときに「なぜこのような結果になったのか」と頭を悩ませ、顧客がその理由を理解できずにいる状況を経験しており、「データの誤りか、ルール変更かもしれない」と説明できるようにしたいのです。
つまり、Optimal Dynamicsでは運送会社からデータを取得し、皆さんが直面しているような数々の問題に取り組んでいます。顧客が結果を気に入らなければ、迅速に修正を求められるのです。私が大学の研究室で開発した、最も強力かつ重要なツールの一つに、「Pilot View」と呼ばれるグラフィカルツールがあります。これは、フローが見える地図モジュールと、洗練されたフィルター機能を備えたモジュール、さらに私が「電子顕微鏡」と呼ぶ、個々のドライバーや荷物を表示し、クリックすることでどのドライバーがどの荷物に割り当てられたか、さらにはどの荷物を検討したのかを確認できるモジュールの2つの要素から成っています。なぜなら、もし1000人のドライバーと1000の荷物があれば、1000×1000通りの全組み合わせを検討することは不可能であり、これはアルゴリズムの問題ではなく、すべてネットワークジェネレーターの問題だからです。
このように高度なツールを利用しているにもかかわらず、あるドライバーが荷物に割り当てられなかった場合、その理由は何でしょうか?おそらく、ペナルティが高すぎたからか、コストが高すぎたからか、もしくは私のプルーニングルールのいずれかで単純に考慮されなかったためでしょう。そしてもちろん、顧客が不満を述べた場合、現場に出たとたん、複雑なアルゴリズムは通用しなくなるため、非常に迅速な回答が必要になるのです。
ヨアンネス・ヴェルモレル: その点には非常に共感します。この観察は私自身が思いついたのではなく、インターネットで見つけたもので、正確に誰が言ったかは覚えていませんが、その要旨は「アルゴリズムのデバッグには、実装時の2倍の賢さが必要」といったものでした。
つまり、もしあなたがすでに実装時に最高の知性を発揮してアルゴリズムを構築するなら、その状態で本番環境に移行しデバッグを行う際には、実装時の2倍の賢さが求められることになり、それは事実上不可能です。なぜなら、実装時には既にあなたは最高の状態であったからです。したがって、デバッグできる余裕を持つためには、あなたの最高のパフォーマンスではない解決策が必要なのです。また、あなたが述べたサポートツールの重要性にも非常に同意します。計測機器の役割は絶対に基本的なものであり、極めて重要ですが、同時に困難な面もあります。この本は非常に多くの内容を含んでおり、その点は大いに評価すべきです。洞察に欠ける本ではなく、計測機器の役割が何よりも重要であると示しています。
決定論的な最適化の領域においては、単に「必要なCPU秒数はどれだけか、得られる解の性能はどうか」という点だけが議論されていました。しかし、確率的最適化の領域に足を踏み入れると、何が起こっているのかを理解するために、非常に多くの補助的な計測機器が必要となります。そして、それは単に意思決定を生み出すツールだけでなく、その上に重ね合わせることのできるすべての計測機器によって、単一の意思決定ではなく意思決定プロセス全体を理解するための手段を提供するものなのです。これがなければ、人々は懸念を抱き、詰まってしまい、「信じてくれ、これは良い」とただ主張することはできません。確率的最適化においては、これは従来の数理最適化ほどうまくいかないのです。
ウォーレン・パウエル: ええ、業界と協働するのは明らかに魅力的な挑戦です。私自身、キャリアを始めた頃からその経験を積んできました。私が研究室を設立し、プロのプログラマー、すなわち博士号を持つ者たちを雇ったのは1990年代になってからのことですが、彼らはコードを書くためだけに存在しており、もしあの2人がいなければ、私の研究室は決して軌道に乗らなかったでしょう。あなたも経験があるかもしれませんが、自分のアルゴリズムが解を提示し、その解が気に入らず、顧客も納得せず、皆がテーブルを囲んで「何が問題なのか」と頭を抱える中、演習を何度も繰り返すと、異なる人々がそれぞれのスキルセットに基づいた理論を持ち出すのです。そこで私は「神よ、このアルゴリズムはもっと洗練されるべきだ」と思い、この人はデータを心配し、あの人はプログラミングのエラーを心配し、仮説を立てるたびに皆が全く異なる意見になってしまうのです。
本当に驚くべきことです。もちろん、いつかあなたと一緒に座って、生データ取得の問題についてもっと学びたいと思っています。私のトラックローディング輸送業界では、すでに商用TMSシステムを利用している運送業者とだけ取引しており、それが完璧というわけではありませんが、私たちの水準はかなり高いのです。しかし、これは挑戦であり、大いに楽しいものでもあります。もっとできれば、現実の問題をもって学界に挑戦してほしいと思っているのですが、正直なところ、私は学界には諦めかけています。
学界にいる人々は、問題を解決するためにいるのではなく、定理を証明し論文を書くために存在しているのです。私はその世界にほぼ40年間身を置いてきましたし理解していますが、根本的に欠陥があると考えています。私が貨物輸送会社と関わった際に唯一見られたのは、彼らが皆データを共有する意志を持っていたということです。これは、荷送人には当てはまりません。
私はサプライチェーンデータを共有することをいとわない物流業者に出会ったことがありません。それは完全に禁じられていて、決してやってくれません。私はジェットエンジンメーカーであるプラット&ホイットニーのために大規模なサプライチェーンプロジェクトを行いましたが、それは政府の資金提供を受け、彼らを所有するユナイテッド・テクノロジーズという会社から全て承認を得ていたにもかかわらず、データ共有の提案すら聞こうとしませんでした。彼らは「なんてことだ、あれはあまりにも機密性が高すぎる」と言いました.
それで、彼らは喜んでプロジェクトに参加し、私たちは自前の洗練されたデータ生成ツールを開発し、世界中のランダムな需要を作り出さなければならなかったのですが、彼らは「うちのサプライヤーの中には本当に秘密主義のところがあるんだ。コネチカット州内のどこかにそのようなサプライヤーがいることすら知られてはならない」と言い、ただ「だめだ、それは情報が多すぎる」と断ったのです.
ですから、データが手に入らない環境で現実の問題に取り組むのは困難です。私はラトガーズ大学に所属し、現在そのサプライチェーン管理部門のエグゼクティブ・イン・レジデンスを務めています。そして、偽データを用いたシミュレーターの構築を大学に提案し、少なくとも現実に即したシミュレーション問題に取り組んでもらえるようにしようと期待しています.
Joannes Vermorel: 私はあなたが直面した一連の問題に非常に共感できます。私の場合はサプライチェーンの反対側、つまりスペクトルの一端から来ています。一方では、運送業がほとんど最終的かつ短期的な決定のようなものであり、さらに過激な例で言えばロボットの操縦といった極端なケースもあります。これがスペクトルの一方の端です.
スペクトルのもう一方では、S&OP、すなわち販売と運営、超マクロな計画、企業レベルの戦略などがあります。そしてその中間にはすべての要素が含まれます。私自身の経歴は反対側、すなわちS&OP、非常に戦略的で予測重視の領域から来ました。Lokadの最初の数年間は、意思決定すら伴わず、純粋に予測だけでした.
あなたの懸念に戻ると、私が問題視していたのは、アカデミアで見られる状況です。ちなみに私は博士課程を中退しており、博士課程の指導教官を喜ばせることなく堂々と中退してLokadを立ち上げました。アカデミアは予測精度に焦点を当て、事実上永遠により良い販売予測のために20,000ものモデルを発表してきたのです.
業界では、あなたが述べたのとまさに同じ状況が存在します。10人が丸テーブルを囲み、それぞれ自分の視点から問題を見、意思決定の直前、すなわち行動に移る前の予測について、まずは予測をしようとして、皆が予測を上げたり下げたりしようと争っているのです.
S&OPでは、営業担当者は予測を控えめにして実績を上回ることを狙い、一方で製造部門は予測を水増ししたいと考えています。というのも、予測を水増しすれば製造設備のための予算が増え、結果的にどの注文を製造するにしても、より多くのキャパシティがあれば対処が容易になるからです.
営業部門が数字を大幅に下げようとし、製造部門がそれを大幅に上げようとする綱引き状態になっており、これは非常に非合理的です。興味深いことに、アカデミアではロシアのマイナーな理論を駆使して0.1%のバイアスを除去するという非常に洗練された手法を発表する論文まで出るのです.
その結果、実際の会議室では「マイナス50%が欲しい」と言う人と「プラス50%が欲しい」と言う人が対立し、意見の断絶が生まれるのです。データにアクセスすることは、常に非常に困難でした.
Warren Powell: 予測に関する一つの質問ですが、あなたはこれにどう対処しているのか教えていただけますか。過去のデータから未来を予測する数学は多く存在しますが、さまざまな理由で未来はしばしば過去とは大きく異なる可能性があるのは明らかです。特に、未来が上昇するのか下降するのかわからない中で、これまでに見たことのないような差が生じるかもしれません。どのように対処しているのかお聞かせいただけますか?
Joannes Vermorel: ええ、もちろんです。通常の方法として、私たちは正確な根拠はないものの、何らかのマクロな不確実性を導入しようとします。奇妙に聞こえるかもしれませんが、「需要予測はこれで十分だ」と考えたうえで、毎年4%の確率で需要や活動全体が30%急激に低下するという変数を追加するのです.
すると、人々は「うわっ、1年で30%の低下なんて、すごすぎる。どうしてそんなことを考えるのですか?」と言います。私の見解では、20世紀を振り返れば二度の世界大戦や他の多数の戦争があり、さらに近年では世界的なロックダウンなどもありました。ですから、25年ごとに業界に大打撃を与える小惑星が襲来する、と考えるのは決して突飛な話ではないと思います.
しかし、人々は自分たちが知っているものを予測することを期待しているのに対し、私たちは「正確に知っている必要はない」と言うのです。大きな混乱、何であれ、それを想定して数値を作り上げるのです。これらの数値は完全に作り話であり、年4%の確率、30%という数字も、変更可能であり、例えば5%や50%という値にすることもできるのです.
これにより、常に大きな混乱を念頭に置くことが求められます。たとえば、私たちは航空宇宙分野のクライアントにサービスを提供していました。人々は「そんなに頻繁なことではない」と言うかもしれませんが、実際には業界を見渡すと、たとえばボーイングの737 Maxが運航停止になった例があるのです。私のクライアントにとって、それは非常に大きな問題でした.
結局のところ、非常に悲観的な要素をモデルに取り入れることを受け入れる必要があるのです。これは通常、合意が得られず非常に受け入れがたいものです。問題は数学が不足しているわけではなく、恐ろしく、人々が恐怖を感じたくないからです。しかし、もしそのような大きな衝撃的な出来事に備えなければ、結果として準備不足に陥るのです。それだけの話です.
もう一つは、非常に悲観的な側面として、大きな混乱を常に見据え、十分な時間を与えれば必ず起こるという事実を受け入れる必要があるという点です。これが一つの側面です.
もう一つの側面は、私のクライアントのほとんどが不確実性や意思決定に伴う不確実性を見ると、悪い結果だけに注目してしまうことです。問題は変動性に起因していると思います。人々は悪い結果を同一視します。製造業では、デミングのような人物が一貫性の必要性を説き、それが根本的な美徳とされています。絶対的な一貫性が求められ、たとえ粗悪な製品であっても、常に同じであれば問題ない。安価であり、何を期待できるかが明確になるのです.
しかし、良い面と悪い面が混在してはならないのです。いつも絶対的な一貫性が求められます。だからこそ、人々は製造業の変動性を悪いものと見なします。しかし、本当にそれはそうなのでしょうか? 製造の世界を離れると、変動性はそれほど悪いものではないのです。必然的に悪いわけではありません.
一例としてファッションがあります。ファッションでは、ヒット商品もあれば、外れる商品も生まれます。低確率のファットテール効果によりヒットと外れのばらつきが大きくなれば、確かに外れる商品は増えますが、その分、桁違いの大ヒット商品が生まれる可能性もあるのです.
製造における変動性は悪いものですが、サプライチェーン全体においては、必ずしもそれほど悪いものではありません。もしもほぼ完全に安定した機会の流れがある場合、非常に安定している反面、もし混乱が起これば致命的になり得ます。しかし、多少不規則で荒々しいものでも、リスクを常に取りつつ、不確実性の下で最適化された意思決定によって慎重に管理すれば、ミスを犯しても致命的な打撃を受けにくくなるのです.
その結果、混乱が起きたときの影響がそれほど大きくならない状況に陥る可能性があります。たとえば、製品の98%が毎年再購入される事業で、法律が変更されて誤った製品やプロセスのために20%の製品が違法と見なされた場合、それは莫大な打撃となるでしょう.
もしあなたの事業が毎年2%の製品しか更新されないものであれば、突然20%が規制により廃止されると大変なことになります。しかし、毎年例えば15%の製品を更新する事業であれば、ある年に20%になったとしても、新規性への需要があるため、より早く回復できるのです.
すべての不確実性が悪いわけではありません。時には、ある程度の不確実性を追求することが有益な場合もあります。たとえば、多くの予測の専門家は新製品の予測を忌避します。なぜなら、時系列の履歴がまったくないからです。時系列予測の文献を見ると、履歴のない製品は99%のケースで除外されるのです。私の見解では、履歴のない製品の予測こそが最も興味深いのです.
これこそがサプライチェーンにおける真の戦いが繰り広げられる場です。新しい製品こそがヒットする可能性があり、企業の方向性を変える転機となり得るのです。ですから、あなたの質問に対する答えは長くなってしまいました.
Warren Powell: 最後に一言だけコメントさせてください。私が自分の四つのポリシーのクラスを用いたフレームワークで最も評価している点の一つは、意思決定のことを気にする必要はないと言える点です。四つのクラスのうちの一つを選んで、もっとも合理的なものを採用すれば、心配する必要はありません。問題はそこではなく、不確実性のモデリングにあります。不確実性の下での意思決定の複雑さから人々を解放し、むしろ不確実性のモデリングに注力させることができれば、それが真の勝利なのです.
Joannes Vermorel: 全く同感です。大企業が不確実性に直面したとき、最も悪い行動の一つは、不確実性を削減するためだけのルールをでっち上げることです。問題を単純化するために、ルールを考え出すのです。たとえば、「UPSは回路上で左折のみを行っている」と聞けば、我々も「それなら私たちも左折のみを行えば、何かが単純化される」と考えてしまいます.
ご覧の通り、可能性や選択肢、不確実性が膨大に存在する中で、最も適切でないアプローチの一つは、問題を扱いやすくするために完全に作り話の一連の制約を考え出すことです。あなたのフレームワークに話を繋げるならば、それは誤った方法だと言えます。なぜなら、真の問題に対処するための選択肢は十分に存在するからです.
ですから、問題解決のための解決策が見つからないのではないかという恐れから、単に制約を作り出し始めるべきではありません。解決策は豊富にあるのですから、意思決定プロセスの単純化だけを目的にルールや制約を作り出すのは控えるべきです.
Conor Doherty: 私はまだここにいますし、全く問題ありません。私は3、4枚に分けてメモを取ったのですが、その中で、あなたが「財務リスクの管理」という用語を使っていたのに関連して、私はトレードオフ、ビジネス上の懸念、業績評価、そして財務リスクの管理について書いています.
ですから、ウォーレン、あなたのフレームワークや確率的最適化に対するアプローチをまとめる機会として、オンライン講義(私も視聴しており素晴らしいです)や1100ページに及ぶ書籍の中で、ルーティングの最適化、在庫管理、または履歴のない製品の在庫予測と管理に伴う財務リスクを、具体的にどのように管理しているのか教えていただけますか?
Warren Powell: もちろんです。まず第一に、ヨハネスと私が共に取り組む実際の問題から得られる副産物の一つは、「まずモデル化し、それから解決する」ということです。問題を十分に理解する必要があります。「リスク」という言葉を用いるとき、それは不確実性について語る必要があることを強調しており、これは単なる正規分布よりもはるかに複雑なものなのです.
統計学者たちは、不確実性に取り組む際、まず学生に正規分布を紹介するのが好きです。「平均があり、分散がある。平均の周りにはランダム性が存在する」と言いますが、彼らは不確実性の最大の要因は平均そのものだということに気付いていないようです。私たちは平均がどう動くかさえ分からないのです。もちろん、平均の周りにはノイズはあるものの、最も問題なのは平均自体の変動なのです.
そして、確率分布に本来含まれるべきでないこれらの事象は、偶発事象として扱われます。「確率はどうあれ、起こり得る事象がある。もしそうなったらどう対処するか?」という形です。私はその確率を気にすることなく、例えば船が1か月遅れて到着した場合や、この港が閉鎖された場合、さらには日本で地震が起きた場合など、大きな出来事が起こる可能性に備えて計画を立てなければならないのです.
不確実性の中で意思決定を行うという全体のプロセスについて、私が最初に伝えたいのは、「確かに複雑な数学は存在しますが、我々人間は常に不確実性の中で意思決定をしている」ということです。キャリアの初期、トラックの問題に悩んでいたときも、配車担当者はすでにこのようにしていたのです。人間の脳は不確実性の中での意思決定において驚くほど優れていることを自覚しなければなりません.
多くの場合、人々は「確率論は好きではない」と言います。しかし、その同じ人がランダムな出来事や不確実性、偶発事象のための計画を立てるのです。これは人間の脳に本来組み込まれているものであり、我々動物は進化の過程で常にこれらに対処してきたからに他なりません。最大の課題は、不確実性の中で意思決定を行うことではなく、不確実性の中でコンピューターに如何にして意思決定をさせるかを教えることなのです.
だから、この会話は決して終わることがないと思います。私たちは定量化が必要であり、コンピュータを使うべきです。なぜなら、意思決定を行う人々が大量に集まるという考え方は、少し時代遅れになりつつあるからです。トラック運送会社において、Optimal Dynamicsでは戦略的なモデルからリアルタイムモデルに至るまで、幅広いモデル群を提供しています。しかし、我々が提供する製品の絶対的な基盤は、リアルタイム配車を行うものであり、アメリカ国内のどのトラック運送の責任者も、自社の最大の問題が配車現場であると信じているからです。真実かどうかは別として、それが彼らの信念なのです。
私は、貨物を運ぶための適切なドライバーを見つけることが最も重要なことではないという考えを学びました。最も重要なのは、適切な貨物を選ぶことであり、これは航空会社の収益管理に似ています。多少先の未来を計画しなければなりませんが、家に帰ってDOTの規定労働時間を守れる適切なドライバーを見つけるのが非常に難しいため、皆がドライバー配車の問題に過度に集中してしまうのです。
しかし、本当に重要なのは適切な貨物を見つけることです。なぜなら、適切な貨物を見つける難しさは、数日後や一週間後に予定を組まなければならず、ドライバーがどこにいるか、自分がどこまで対応できるかが分からない不確実性の中で計画を立てる必要があるからです。配車担当者はこれを理解しており、洗練されたツールを持っていなくても、「ああ、ここは良い場所だ。おそらくドライバーがいるだろう」という直感を持っています。
私は、CEOが確率論的なことを理解しないので不確実性を扱わないという考えを、率直に口にする人々を見たことがあります。いや、彼らは「stochastic」という言葉は理解していなくても、不確実性という概念は皆理解しているのです。ところで、我々は彼らの「予測を達成する」という固執を乗り越えなければなりません。
私が考える輸送業界(サプライチェーン側の話ですが)の最大の問題のひとつは、皆がトラック運送に特化した輸送予算を持っているのに、その予算を達成できないことです。輸送費の見積もりは常に楽観的で、結果的に予算以上の支出になってしまうのは、輸送資産を計画しなければならないサプライチェーン担当者として仕方のないことなのです。
つまり、とても楽しい問題が山積みで、私たちが話すことは決して尽きることがないと思います。
Joannes Vermorel: ええ、そして正直に言うと、確実性の下での意思決定に関するあなたのお話には全く同感です。そして、非常に興味深い状況を目の当たりにしました。実際、最も困難な議論は、数学に無知な人々や、逆に非常に高度な数学的知識を持った人々との間で行われるのではなく、全く教育を受けていない人々と、超一流の教育を受けた人々の間で行われるのです。
私にとって難しいのは、やや教育を受けた人々です。滑稽なことに、コンピューターに不確実性を扱わせるのは実に難しいのです。私はその点に大いに同意しており、ある程度教育を受けた人というのは、つまりExcel、Microsoft Excelを使うということを意味します。
そして問題は、彼らが少しは知っているからこそExcelを使い、その結果、自分の考えられる唯一の解決策だけで世界を眺めてしまうことにあります。結果として、Excelについて何も知らない素人は、まるでポーカーを習慣で上達させたかのように、理論は持っていなくても、ポーカーの腕前を磨いてまずまずの成果を収めるのです。
そして、適切な貨物の選定についても同じことが言えます。確率の概念が全くないにもかかわらず、経験を積むことで非常に優れたプレイヤーになっている人々がたくさんいるはずです。彼らは形式的な理論を持っていなくても、直感によって判断しています。
そしてその中間には、Excelを知っていて「よし、これをExcelで実装しなければ」と言う人々がいます。しかし、Excelはそのためのツールとしては最悪です。なぜなら、Excelは確率を扱うためのものではなく、モンテカルロ法のようなシミュレーションを行うためのものでもなく、あらゆる不確実性に対処するためには全く向いていないからです。Excelは会計処理には優れていますが、不確実性の扱いには全く役に立たないのです。
そして、私が最も困難だと感じるのは、Excelに固執する人々とのやり取りです。もし、解決策がExcelの枠を超えている場合――たとえば、Excelでの計算よりも直感が正しい場合や、あまりに洗練されていてExcelの計算に収まらない場合――彼らは強い拒絶感を示すのです。
非常に興味深いですね。そして、私もMicrosoft Excelのスプレッドシートに固執する中間層の人々に深く共感しており、そこが大きな問題となっているのです。
そして、CEOがそれを理解しないと言われる場合、そのほとんどは実際には彼ら自身の問題認識の投影だと思います。ある程度大きな会社になると、CEOはほぼ必ず、大量の混沌とした状況に対処するのに長けた人物だからです。
数百人規模以上の会社のCEOに昇進した人が、世界が極めて混沌としているという事実に全く動じないというのは、実に難しいことです。結局、それが毎日の生活であり、常に無意味な事象に対処しているのですから。
だから私の見解としては、人々が「複雑過ぎる。CEOには理解できない」と言うのをよく見かけますが、実際にはそれは自分自身の恐れの投影に過ぎません。CEOは結局のところ、自社のあらゆることを理解する時間がほとんどなく、その結果、その人物が自社について理解できていない点は千のうちの一つに過ぎず、決して最後のものではありません。これが私の考えです。あなたはどう思いますか?
Warren Powell: ええ、実際、CEOは全く異なるレベルから来るのです。特に大企業では、彼らは財務の大局に焦点を合わせています。現場で行われる詳細な業務は、キャリアの中であえて省かれている部分かもしれません。
つまり、昔、私が学校に通っていた頃、プリンストンの学部生でさえ、Procter and Gambleで働き、工場現場で6か月間過ごし、その後経営陣に昇進するというキャリアパスがありました。彼らは早期に昇進できたものの、最初は必ず底辺から始めるように指示されていたのです。この慣習は1980年代に廃れてしまいました。
1980年代、私がプリンストンで教え始めた頃、プリンストンの学部生は企業で働くことはほとんどなく、経営コンサルティング会社で働くのが流行していました。彼らはコンサルティング会社で実地経験を積み、MBAを取得し、数年後に企業の上級管理職に就くという流れで、現場の細かい部分を飛ばして昇進したのです。
Excelに関するあなたの指摘ですが、私がトラック業界で働いていた頃に出会ったのは、トラッカー、いや、すみません、配車担当者や低レベルの管理者だけでした。Excelの基本的な作業すらこなせる人はほとんどいませんでした。一方、サプライチェーン業界では、基本的な作業をこなす人が大量に存在するのです。
さて、書籍を見てみると、Rutgersで本格的なサプライチェーンプログラムに関わる中で、これらの書籍を手に取ると、内容は数学の遊び題目のようなものか、非常に簡素化されていることがわかります。つまり、Excelですべてができると思っている人々がいるだけでなく、書籍自体もExcelでできることしか教えていないのです。
だから、我々は単なるExcelスプレッドシートの問題以上の課題を抱えていると考えています。誰がこれらの問題を解決し、ツールを使用するのかという点についても考える必要があるのです。私は「肝心なのは、内部はかなり洗練されている一方で、使いやすいツールが必要だ」というあなたの意見に大いに賛同します。
Optimal Dynamicsでは、ツールを使いやすくすることに非常に注力しています。しかし、内部では、機能がしっかりしていればそれで良く、本当に人々が求めているのは最高のソリューションなのです。サプライチェーンの現場を覗いてみると、ある統計で「93%の人々が計画をスプレッドシートで行っている」と言われているのを見た気がします。
結局、スプレッドシートでできることには限界があります。単純なシミュレーションを実行できたとしても、たとえば簡単な在庫シミュレーションは可能ですが、複数のサプライヤーで長いリードタイムを導入するとなると、スプレッドシートの能力をあっという間に超えてしまいます。また、自分だけでできると思っているスプレッドシートのプログラマーの能力も、すぐに限界に達してしまうのです。
私には元博士課程の学生がいて、彼女は今や最高分析責任者(CAO)として非常に優秀ですが、ブラジルのKimberly Clarkで8年間、オペレーションプランニングに従事していました。そこには長い話がありますが、ある時、彼女は一般的な在庫計画の問題に苦しんでいました。そこで彼女は、かつて短期間McKenzieで働いた経験を活かし、McKenzieの古い友人たちを呼び寄せたのです。すると、McKenzieは教科書に書かれたことしか知らず、彼女はすぐに、彼らが何を言っているのか全く理解していないと判断し、即座に排除しました。つまり、最も優秀な人材でさえ問題解決の方法を教えられていないのです。ここで言うのは、奇抜な数学を教えるということではなく、問題解決のために絶対に必要な実践的なモデリングの方法が、どこにも教えられていないということです。
Conor Doherty: 失礼ながら、どこかで教えられているものです。宣伝です。
Joannes Vermorel: 宣伝です。Lokadでは、主にパリ周辺の半ダースほどの大学でこれを教え始めました。また、サプライチェーンにおける問題解決のための一連の公開ワークショップも開始しており、我々が取り組む最大の努力、すなわち最大の投資の一つは、データセットの作成なのです。
そこで、我々は関連するデータセットを作成・公開しています。実際、私自身の意見としては、完全に合成されたデータセットを作成するのはあまりにも困難であるため、既存の顧客データを顧客の同意を得た上で完全に匿名化するしかないと考えています。実際のデータを使用し、完全に匿名化し、奇妙なパターンを保持しながら、比較的小規模で整理されたデータセットにまとめることで、学生たちはデータのあいまいな部分に数ヶ月も費やすことなく、問題に取り組むことができるのです。私は大いに同意しますし、ちなみに私の両親はProcter & Gambleでキャリアをスタートしたので、その感情には非常に共感できます。
Warren Powell: つまり、パリ周辺の学校ではどのような学生に教えているのですか?
Joannes Vermorel: ああ、非常にクラシックなケースです。フランスの制度では、2年間の予備校があり、基本的には全国試験です。2年間の準備期間を経て全国試験が行われ、皆が順位付けされ、成績が新聞に掲載されるので、成績が悪ければ世間に晒されるのです。その後、いわゆるGrandes Écoles、つまりミニ版のフレンチ・アイビーリーグがあり、人々はその工学系の学校に進学します。ですから、私がここで話しているのは、工学系学校、ビジネススクール、そして行政系学校の3つのセグメントのうち、工学系学校に関することだけです。
Warren Powell: 工学系ですね。プリンストンではエンジニアに教えていましたが、今Rutgersに関わるようになり、ビジネススクールで教えるのは初めてです。そしてすでに、ビジネススクールの学生の中で、サプライチェーンマネジメントを選ぶ学生は、技術的なスキルの面でリストの下位に位置する傾向があると、穏やかに警告されています。上位の学生は金融分野に進むため、その影響が波及するのです。私はまだ始めたばかりで、コースを直接教えるわけではなく、教師を対象に教えていますが、最終的には「ウォーレン、これでは通用しない」と言われることになるでしょう。
私が注力している一つの点は、「見てください、私のフレームワークには数学を一切使わない非常に重要な部分があります。それは次の三つの質問を含み、これに答えなければモデルを構築できない」という点です。たとえモデルを構築しなくても、問題を解決したいとするなら、次の三つの質問には答えるべきです。すなわち、あなたの指標は何か、どのような決定を下すのか、どのような不確実性が存在するのか、ということです。
ここでの表現は平易な英語です。つまり、数学を使わずに、しかしもし数学モデルを構築したいのなら、必ずこれらの質問への答えが必要になるのです。そこで私は、ビジネスコミュニティに行って指標について尋ねると、誰もが指標をよく知っており、山のような指標リストを持っているのに対し、次に決定について尋ねると、「あなたが行う決定のリストが載った小さな赤い本はありますか?」と聞くと、皆無表情で見返されるのです。
この講演の後、ジョアネス、私はRutgersの他の教員と共有するための一連の考察とメモをまとめ始めました。それは公開編集可能なGoogle Docsの文書で、私がさまざまなカテゴリーを展開していくのを見ることになるでしょう。私は決定に関するセクションを書き始めたばかりで、あなたにも送るつもりです。なぜなら、あなたも楽しめると思うからです。これは本のためのものではなく、ただの雑談です。つまり、私が教師たちに指示する方法であって、教授たち自身が「おお、これは良いアイデアだ。使ってみよう」と判断しなければ、そのアイデアはクラスに入ってこないのです。私は、学生たちが何をしているのかという彼ら自身の知識を信頼しなければなりません。オペレーション分析というコースがあり、そこで在庫問題を扱っています。そこで何が教えられているかはご想像にお任せしますが、非常に基本的なプレゼンテーションで、「すみません、せめてスプレッドシートを使って非常に基本的な在庫問題をシミュレーションする方法くらいは教えたらどうでしょう?」と言いたくなるのです。
だから、Googleドキュメントへのリンクを送るね。コンパイルしたいと思っていることの一つがあって、まだやっていない、まだ考え始めたところなんだけど、サプライチェーンマネジメントだけにキャリアを捧げたわけじゃなく、もっと幅広い問題に取り組んできたからね。決定事項のリストを作りたいんだ。これは些細なことにはならない。決定事項は多様な種類とカテゴリーがあり、すべてが在庫に関するものではない。金融や情報に関する決定もあるし、結局、スプレッドシートにまとめたいし、みんなに「ねえ、私のカテゴリは何?または決定の例は何?」と尋ねるために回したいんだ。なぜなら、「もし何かをより良く運営したいなら、それをサプライチェーンと呼ぶとしても、より良い決定を下さなければならない」というキャッチフレーズを持っていたからだ。誰もそれに反対したことはなく、みんな「そうだよね」と言うんだ。でも、もしより良い決定を下したいなら、あなたの決定事項のリストは何なのか?そうすると、皆は無表情になるんだ。
だから、非常に定量的でないアプローチから始めようと思う。これは「まずはモデル化しなければならない」という感覚に訴えるもので、定量的でないMBAにとっては良い挑戦になるはずだ。なぜなら、答えを出すこと、そしてもちろん不確実性について、サプライチェーンの不確実性の源を特定することでキャリアを築いてきた人々もいるが、私は特に「決定事項」についての部分が大好きだからだ。我々は自分たちがどの決定を下しているのか、皆が把握すべきではないだろうか?ビジネスでは、「それは他人の問題だから、彼がどうやっているかを評価すればいい」と考えがちだ。つまり、ビジネスは完全に指標の言語で語られる。しかし、どこかに決定事項が記された小さな赤い本があってもよいのではないか?
Joannes Vermorel: ええ、全く同感です。そして、決定は非常に難しいものです。大企業は決定や意思決定プロセスをワークフローやその他のプロセスの下に埋もれさせがちです。実際、実際の決定を見ることさえなく、適用されているルール自体が意思決定プロセスとなっているため、人々はもはやその存在に気づかず、ただ会社を舵取りしているだけなのです。それはたとえ悪い方針であっても存在し、ビジネスを導き、実際に1日に何千もの決定を下している可能性があるのに、誰もそれに気づきません。一度しばらく運用されると、そのプロセスは指令すら持たなくなり、誰も責任を持たない。ただ建物に新鮮な空気が流れているかのように、ただ起こるだけで、人々はその理由を正確には理解していないのです。
私はあなたの決定に関する考え方に大いに同意します。決定が難しい理由は、人々が決定に対して誤った認識を持っているからです。彼らは決定を、会議があり、緊張感があり、上司がいて、議論が繰り広げられ、上司が最終判断を下すものだと考えています。それは一種の決定に過ぎませんが、もっと日常的でありながら、はるかに大きな影響を及ぼす決定も存在するのです。あまりにも日常的すぎて気づかれなくなると、それは非常に興味深いものになります。
Warren Powell: なぜなら、あなたが言ったように、彼らはすでに方針を決めているからです。つまり、方針が固定されると、それはもはや決定ではなくなるのです。実際、決定というのは、決定そのものではなく、どの方針にするかということなのです。
さて、もう一つの洞察を提供させてください。ご存知のように、私は複雑な方針とシンプルな方針について語ります。私の大著でほぼ間違いなく使っている一節に、「シンプルさの代償は調整可能なパラメータである」というものがあります。ほとんどすべてのシンプルな方針、たとえばSS方針などは調整可能なパラメータを持っており、その調整は難しいのです。調整は普遍的なタイプの決定の一つであり、アクティブラーニングの問題でもあります。
私は6月にラトガースで開催されるサプライチェーン・アナリティクスの会議ワークショップで講演する予定で、その中で、どの分野においても絶対に理解されなければならない、一つのテーマに関して丸ごとのセクションを設けています。それは、学習と呼ばれる一連の意思決定問題の一種です。
それは様々な呼び名で呼ばれます。知的な試行錯誤、確率的探索、またはマルチアームバンディットと呼ばれることもありますが、いずれも学習の問題です。物理的なものは何も含まれていません。物理的な要素が絡むと事態は複雑になりますが、物理的でない場合は単に学習の問題に過ぎないのです。
これを試してみて、うまくいったかいかなかったかを確かめ、次に別のものを試す。それが一連の意思決定であり、一度の決定から次へ持ち越すのは、学んだことと、何が最も効果的かという信念だけなのです。
順次学習は、統計学が様々なスタイルで教えられるように、単一のコースだけでなく、学部レベル全体で教えられるべきです。アクティブラーニングは、英語専攻以外の全ての人に教えられるべきです。
生の人文学の学生でない限り、どの分野においても何らかの形で知的な試行錯誤を行わなければならない分野はあるはずです。これは根本的に人間的なプロセスであり、簡単なツールも存在するため、人々が実際に動き出せるのです。
UCB方針と呼ばれる基本的な方針があり、それは1分で教えることができます。つまり、「見てください、あなたには離散的な選択肢があり、それぞれがどれくらい優れているか、しかしその不確実性もここにある」と説明するのです。
また、単純な演習として、もしあなたが単に各選択肢の良さに基づいて判断するだけなら、それは著しく最適ではない可能性があるというものがあります。もっと高みを目指し、何かがどれほど良くなり得るかを狙うべきなのです。これは1分で教えられる洞察ですが、そこにはさらに豊かな微妙な点があり、本当に教えられるべき内容です。
Joannes Vermorel: 全く同感です。これは非常に面白いことで、機械学習の観点から見ると、Lokadは主に予測に特化した機械学習を行っていたのです。
一般的な状況としては、調整可能なパラメータを持つこれら単純な方針は、実際には一度も調整されることがないというものです。会社のデータセットに実際に手をつけると、物事は複雑になりますが、Lokadでは最終的にそのデータセットを入手できるのです。
学習アルゴリズムを適用すると、会社が信じられないほど堅固な自動操縦システムで長年運営されていたため、何十億ドルやユーロにも及ぶ履歴があっても、学ぶべきことはほとんどないと気づくのです。同じことを何度も繰り返し、全く変化がないからです。
私たちが直面する課題の一つは、学習を行う際、探索を開始して少しのノイズを加えなければならないという点です。このノイズは、あくまで学習のために存在するのです。
そのノイズが高価になり過ぎないように注意しなければなりませんが、最適とされるものから逸脱するという考え方は、本当に最適なのかさえも分からず、確かにそれがデフォルト、現状維持、慣行なのです。
普段の慣行から逸脱して、通常とは異なる状況下での風景を収集しようと、ランダムに探索を行うというのは、とても不可解なことです。
MBAなどに進学して、この「小さな逸脱」を理解できる人は非常に少ないのです。大企業であれば、たとえほんの少しの探索でも、その規模の大きさから時間をかけて多くの情報をもたらすでしょう。
製造業では、逸脱は悪いことです。できるだけ厳格かつ一貫していることが求められます。しかし、アクティブラーニングにおいては、サプライチェーンの世界でそれを行い、あまりにも厳格で変わらない方針に固執すると、ほとんど何も学ぶことができなくなってしまいます。
これは非常に奇妙な概念です。アクティブラーニングという考え方、すなわち偶発的な行動ではなく、学習を目的として戦略的に逸脱を選び抜くという考え方に触れることが、極めて重要なのです。
Warren Powell: あなたがたった今述べた洞察は非常に根本的で重要なものであり、分析分野に限らず、あらゆる分野で教えられるべきものです。
学生のレベルに応じて、上級の分析レベルでも基礎レベルでも教えることができます。なぜこれが教えられていないのか、私には理解できません。
私は今、プリンストン向けの記事を書いているところで、「見てください、プリンストンの40年の歴史の中で、教えていないコースは何か」という点を指摘しようとしています。大学の約半数は、何らかの形で試行錯誤を行う機会がある学科に所属しているのです。
後はさらに数時間にわたって話すことができます。
Conor Doherty: 話の輪に戻って、一つの話題を締めくくろうと思います。恐縮ながら補足すると、サプライチェーンの学生が学ぶワークショップについて話す際に、あなたが言及したものは実際に弊社のウェブサイトで公開されているのです。
サプライチェーンの問題に対するコーディング方法を学ぶために、弊社のウェブサイト docs.lokad.com で完全無料で利用できるリソースがあります。これらは、あなたが話している意思決定ツリーを模倣するために、弊社の サプライチェーン-サイエンティスト によって設計されたガイド付き演習です。
パフォーマンス評価やサプライヤー分析を行いたい場合、Excelのざっくりとした近似ではなく、これらの問題に特化して設計されたコードのスニペットがすべて確認できる無料のガイド付きチュートリアルも用意しています。
Warren Powell: Lokadには独自のプログラミング言語があると知っています。だから非常に興味深かったです。あなたが提供しているリソースが大好きです。我々は輸送業向けに同様の取り組みをしようとしていますが、輸送業は全く異なるビジネスなのです。
我々は非常に教育的な内容を提供しようとしています。決してそのようなものを試みようとはしません。なぜなら、まず我々にはそのようなシンプルなビットコードがなく、トラック輸送業界内にもそのような人物は存在しないからです。
トラック輸送業界の面白い点の一つは、競争相手があまりいないことです。アメリカにおけるトラック輸送業界の規模は年間約8000億ドルですが、それは大きな市場であっても、サプライチェーン全体から見ればごく一部に過ぎません。
サプライチェーンは真の大海ですが、トラック輸送は海のようなものに過ぎません。しかし、私はあなたのリソースをラトガース大学の学部に紹介しようと思います。非常に興味深い可能性があると考えるからです。
私は、これらがビジネス学生であるため、彼らにしっかり学んでもらう必要があるという現実に対処しなければなりません。また、彼らは産業工学科も有しており、そちらはより工学的なレベルになるだろうと感じています。
実際、私はその3つの質問に答える最初のステップが非常に困難であるため、両学科は協力すべきだと考えています。本当に自分が何について話しているのかを理解していなければならないのです。ですから、その質問に答えるためには、優秀で賢明な経営コンサルティングのような思考が必要となるのです。
一度その質問に答えたら、次はそれらを分析に変換し、コンピュータを活用できる別のスキルセットが必要となります。だからラトガースでは、産業工学の人々とはよく知り合いですが、あまり馴染みのないのはサプライチェーンマネジメント学科です。彼らは私の言うことに好意的なようで、両者をまとめる提案をしようと考えています。
Conor Doherty: そろそろ終わりにしたいと思いますし、私の質問はこれで尽きました。しかし、Lokadでは最後の発言権をゲストに譲るのが習わしです。だからWarren、行動を促す呼びかけや恥知らずな宣伝で締めくくってください。ここではそれを大歓迎します。
Joannes Vermorel: 明確な行動呼びかけとして、本を購入することです。それは非常に堅実で良い本です。
Warren Powell: 私は、人々には大著から始めるのではなく、無料でダウンロードできる本から始めることをお勧めします。
Tinyurl.com/SDAmodeling、これが学部向けに私が書いた本です。タイトルは Sequential Decision Analytics and Modeling です。出版社と協力しており、出版社からは何も支払われませんが、PDF版を無料で公開する許可を得ています。
これがその本です。例を通して教えるスタイルを採用しています。つまり、第1章でユニバーサルフレームワークや在庫の例が示される以外は、第7章を除く各章は、すべて同じスタイルで書かれ、モデリングに重点を置いた異なる例が紹介されています。
つまり、私には5つの要素があります:State, decision, information, transition, objective。常に物語、すなわち平易な英語の物語から始め、次にこの5つの要素を提示します。その後、不確実性のモデリングについて少し触れ、そして決定を下すための一つの方法について述べるのです。
第7章に到達する頃には、4種類の方針すべての例を示し終えています。そこで、第7章では、一旦立ち止まり、これまでに行ったことを振り返ろうと提案します。残りの章、すなわち8章から14章は、ビールゲームを含む、より高度な例に過ぎません。
ビールゲームは、私にマルチエージェント問題に取り組む機会を与えてくれます。私の大著の中でのお気に入りの章の一つは、マルチエージェントに関する最終章です。私はその章を書き、「もし今日からキャリアを再スタートするなら、マルチエージェントは本当に楽しいものになるだろう」と述べました。
そしてもちろん、サプライチェーンの世界では、すべてがマルチエージェントです。まるで、1つのエージェントしか存在しないかのように問題が定義されるのです。例えば、私のトラック輸送の仕事では、異なるマネージャーがいても、トラック運送会社全体をほぼ1つのエージェントとして扱っています。
しかしサプライチェーンではそれは不可能です。うまくいかないのです。すべての相互に作用するコンポーネントをモデリングしなければならず、その結果、何をモデリングしているのか、分からなくなるほど複雑になるのです。つまり、在庫の注文だけではなく、情報の組織化をもモデリングしているのです。
これは非常に豊かな分野です。70年分の教科書を書き継いできた結果、我々の本は本当に問題解決に必要な内容から大幅に遅れているように思えてなりません。少し驚いています。これは素晴らしい機会であり、もう少し若ければよかったのにと思うこともあります。
ですから、このTVシリーズをやっているのは素晴らしいことです。私はこれを確実に宣伝するつもりです。このリンクを回すのはもちろんですが、あなたの学問的なスタイルが大好きなので、皆さんにあなたのウェブサイトも紹介したいと思います。
Optimal Dynamicsは素晴らしい会社です。トラック運送業者に特化しているため、あまり宣伝する余地はありませんが、Lokadに対しては恥知らずな宣伝をさせていただきます。あなたのスタイルが好きです。あなた方について話すと、それは非常に学問的な視点を持っていることを示しているからです。
あなたが情報を共有するのが好きなところが大好きです。学者は情報を共有するのが好きなものです。もちろん、利益を上げたいという気持ちもありますが、それでも自分たちのアイデアを共有し、その成果を誇りに思わずにはいられないのです。私はあなたのウェブサイトを注意深く見て、多くのことを学び、あなたのスタイルを吸収しているので、その点に非常に感謝しています。
Conor Doherty: どうもありがとうございました。他に質問はありません。Joannes、あなたの時間に心から感謝しますし、Warren、あなたの時間にも大変感謝しています。そして皆さん、ご視聴ありがとうございました。次回お会いしましょう。