00:00:00 インタビューの紹介
00:00:42 Meinolf Sellman氏の経歴とInsideOptの意思決定
00:03:47 最適化における混乱と過度の楽観主義
00:06:18 Vermorel氏の確率的最適化の発見とその影響
00:08:10 Eコマースの受注処理と供給チェーンの予測
00:09:56 「予測してから最適化」手法とその結果
00:11:41 運用成果の改善とビジネスコスト
00:14:08 供給チェーンにおける予測不可能性と混沌
00:16:16 予測の魅力と合理的な意思決定
00:18:43 合理的な意思決定とオーバーブッキングのゲーム
00:21:55 スーパーマーケットの製品例と供給可能性
00:24:27 確率的最適化と季節ごとの販売変動
00:28:53 価格変動の影響と結合後部分布
00:30:39 問題解決のためのヒューリスティックと複雑性への対処
00:33:10 生鮮品の課題と後部分布
00:36:01 推論の困難さと解決策の認識創出
00:38:40 コーヒーロースタリーの問題と生産計画
00:42:20 ビジネスモデル化と複雑な変数の現実
00:45:34 最適化において無視された懸念と万能解の追求
00:49:00 CEOの助言とビジネスプロセスの理解
00:51:58 倉庫容量とサプライヤー配送の不確実性
00:54:38 サービスレベルの認識とブリーフィング演習
00:57:33 航空会社の財務損失と技術採用
01:00:10 AIベースの検索の利点とハードウェアの互換性
01:03:05 最適化における凸性と証明を超える有用性
01:06:06 機械学習と最適化技法の融合
01:09:34 実行時の特徴と探索範囲の拡大
01:12:22 微調整と倉庫運用のリスク
01:16:09 良い妥協点の発見と不確実性に対する保険
01:19:11 確率的最適化による予想利益の上昇
01:22:23 航空宇宙産業の例
01:24:30 良い意思決定の受容とダメージコントロール
01:25:19 供給チェーンの効率性
01:26:22 クライアントのフィードバックと技術の重要性
01:26:56 インタビューの終了
ゲストについて
Dr. Meinolf SellmannはInsideOptの創設者兼CTOであり、InsideOptは米国を拠点とするスタートアップ企業で、意思決定を不確実性の下で自動化するための汎用ソフトウェアを開発しています。彼はShopifyのネットワーク最適化部門の元ディレクター、General Electricのグローバルリサーチセンターにおける機械学習および知識表現研究所のラボディレクター、IBMリサーチにおけるコグニティブコンピューティングのシニアマネージャー、そしてBrown Universityのコンピュータサイエンス助教授としての経歴を持ちます。Meinolfは、ECBの一晩で1兆ユーロ以上を処理する決済システムなどのシステム設計を手掛け、国際会議やジャーナルで80以上の記事を発表し、6件の特許を所有し、国際的なプログラミングコンペティションで22以上の最優秀賞を受賞しています.
要約
最近のLokadTVのインタビューで、Conor Doherty、Joannes Vermorel、およびゲストのMeinolf Sellmannが、供給チェーン管理における確率的最適化の役割について議論しました。彼らは、意思決定プロセスにおいて変動性と不確実性を考慮する重要性を強調しました。従来の決定論的手法は実際のシナリオではしばしば不十分であり、過度に楽観的な最適化計画につながります。Sellmann氏とVermorel氏はともに「予測してから最適化」手法を批判し、企業は最適化の際に予測の変動性を考慮することでより良い成果が得られると提案しました。彼らは、実行可能な計画と効果を測定可能な最適化モデルの必要性を強調しました.
拡張要約
Lokadのコミュニケーション責任者であるConor Dohertyが主催した最近のインタビューで、InsideOptのCTOであるDr. Meinolf SellmannとLokadのCEOであるJoannes Vermorelが、供給チェーン管理における不確実性下での意思決定の複雑さについて議論しました。この会話は、供給チェーンプロセスに内在する変動性と予測不可能性を考慮する手法である確率的最適化の概念を中心に展開されました.
受賞歴のあるコンピューターサイエンティストでありAI研究者であるSellmann氏は、まずIBM、GE、Shopify、そして現在のInsideOptを通じた自身の職業経歴を共有しました。彼は、機械学習が自身の業務にますます組み込まれていること、そして決定論的である従来の最適化手法が実際のシナリオではしばしば不十分であることを強調しました。また、供給チェーン管理において不確実性下での意思決定が必要不可欠な側面であることを強調し、これはInsideOptの焦点となっています.
航空業界を例にとって、Sellmann氏は不確実性下での最適化の課題を説明しました。彼は、最適化計画が紙面上では素晴らしく見えても、予期せぬ事態により実際には失敗することが多いと解説しました。これにより、最適化が過度に楽観的であるという認識に至ります.
Vermorel氏はSellmann氏の見解に同意し、自身が確率的最適化の概念を発見した経験を共有しました。彼は、従来の最適化文献において不確実性の概念がしばしば欠落していることに注目しました。また、将来を制御して不確実性を取り除くというアイデアについても議論し、この概念はほぼ1世紀にわたって魅力的であると述べました。彼は、ソ連が5年前に3000万製品の予測と価格設定を試みたが失敗に終わったことに触れました。それにもかかわらず、このアイデアはトップダウンのアプローチゆえに、学界や特定の種類の経営層に今なお魅力的に映っています.
Sellmann氏は、ある部門が予測を行い、別の部門がその予測を用いて最適化を行うという従来の「予測してから最適化」手法を批判しました。彼は、この手法は予測の変動性を無視しており、予測の変動性を最適化に取り入れることで、企業は大幅により良い運用成果を達成できると主張しました.
Vermorel氏は、航空会社のオーバーブッキングの例を用いて、わずかなずれが急速に大きな問題に発展する非線形性を説明しました。Sellmann氏は、スーパーマーケットが販売するバターや日焼け止めキットの例を用いて、需要の変動性の重要性を示しました。彼は、特に日焼け止めのような季節商品において、適切なタイミングですべての供給が利用可能であることが極めて重要であると主張しました.
この会話では、供給チェーン管理における常識とソフトウェア利用との乖離、全製品の潜在シナリオを予測する重要性、そして生産計画の複雑さにも触れられました。Sellmann氏は、理想的には完璧な精度が望ましいものの、予測には本質的な不確実性が伴うため不可能であると説明しました。その代わりに、次善の策として、予測の誤りのパターンを学び、その情報をより良い意思決定に活用することが重要であると述べました.
結論として、このインタビューは供給チェーン管理における確率的最適化の重要性を浮き彫りにしました。Sellmann氏とVermorel氏は、意思決定の際に予測の変動性と不確実性を考慮する必要性、およびモデルを単純化しすぎないことの重要性を強調しました。彼らは、あらゆる最適化モデルは特定の条件下で何が起こるかのシミュレーションと捉えることができ、計画が実行可能であり、その効果が測定可能であることを保証することが不可欠であると提案しました.
完全な書き起こし
Conor Doherty: お帰りなさい。供給チェーンの本質は不確実性と確率性にあります。今日のゲストであるDr. Meinolf Sellmanは、この点についてよくご存知です。彼は受賞歴のあるコンピューターサイエンティストであり、名誉あるAI研究者、そしてInsideOptのCTOです。本日は、Joannes氏と私とで不確実性下での意思決定について語っていただきます。Meinolf、Lokadへようこそ.
Meinolf Sellman: どうもありがとう、Conor。そして、Joannesさん、お会いできて大変嬉しいです。議論を楽しみにしています.
Conor Doherty: それでは、よろしくお願いします。そしてご参加いただき、誠にありがとうございます。簡単なイントロになってしまったことをお詫びします。私はすぐにゲストに話を移るのが好きですが、その結果、今回お話を伺う方の背景に十分な敬意を払えなかったことになります。ですので、まずはご容赦いただいた上で、あなたの経歴についていくつか補足していただけますか?
Meinolf Sellman: もちろんです。大筋はご理解いただいていると思います。私は本質的に最適化を追求する人間です。それが卒業論文に取り組む原動力となりました。ドイツのシステムはフランスのものと非常に似ています。私の卒業論文は、コンピュータ代数システムのための混合整数計画法ソルバーの構築に関するものでした。つまり、学生時代から、より良い意思決定を導くためにコンピュータをどう活用できるかを探求してきたのです.
私はコーネル大学でポスドクを務め、ブラウン大学で教授を勤め、次にIBMでシニアマネージャー、GEでテクノロジーディレクター、Shopifyでディレクターを務め、そして現在はInsideOptのCTOを務めています。この経歴を通して、機械学習がますます取り入れられていることがわかるでしょう.
従来の最適化は決定論的です。すべてが完全に把握されている前提で、最適な行動方針を見つけ出そうとします。しかし、実際に現場に触れると、そうでないことに気づかされます。不確実性下での意思決定を可能にするための技術をますます導入する必要があり、これこそがInsideOptにおける我々の情熱の源です.
Conor Doherty: ありがとうございます。再び、あなたはIBM、General Electric、Shopifyといった多くの大手企業でのご経験について述べられました。機密保持契約に抵触しない範囲で、InsideOptにおける現在の予測や意思決定の視点に最も大きな影響を与えた詳細や経験について教えていただけますか?
Meinolf Sellman: 航空業界のような業界を見てください。ここは従来、最適化への投資が非常に高額で、最適化技術において最も早く、また最も多く投資されてきた分野の一つです。そして、航空会社の運営がどれだけ面白いかを考えてください。彼らは素晴らしい計画、つまり乗務員の配置計画を得ます。どのパイロットをどの飛行機に配置するか、どの客室乗務員をどの飛行機に配置するか、どの飛行機をどの路線に使用するかを決定しなければなりません。また、どの路線を提供するか、直行便をどのようにルートに組み込むか、そして収益管理を行う必要があります。これらすべての運用上の決定において最適化が利用され、紙面上ではそれらの計画は素晴らしく見えます。通常、それらは証明可能な最適性が伴わなくても、何らかの性能保証があるとされています.
しかし、実際に航空会社を運営すれば、その日には大損する可能性があることがわかります。天候が予想外だったり、フランスの航空管制官が十分な報酬を得られていなかったり、ゲートが混雑していたり、機材の故障など、さまざまな問題が発生します。もし飛行機に乗ったことがあれば、航空会社のモットーが「今日問題があれば、今日問題がある。明日が問題にならないようにしよう」といったものであるのを知っているでしょう。彼らはあなたが今日必要な場所に到達することを気にせず、明日の計画に戻ることを望むのです。なぜなら、もし明日まで悪い状況が続けば、明日も同様に大変な事態になるからです.
これが示しているのは、最適化がすべてが計画通りに進むという過度な楽観主義に陥っているということです。そして、それこそが我々が変えたい点なのです.
Conor Doherty: ありがとう。Joannes、あなたの見解はどうですか?
Joannes Vermorel: 全くその通りです。私にとって非常に興味深かったのは、確率的最適化という概念を比較的遅れて知ったことです。20代の頃は、通常の最適化、例えば凸最適化に非常に精通しており、この種の内容についての書籍を丸ごと読んだものです。線形代数から始まり、シンプレックス法などが教えられるというクラシックな最適化は、高校ではなく、その後に教えられるのです.
そして、学生時代に数年間学んだ運用研究という伝統的な名称のこの分野では、工場、飛行機、資産、機械、人材などのさまざまな割り当てに関する事例が何百ページも論じられるにも関わらず、決して部屋に潜む「失敗しうる要素」、つまり状況のモデル化が誤っている可能性や、その結果として最適化されたものが非常に脆弱になるという点については議論されませんでした.
私がラビットホールの奥深さに気づいたのは、Nassim Nicholas Talebの『Antifragile』を読んだときでした。それはかなり前のことですが、そのとき、非常に普遍的であるにもかかわらず欠落しているパラダイムが存在することに気づきました。そして、この種の最適化に非常に興味を持ち始めたのです。私にとって最も驚くべきことは、不確実性や損失関数を完全には把握できないという考え方が、文字通り欠落した次元として、全くの文献において見過ごされている点です. 欠落した次元が存在し、見えないものは一層見えにくいのです。これは間違っているのではなく、むしろ非常に広範で古い研究分野において、全く別の次元が欠如しているのです. Conor Doherty: 実は、その件について続けさせていただくと、見えないパラダイムや全く存在しないものについて触れた際の発言が、私たちが実際にMeinolfに連絡を取った理由の一つと非常によく対比されます。あなたが言う主流または従来の計画、予測、在庫管理ポリシーに対する視点は、いわゆる「まず予測を行い、その後で意思決定する」というアプローチに基づいており、これはこの会議にいる皆さんが支持するであろう考え方とはパラダイム的に大きく異なっています。ではまず、Meinolfさん、従来のアプローチと、あなたとJoannesさんが見る欠如しているパラダイムの違いについて概説していただけますか?
Meinolf Sellman: はい、つまり、想像できるように、もしあなたがフルフィルメントシステムを運営しているなら、あなたはEコマースストアを持ち、人々が購入することを期待する製品をwarehouseのどこかに配置しなければなりません。そこで直面する根本的な問題は、どこでどのくらいの量が購入されるのか分からないという点です。つまり、何らかの期待値を設定する必要があるのです。より一般的には予測または推定を行う必要があり、これを担当するのが通常、機械学習部門です。彼らは「ここの値が欠損している」といったあらゆる情報を把握しています。たとえば、ある時点でstockoutsがあった場合、在庫切れのために実際にどのくらい売れたかが分からないのです。つまり、もし在庫がもっとあればどれほど販売できたか、実際には分からないということです。彼らは外れ値、欠損値、ノイズ、そしてその他不確実な要素を扱いながら、予測や推定を行います。
そして次に、第二の部門があります。これは、Joannesさんが非常に的確に指摘したように、一般的に不確実性を扱わない部門です。彼らは「おお、素晴らしい予測だ。それをデルファイの神託が与えたかのように、俺の最適化モデルに投入しよう」と言います。まるで未来が完全に把握されているかのように。つまり、そこにある数字をそのまま扱い、「来週の日焼け止めの需要は20本だ。だから棚に並べよう」とし、存在する変動性をまったく考慮しません。
「予測してから最適化する」というこの手法は、異なるスキルセットを持つ二つの部門が存在するという事実から部分的に生じています。「ああ、今度は機械学習者が最適化について全てを学ばなければならない」あるいは「最適化担当者が機械学習をもっと学ぶ必要がある」と言うのは非常に困難です。だからこそ、企業はこの分業を避けるのです。これが、この分離が存在する一つの理由です。
しかしその問題は、不確実性をある部門から別の部門に引き渡しても消えないという点にあります。つまり、ただ無視してしまうと、実際には多くの利益を逸してしまうのです。これが、多くの人々がこの点を深く掘り下げない第二の理由です。機械学習者は自分たちの仕事をやり遂げたと感じさせるのです。モデルを構築した後に、例えば交差検証と呼ばれる方法で機械をテストします。つまり、既知のデータに対して「もしこの一部のデータしかなかったとして、残りの部分のデータで予測を行ったらどれほどの精度になるか?」と検証するのです。このようにして、機械学習部門から非常に良い予測が得られると、自分たちを納得させてしまうのです。
そして彼らはそのようにして結果を出し、あなたも「おお、これは素晴らしい。予測がうまくいっている」と考えます。しかし最適化担当者は戻ってきて、「性能の上限がある、もしくはおそらく最適な解がここにある」と主張するのです。だから、もし会社を経営しているのであれば、これらの部門がより良く協力することで改善の余地があるとは期待できないでしょう。しかし実際には、最適化を行う際に予測の変動性を考慮に入れることで、15%、20%、25%もの運用成果の向上が十分に可能なのです。しかし多くの人はそれに気づいていません。
つまり、一部は「予測してから最適化する」というアプローチが根本的な構造に起因しており、スキルを混合することに抵抗があるのです。もう一方は、これらをより密接に組み合わせることで実際にどれほどの利益を逃しているのかが見えなくなる点にあります。「おお、素晴らしい予測、証明された最適性、最高だ。残りはただのビジネスコストだ」と聞こえるかもしれませんが、実際はそうではありません。これこそが、Joannesさんと私が本日皆さんに伝えたかったことです。これらは単なるビジネスのコストではないのです。
Conor Doherty: ところでJoannesさん、それがビジネスのコストなのでしょうか? Meinolfの言うことは正しいのでしょうか?
Joannes Vermorel: はい、そしてもう一つの側面もあると思います。未来を支配し、不確実性を完全に取り除くという考えは、ほぼ一世紀にわたって非常に魅力的なアイデアでした。ソビエト連邦は崩壊しましたが、5カ年計画を立て、すべてを統制するという考えはソビエト連邦とともに消えたわけではありません。ある時、彼らは約3000万製品の価格設定と5年前の予測をしなければならなかったと思いますが、実務的には完全な失敗でした。
この考えの魅力はソビエト連邦とともに消え去らなかったのです。特に学界では依然として魅力的です。未来を自分の予測が真実であるかのように構築し、その後はただ統制すればよいという考え方は、多くの共感を呼びました。また、非常にトップダウンなアプローチであるため、特定のタイプの経営層にも響いたのです。
そのシンプルさが大きな魅力とされています。もちろん、これは誤謬です。なぜなら、あなたはすべてを支配しているわけではなく、顧客はそれぞれ独自のアジェンダを持ち、他の決定をすることもあるからです。サプライヤーは最善を尽くそうとしますが、その最善さえ十分でないこともあります。さらに、ショックが発生します。時には戦争のような非常に劇的な事態や、ある時はスエズ運河で船が立ち往生するといった馬鹿げた出来事によって、すべての輸入が遅延することさえあります。原因は何であれ、未来は常に混沌としているのです。
このような混沌状態を合理的に説明するのは非常に難しいです。完璧な未来について論じる方が簡単です。これが、Lokadの初期に受け取っていたフィードバックでした。「Vermorelさん、正確な予測をお願いします。誤差は3%で収め、それで終わりにしてください。」と。当然、もしそれが実現できたなら、予測と最適化を組み合わせる意味自体がなくなっていたでしょう。
しかし、ここ15年が経過しました。たとえLokadが予測面で非常に優れていたとしても、ほとんどの企業にとって3%の不正確さはあまりにも馬鹿げています。私たちはその目標に全く及んでおらず、SKUレベルでは到底その精度には達しないでしょう。
Meinolf Sellmann: はい、産業界の実践をソビエト連邦と比較するのは厳しい表現かもしれませんが、先日、あるMIPソルバーの広告で「弊社のMIPソルバーを使用して、この航空会社は5カ年計画を最適化しました」と言っているのを見ました。そして、フルシチョフも非常に誇りに思っただろうというコメントを残しました。実際、「未来を予測できる、AIは素晴らしい、そしてその上で最適化を行えば完璧だ」という考え方には大きな魅力があるのです。
Joannes Vermorel: このイデオロギーの魅力は非常に強いと思います。人々は「いや、私は市場経済支持派で、共産主義者ではない」として却下するかもしれません。しかし、そうした人々は、このイデオロギーがなぜこれほどまでに魅力的であったのかを見過ごしているのです。自分の未来を完全にコントロールできるという考えは非常に魅力的です。トップダウンで科学的な方法を適用し、大きな計画のもとで合理的に物事を説明できるという考え方は、上から下まで徹底的に合理的です。書面上は、現代的な経営のように見えます。しかし、実際には現代の経営ではなく、むしろ現代の誤った経営(mismanagement)であることが判明しますが、それでもその魅力と合理性の外見は感じられるのです。
しかし、それには医原性の副作用と呼ばれる、意図しないが根本的に計画を損ねる側面が伴います。結果的に、いわゆる最適な意思決定が、実は極めて脆弱であり、わずかな逸脱が思いがけない形で大きな問題を引き起こすことになるのです。
Meinolf Sellmann: これはおそらく最も一般的な誤謬です。人々は「未来を完璧に予測できなくても、たとえ多少の逸脱があっても、意思決定は大筋で同じになるだろう」と考えます。しかし、実際はそうではありません。このような連続的な変化は、実際には存在しないのです。だからこそ、予測を立て、その上で意思決定を行うというのは、一見合理的に思えても実際には最も非合理的な行動なのです。必要な全ての情報にアクセスできていないと考えるべきなのです。
実際、合理的なアプローチとは、Lokadが行っていること、つまりinsideOpt向けにソフトウェアを構築する際の考え方で、意思決定を行う際に予測における変動性を考慮に入れるというものです。
Joannes Vermorel: はい、そして観客の皆さんへの一例として。航空会社のオーバーブッキングのゲームを考えてみてください。搭乗しない乗客が何人かいるため、飛行機の座席数以上のチケットを販売することは可能です。しかし問題は、ある時点で本当に座席が不足してしまうことです。例えば、座席が200しかないのに、20人が現れないと考えて220枚を売ったところ、実際には205人が現れた場合、どうしても5人は飛行機に乗ることができなくなります。もちろん、彼らに補償を与えたり様々な対応をすることは可能ですが、結局のところ、購入したフライトで5人がひどいサービスを受けることになるのです。
つまり、これは非常に非線形な問題です。最初の数席については、確かにオーバーブッキングが可能ですが、その後には限界があり、その限界に達すると、特に何か大事な予定がある人々に対しては打撃が甚大になります。決して、ただ少しずつ同じ状況が続くという線形的な問題ではありません。いわば切れ目があり、そこから急激に実質的な問題へと変わるのです。
Conor Doherty: それでは、続けていくつかの考えをまとめながら、次のポイントに移りましょう。Joannesさんのオーバーブッキングの例、そしてMeinolfさんの需要測定の例、たとえば「先月、スキンクリームを20個売った」といった話です。確かに売ったとしても、在庫切れがあったため実際の需要がどうであったのかは分からなかったのです。
この問題を合理的に考えると、自然と確率的最適化、すなわち不確実性を受け入れる方法へと導かれます。完璧な答えは存在しないのです。そして、あなたのYouTube講義で「今すぐ大雑把に解いてしまおう。なぜなら、完璧な解を遅れて得るより、今ある良い解の方が価値がある」というようなフレーズがあると思います。
Meinolf Sellmann: はい、また別の観点として、良い答えを見つけるのに必要な時間が、答えの質自体に影響を与えるという点もあります。確かにその必要性はあります。しかし本題に戻りますが、なぜ変動性が重要なのでしょうか? 一例で説明しましょう。例えば、パリでスーパーマーケットを運営しており、棚にバターや日焼け止めキットなど異なる製品を陳列しているとします。これらは全く異なる製品です。もし今後30日間でそのキットを300個売れるという予測がある場合、1日あたり10個だと考えるべきでしょうか? いいえ。バターは需要が一定で、予測は常に平均値付近で、多少の揺らぎしかありません。しかし、日焼け止めの場合、現在は天気が悪く、悪く、悪い状態が続き、そしてある週末に急に晴天になり、皆が夏全体のために日焼け止めを準備・購入するという状況になるのです。その時にスーパーマーケットに十分な供給がなければ、完全にチャンスを逃してしまいます。今日10個しか在庫がなくても、明日残りの290個を補えるわけではありません。つまり、月曜日以降はそれ以上販売できなくなるのです。
これが違いなのです。期待値自体は同じでも、変動性が期待値の周りに密集しているか、あるいは全く大きな乖離があって、ほとんどゼロか非常に大きな値になるかで大きな違いがあります。そして、意思決定の際にその点を考慮に入れなければ、大きな利益を逸してしまうのです。これがまさに、私たちがここで語っている内容の例示になると思います。期待値は期待値であって、実際にどのシナリオを検討すべきかを知る必要があるのです。それが確率的最適化の役割であり、さまざまな潜在的な未来を見据えた上で、今日の妥協案となる意思決定を導き出すのです。
つまり、今日決定しなければならない事項、未来がどうなるかを待つ余裕のない決定に対して、未来が明らかになった後にうまく対応できるよう、良いスタート地点を見出すのです。これが確率的最適化であり、私の考えでは、これこそが人間が日々実践していることです。なぜなら、我々はコンピューターを用いると、せっかくそのプロセスを行うのを忘れてしまうからです。
Conor Doherty: ありがとう、Meinolf。それではJoannesさん、これについてあなたの確率的最適化に関する理解とはどのように一致しますか?
Joannes Vermorel: はい、これは先ほどMeinolfが述べたように、日焼け止めには非常に季節的なパターンがある一方で、そのシーズンの始まりが年々天候によって変動するという事例です。これは非常に典型的な例であり、このカテゴリに属する製品は非常に多く存在します。もう一つ、似たような小売の例を挙げるなら、DIY(Do It Yourself)ストアがあります。そこで人々は、例えば照明スイッチのような製品を、アパート内に異なる見た目のものが複数あるのを避けるために、4個や8個とまとめて購入します。購入の際、同じ製品を4個または8個、一度に揃えたいと望むのです。
棚に3つあれば在庫切れにならないと考えるのは間違いです。なぜなら、実際には、店に入った客が「4つ欲しい」と言った場合、棚にあるのは3つしかなく、同じものを4つ取り揃えている別の店に行ってしまうからです。そのため、需要のばらつき(lumpiness)は非常に重要であり、長期間にわたって平均化されたデータよりも、むしろ不規則性の細かな構造を検討する必要があるのです.
そして実際、これは店を運営する人が本能的に理解していることです。照明スイッチは、一つだけでは役に立たず、同じものが一箱揃っているか、全く置かない方がいいのです。なぜなら、人々は単品の商品を見ただけでは手に取らないからです。ハンマーの単品は大丈夫ですが、照明スイッチはそうはいきません。そして、これはまるで高度な数学を扱っているかのようなものではありません。
あなたの言う通りだと思います。私も同じ現象を目の当たりにしてきました。特にサプライチェーンの現場では、人々は直感でそれを理解しており、数学的な計算は必要としません。しかし、エンタープライズソフトウェアの領域に足を踏み入れると、移動平均や少しの指数平滑化があれば問題をカバーできると主張されます。そして「移動平均で足りなければ、さらにABCクラスがある」と言われるのです。しかし、私はそれでは解決にならないと思っています。確かに、ソフトウェアの世界に入ると、人々は常識を捨て、「機械に任せればいい」「あまりにも複雑だ」と考えてしまいます。だからこそ、指数平滑化を用いるときは、その「指数」という言葉が示す通り、科学的で先進的でなければならないとされるのです。
Meinolf Sellmann: 私たちは問題を分解することを好みます。だから、あなたが言及した「lumpiness」という用語が好きなのです。これは技術的な専門用語ではなく、親しみやすい表現です。しかし、これは積の性質にも関わります。例えば、スーパーマーケットを経営していて牛乳の値段を上げると、急に来店者が減り、常用品が手に入らなくなります。すると、季節商品であるカヤックなども売れなくなってしまいます。つまり、本当に必要なのは、すべての流れについての潜在的なシナリオを予測するための結合事後分布なのです。
Conor Doherty: この説明、特に常用品とその相互関係の描写は、私たちが「バスケット」視点と呼ぶものに非常に似ています。例えば、店に入ってハンマーを買おうとするが、ハンマーがなければそのまま立ち去る、または、複数の商品を一度に買いに行く場合、買い物リストの中に牛乳が欠けていると、すべてを揃えられる別の店に行く、ということです。したがって、牛乳がないことによる影響は、牛乳の売上損失にとどまらず、バターやパン、ジャム、アイスクリーム、ベーコンなどすべてに波及するのです。しかし再び付け加えると、ここでMeinolfに向けた次の質問にもなりますが、人々はヒューリスティクス、つまり経験則を好むということです。問題を分解する際に、ヒューリスティクスを用いるのは理解しやすいルールです。ABCクラスや指数平滑化といった概念はその例であり、確率的最適化はそれよりも複雑なものなのです。そう思いませんか?
Meinolf Sellmann: 正直に言えば、かつては部門ごとにきちんとした問題解決をするためのツールがなかったのです。機械学習と最適化という異なる懸念事項を分離しながら、このような作業をするためにチーム全員を再教育するのは避けたかったわけです。それは、例えば5年前までの話でしょう。しかし、今日の技術をもってすれば、これらのソリューションを構築する人々にとって、それほど複雑な問題ではなくなっているのです。
Conor Doherty: では次の質問ですが、改めてJoannesにもお伺いします。先ほど精度について話しましたが、伝統的に予測の絶対的なベンチマークKPIとされる精度は、確率的最適化においてどのように位置づけられるのでしょうか?それとも、意思決定の観点にシフトするときには、単なる別の経験則として重要性が薄れるのでしょうか?
Meinolf Sellmann: もちろん、もし誰かが次の土曜日の宝くじの番号を教えてくれたら、それは素晴らしいことですが。問題は、予測には本質的な不確実性がつきものであるということです。世界のすべてを知っているわけではなく、何が起こるかを正確に予測することはできません。たとえば、あなたが店舗を経営していて、どの種類の寿司を置くか決めなければならない際、生鮮品など、Joannesが航空会社で座席を過剰販売する例に触れたように、寿司が売れなければ廃棄しなければなりません。つまり、製造、輸送、価格設定、陳列にかかる全てのコストが、売れなければ無駄になってしまうのです。ですから、低マージンであっても、廃棄コストを考えると過剰在庫は避ける必要があるのです。
あなたは、急に40皿の寿司を買いに来る「やった、また寿司が食べられる!」と決めた5人の若いお母さんたちがいるかどうか、知っていますか?そんなことは全く予測できません。不確実性が存在するのです。完璧な予測ができれば素晴らしいのですが、それが不可能である以上、次善の策として、自分の予測がどのように外れるかを学習しようとするのです。これがいわゆる事後分布です。つまり、「さて、これらの寿司皿を置いた場合、ほとんどの日は50皿ほどになるのか、時には48皿、または42皿になるのか、それとも50皿という期待値が、実際には25皿か75皿になるのか」といった具合です。精度は同じで、期待値は50ですが、考慮すべきシナリオと、それに基づいて棚に何を置くかの決定は全く異なるのです。したがって、誤解を招く結果となるのです。100%の精度が得られれば素晴らしいのですが、100%が得られない場合は、次善の策として予測の誤差を評価する必要があるのです。
Joannes Vermorel: その通りです。そして、Meinolfが述べた複雑さやその認識される複雑さについてですが、私の見解では、状況に直面した際、まず解決策から出発してしまうのが本能です。解決策がなければ、問題を構想すること自体が非常に難しいのです。これは非常に奇妙なことです。デカルト的思考では、まず問題を考え、その後で解決策を探るべきですが、実際には、人は(私自身を含め)まず考えられる解決策の集合を持ち、そこから解決可能な問題を構築してしまうのです。通常はその逆なのです。
つまり、まず採用可能な解決策やその集合を思い描き、それに基づいて自分が解決できると考える問題を選ぶのです。解決できないほど素晴らしい問題は山ほどありますが、実際には解決できないものだからです。例えば、空飛ぶ車の実現。反重力エンジンの作り方が分からないので、空飛ぶ車の最適な設計について考える時間は割けない、というわけです。
さて、ここに戻ると、予測の不確実性に取り組み、その不確実性を最適化側で扱う、これが確率的最適化です。技術の進歩に伴い、その要素として、技術的な素材、概念、パラダイムなどが必要になります。これらは本質的には超難解というわけではありませんが、もし最初からそれらが全く存在しない環境にいると、何もないところからそれらを想像するのは非常に困難なのです。基本的には難しくないのですが、とても奇妙なものなのです。
現代では、世界の反対側にいる誰かと電話で話ができることが当たり前になっています。しかし200年前の人にそれを話せば、全くの魔法だと考えるでしょう。あのようなことが可能だという発想自体が信じられなかったのです。現代の人々は簡単にそれを実現できますが、解決策がすでにあるため、問題について考えるのははるかに容易なのです。
というわけで、私が思うに、解決策が得られるまでは問題そのものについて論理的に考えるのは非常に難しいというのが最大の課題です。そして、もしInsideOptのSeekerのような製品の話に持っていくと、不確実性に対処しない最適化ツールしかない場合、あなたが検討できる最適化問題は、本来、ツールの設計上、不確実性を排除した問題に限られてしまうのです。
これが私の銀の弾丸、つまり自分に合った問題が必要だということです。そして、それがこの問題です。つまり、解決策のカテゴリーの存在すら認識されなければ、人々はその種の問題について考えることすらできないのです。非常にメタな話ですが。
Conor Doherty: さて、次の質問ですが、これは意図せずとも非常にうまく繋がっています。第一原理、つまり問題から出発して解決策に至るという考え方について、あなたの講義で「コーヒーロースタリー問題」について触れていました。簡単にその概要を説明していただけますか?この例は非常に生き生きとしていて好ましいものです。問題が何であるかを定義し、どのようにして確率的に、または確率的最適化を用いてその問題を解決するかを説明してください。
Meinolf Sellmann: これは実に古典的な最適化問題で、生産計画と呼ばれています。先ほど触れた、最適化におけるすべての銀の弾丸、つまり混合整数計画法の標準講義を受けたことがあるなら、生産計画の例に出会ったことがあるでしょう。
では、生産計画とは何でしょうか。限られたリソースを用いて作りたい製品を生産し、それぞれの製品を1単位生産するごとに期待利益が得られるのです。しかし、これらの製品は生産能力を共有しています。例えば、複数の製品を製造できる機械や包装ライン、あるいはコーヒーの場合はロースターなどです。時には原材料も共有され、異なる種類のコーヒーで同じ種類の豆が使われることもあります。通常は様々な豆が混ぜ合わされます。
そこで問題となるのは、どの生産能力を使って何をいつ生産するかということです。これは毎日、コーヒーを生産するために行わなければならない作業です。誰かが「ここで原豆をローストし、あそこにあるsiloに保管しよう。すぐには使えないので、包装する前に冷ます必要がある」と指示しなければなりません。
そして、それを再び取り出し、どのsiloから何をいつ取り出して、限られた能力の包装ラインへ移すのかを決定します。ここまでは順調です。
もしコーヒーのローストにかかる正確な時間が分かっていれば、作業はずっと楽になるでしょう。同様に、豆が冷めるまでの正確な時間が分かれば、状況はもっと楽になります。しかし、両方とも推定値に過ぎません。そのため、工場に届く豆の乾燥状態によって、完璧な仕上がりにするためのロースト時間が短くなったり長くなったりするのです。そしてそれがすべてに影響を及ぼします。なぜなら、ロースターを単に放置するわけにはいかないからです。
もし10分以上ローストを行わないと、ロースターは停止させなければならず、再起動には30分かかります。そうすると、ロースターが自動的に停止し、次の30分間にローストを行うのは非常に困難になる、という非線形な状況に直面するのです。
次の商品を早めにローストし始めても問題ないのでは、と考えるかもしれません。しかし、どこに置けばいいのか分かりません。なぜなら、siloが満杯で包装工程が追いつかないからです。つまり、ロースターから出る次の商品用にスペースを作るためには、その生産能力を解放しなければならず、結果としてシステムの別の部分に負荷がかかってしまうのです。
そして、あなたは座って計画を立てなければならなくなるのです。実際、ロースターは単純に、完成しているが未包装の商品をどこに保管すればよいかが分からず、ある時間停止していると分かるのです。それが、そのようなビジネスの運用コストに莫大な負担をかける原因となります。
Joannes Vermorel: これは、単純なモデル化に陥ることへの警告を反映していると思います。ビジネスには非常に多くの詳細が伴い、さらに別の側面も要求されるのです。文献に掲載されるほとんどのモデル、また講義で扱われるほとんどの内容は、整った問題に対して直接的かつそれなりに洗練された解決策を示すものです。
つまり、問題の構造が明快で、大学で教える側としてはすべての変数を2時間も説明したくはないものです。ですから、問題はせいぜい10個の変数、最大3つの方程式で表現され、2時間もかけずに提示できるようになっているのです。
しかし、これは誤解を招くものです。現実は非常に多くの詳細を伴うため、提示された解決策やモデルは実際にはほとんど役に立たないのです。不十分である理由は、あなた自身の状況を正確には把握できないからです。モデル化を試み、何かを発見し、そしてモデルを修正する必要があるのです。
そしてもしかすると、「この問題はモデル化するにはあまりにも複雑すぎる、もう諦めよう」と言うかもしれません。しかし、実際には無視してしまった別の変数を再導入する必要がありました。無視したのは誤りであり、実際に業務に大きな影響を与えるのです。そして、モデル自体は、アカデミアの典型的な視点から見ると、既定のものであり、証明や標準的な形態などが存在します。
そして、混合整数計画法では、既定の形態などを用いてすぐに解ける一連の問題が得られるのです。しかし実際には、実際のサプライチェーンを扱っている場合、問題は常に変化しており、手持ちのツールを適用して学びながら修正を加えていかなければなりません。
そしてふと気づくのは、重要なのはむしろ、より抽象的な何か、すなわち、問題のあるインスタンスから次のインスタンスへ迅速かつ効率的に切り替え続けることができるものが必要だということです。これはさまざまな側面を意味します。計算速度が速く、多種多様な解を表現できる柔軟性が必要です。また、applicative landscapeの他の部分に簡単に接続できることも求められます。
このため、典型的な数学的最適化の文献では触れられない多くの追加的な懸念事項が発生します。書籍の最初から最後まで、「ちなみにこの手法は非常に遅く実用的ではない」や「このアプローチは非常に硬直しているので、モデルのほんの些細な修正でも完全に捨てて再出発しなければならない」といった議論は一切されません。
または、このアプローチはエラーが発生しやすく、理論上はNASAのように非常に優秀なエンジニアと10年という余裕があれば可能かもしれません。しかし実際には、急いでいる場合には全く通用しません。つまり、非常に重要なメタ的な懸念が多数存在するのです。そして、これはまさにSeekerで取り組んでいる事柄や、この種の問題に対するあなた方の考え方に関係していると私は考えています。
Meinolf Sellman: はい。そして、以前話していたように、私たちは常に「万能薬」を探し求めています。ですから、ジョアンネス、あなたの言う通り、ビジネスをモデリングする際—おそらく聴衆が最も関心を持っている点は—「どうすればより良い、具体的な成果を得られるか?」ということなのです。
ある程度、現実をコンピュータ上で近似してシミュレーションすることを強いられるのです。つまり、どの最適化モデルも「これを実行したら何が起こるか?」というシミュレーションと捉えることができ、その結果を計算するのです。そして、その計画が依然として実行可能(すなわち最適化の用語でいう「実行可能解」)であるかを確認するのです。
つまり、副次的な制約はすべて守られているのか? 実行可能かどうか。そして次に、実際にどれほど優れているか、すなわち、実際のKPIを近似するために用いられる目的関数(これが我々の最適化基準です)はいかに良いのか、という点が問題となります。要するに、もし手元にある唯一の道具がハンマーであれば、いつかは窓に釘を打ってカーテンを吊るす羽目になるということです。
そしてそれは非常に非常に悪い考えです。これこそ、MIPの専門家たちが、サプライチェーンや不確実性下の最適化に取り組む際にしていることの一端なのです。彼らは決定論的最適化のために作られたツールを用いていますが、それ自体は確かに素晴らしいものです。しかし、そのツールは、決定論と非決定論(または不確実性という表現が適切でしょう)の両面で近似を強いるのです。なお、非決定論はその文脈では別の意味を持ちます。
すべてを線形化しようとするわけですが、ビジネスにおける多くの関係性は必ずしも線形ではありません。そこで問題は、「それを何とか近似できるか? 非線形関数に区分的な線形関数を当てはめられるか? あるいは、物事を二値化できるか?」という点にあります。
さて、これを聴衆により具体的に実感してもらうために、例えばあなたがビジネスを運営している、または企業のCEOである場合、Lokadに行って「貴社から購入したい」と言えば、彼らが対応してくれるでしょう。しかし、もしその業務を担当する別の会社がある、または自社内にその部署がある場合、より良い業務運営を実現するためには何をすべきでしょうか?
そこで、あなたは「おお、別のアプローチがあり、例えば運用コストが20%も改善されるのは素晴らしい。どうすればそれが可能になるのか?」と興味を持つかもしれません。まず最初に問うべきは、「我々のプロセスは何か? これは予測と最適化のプロセスなのか?」という点です。そして次に、「実際に扱っている現実のシステムをモデル化する際、どんな自由度—つまり、どこで近似を行っているのか?」と問いただす必要があります。
そして、両者の乖離を確認するには、こうすべきです。「見てください、あなたの最適化モデルには目的関数があり、この目的関数によって、ある解を他の解よりも優先するように決めています。これは、実際のKPIを近似するためのものです。では、最適解において、私の期待するKPIは何でしょうか?」と問いかけるのです。
そしてその値を追跡し、実際にシステムで得られている解や結果と比較します。例えば、コスト削減が目的ならば、コストを追跡し、MIPが予測したコストと実際のコストとの差を確認します。利益最大化であれば同様です。要点は、意思決定のために使われたものと、実際に現れた結果との差異を把握することにあります。
その乖離の原因は2つ考えられます。ひとつは、システムをあまりにも制約の厳しいモデル化フレームワークに無理やり当てはめたためで、これは好ましくありません。もうひとつは、不確実性の存在を完全に無視したために生じるものです。もしその差異が5%以上あるならば、ぜひ私たちのどちらかにご相談ください。
Joannes Vermorel: そして、あなたの提案に私も賛同します。その思考プロセスに加え、私は通常このプロセスに入る前に推奨することをひとつ付け加えたいのです。つまり、誤ったツールの問題だけでなく、さらにその前に誤った概念や不適切なアイデアが存在しているという問題に、非常に初期の段階で対処すべきだということです。
例を挙げると、古典的な最適化文献に見られる実行可能性の概念です。人々は「実行可能な解か、実行不可能な解か」と言います。しかし、具体的な例を見てみると、それは本当に白か黒か、はっきりしているのでしょうか?
たとえば、私たちは倉庫におり、定期的に注文を供給業者に出しています。そして、その倉庫には荷受けのための有限のキャパシティがあります。ある一日、最大で1,000ユニットしか受け入れられないとしましょう。それ以上は受け入れられず、人々が箱を中に運び入れられないために、倉庫の前に物が積み重なってしまうのです。
問題は、例えば海外の供給業者に発注している場合、納品日を正確にはコントロールできないという点です。手配をすれば平均的には制約内に収まるはずですが、運が悪ければ、ある注文が遅延し、別の注文が少し早く到着し、結果として月曜日に同日に2,000ユニットが届いてしまうことがあります。しかし、これらの注文は約1か月前に発注されていたのです。
ここでご覧いただきたいのは、あなたが下すあらゆる意思決定において、実行不可能な状況に陥る可能性があるということです。これは完全にあなたのコントロール下にあるわけではありません。つまり、実行可能性という概念に固執すると、古い概念や堅すぎる、不適切な概念によって、より良いツールがもたらす本来の価値を理解する知的な余裕すら失ってしまうのです。
つまり、実行可能か否かという二元論に縛られてしまうのです。しかし、実際には実行可能性は完全にあなたの意志で決定できるものではなく、当然ながら衝突する事象が発生します。例えば、同じ地域の供給業者に対して、同じ日に同じ数量を同じ港で注文すれば、すべてが同日に到着する可能性は非常に高くなります。ですから分散させる必要がありますが、それでもなお、一定のリスクは存在するのです。
そしてこれは多くの状況で起こる現象です。これが一例です。すなわち、当たり前のように考えられている実行可能性、実行可能な解、実行不可能な解という概念は必ずしもその通りではなく、概念自体が少しずれているのです。
もう一つの例は service level です。人々はサービスレベルの観点で物事を考えますが、それは本当に人々が感じるものと一致しているでしょうか? ここで私は通常、サービスの質の議論に踏み込みます。サービスの質には、代替品による食い合いや、人々が延期する意志なども含まれる可能性があり、結果として全く異なるものになってしまうのです。
そして、不確実性が存在しない世界、すなわち常にクラシックな非確率的最適化器を前提とした概念で問題に直接取り組むと、あなたが提案するようなアプローチはほとんど理解不能に感じられるでしょう。だからこそ、通常私は見込み客に一度立ち止まってブリーフィングを行い、様々な視点から世界を見渡し、直感をもって十分に考慮する時間を取ることを勧めています。なぜなら、技術的な細部—少々の技術、ソフトウェア、数学的要素など—に飛び込むと非常に気が散ってしまい、特に多くの競合ベンダーが「全てこれで解決! 答えはLLM、大規模言語モデルです。予測が信じられないほど優れたものになるし、LLMを使った最適化は素晴らしい」といった無数のナンセンスを持ち出してくると、なおさらです。
本当にそうでしょうか? 確かに、人々は「まあ、私はただ…」と考えるのですが、少なくともLokadにおいては、見込み客と話す際、我々だけが話しているわけではありません。他にも半ダースほどのベンダーが自社製品を売り込んでおり、その多くが無数のナンセンスを並べ立てています。その結果、見込み客はあまりにも多くの華やかな提案や突飛な主張に圧倒されてしまうのです。
Conor Doherty: さて、あなた方お二人は、確率的最適化やその他のブラックボックス化された技術—例えば確率的予測や数学を使う他の何か—において、人々を巻き込む際の主要な問題点の一つを概説したように思います。つまり、一定の参入障壁が存在するということです。そこで、Meinolf、あなたの経験から、非常に分かりやすく教えてくださるあなたは、どのようにして人々が1時間にわたり議論してきた不確実性を受け入れることに安心感を持たせるのか、具体的に教えていただけますか?
Meinolf Sellman: 聴衆との間に認知のズレが生じているかもしれません。彼らは「なるほど、航空会社は運航日に大損失を出していると聞いたが、なぜ彼らはこの技術を数十年も前から採用しているのか? 一体なぜLokadやInsideOptが提案するものを使っていないのか?」と考えるでしょう。その理由は、まさにあなたが示唆している通りです。
もし航空会社のような対象に対して確率的最適化を行おうとすれば、問題の規模はあまりにも大きくなり、もはや解くことができなくなってしまいます。航空業界で働き、最適化に取り組む専門家たちは非常に精通しており、確率的最適化や従来の手法について当然知っていますが、それらは常にMIPに基づいていました。
ここであまり技術的な話に深入りしたくはありませんが、基本的に何かを探す方法は2通りあります。一つは「すでに良いものを見つけた。ではこれをさらに良くできるか試してみよう」という方法で、もう一つは「ここでは何も見つからないだろう」と判断する方法です。MIPは「ここにはありえない」と判断し、探す場所を他に移すのです。
さて、もし探索空間が広大で、「ここにはありえない」と断言できない場合、つまり「ここにはありえないように見えても除外はできない」となれば、あらゆる場所を探し続けることになり、既に有望な場所を探す方がはるかに効果的になると言い換えられるでしょう。
したがって、混合整数計画を用いて確率的最適化を行おうとすると、「ここには何もあり得ない」と判断するこの手法のために、いわゆる双対界が実際に探索可能な範囲を十分に絞り込むことができず、人々はこの問題で20~25年も行き詰まってしまうのです。
そして今、まさにAIに基づく探索という新たな方法が登場しています。これは「解の品質に関する界を求めることはしない。むしろ、与えられた時間内で可能な限り最良の解を見つけ出すことに全力を注ぐ」というものです。非常に実践的かつ実用的なこの手法は、既に実現されています。
その枠組みでは、これまで対処してきたすべての縛り、例えばすべてを線形化・二値化しなければならないという制約から一気に解放されます。これらの問題はすべて解消され、InsideOpt Seekerのようなツールを用いれば、非微分可能や非凸の最適化も可能となり、これらの問題のモデリングはもはや大きな障壁ではなくなります。
これにより実際に得られる他の利点として、混合整数計画の並列化が挙げられる。この分枝限定法の手法は非常に難しく、高速化の程度には限界がある。大きなマシンで5倍の高速化が得られればラッキーと言える。そして、このAIベースの探索は、40~100コアを問題に投入することで大いに恩恵を受ける。
そして、これはハードウェアの進化とも連動しており、実際にはこれがより優れた技術となり得るということだ。しかし、結局のところ、これほど広大な探索空間を別の方法で検索することで、利用者が粗雑な近似ではなく、実際のシステムをずっと快適にモデリングできるようになるのが本質である。
そして同時に、複数目的の最適化といったことも扱える。重要なKPIは一つだけではなく複数ある。たとえば、「ここではこのルールを主に守ってほしいが、時々逸脱しても構わない」というような運用も可能だ。つまり、必ずしも常にそのルールが守られていなくても良いのだ。これらは非常に簡単にモデル化できる。
そしてもちろん、確率的最適化も可能である。これは単に期待収益を最適化するという意味だけでなく、解に伴うリスクを積極的に最小化し、制約を設けるという意味でもある。これがまさにパラダイムシフトであり、これこそがLokadやInsideOptを動かす原動力だ。過去30年間は考えられなかったことが、全く新しいパラダイムに基づき可能になる。
Conor Doherty: Joannes、同じ質問です。
Joannes Vermorel: ありがとう。そう、そして付け加えると、2000年代初頭に私が博士課程を始めた(最終的には修了しなかった)のだが、当時、機械学習コミュニティと最適化コミュニティが最適化の根本的な問題について持っていた見解は、完全に誤ったものであると判明した。
博士課程にいた頃は、「次元の呪い」が信条であり、次元が非常に高い問題は最適化できないと考えられていた。しかし、現在ではディープラーニングモデルによって、数十億、場合によっては数兆のパラメータを持つモデルを扱っている。つまり、一見すれば問題なく最適化が可能である。
さらに、「非凸なら何もできない」という考え方もあった。しかし実際には、非凸であっても多くのことが可能である。そして、証明は全くないにしても、他の基準で十分に良好かつ有用なものであれば、最適であると証明できなくても、それ自体が非常に優れた解であると論じることができる。
また、長い間、確率的最適化を考える際は、「次元を拡張する」という君の指摘の通り、1,000のシナリオを具体化し、それら1,000のシナリオを一度に最適化するしかないという考えがあった。
それは単なるマクロ展開に過ぎない。問題を1,000の個別インスタンスに展開することで、問題は実質1,000倍に膨れ上がる。そして、「さて、これで元に戻った。これなら最適化できる」となる。しかし、その方法では既存の分枝限定法ではスケーラビリティが極めて低いものとなる。
つまり、最初のステップで問題を1,000倍にマクロ展開するのは、文字通り途方もなく遅くなる。たとえば深層学習コミュニティが非常に驚いたのは、確率的勾配降下法の驚異的な効率性であり、状況を観察するたびにパラメータを少しずつ調整することで改善が見られるという点である。
そして多くの洞察が得られた。過去20年間で私が見てきた興味深い現象は、機械学習と最適化が並行して進化し、その多くが従来の常識を覆す形で発展しているということである。非常に興味深いプロセスだった。
深層学習のほとんどのブレークスルーは、より優れた最適化ツール、線形代数やGPUなどの特殊なコンピュータハードウェア、そして数学的最適化の進歩によってもたらされた。そして、ますます機械学習の技術が、ランダムな探索を避けるための手法として利用されつつある。
「ここは何も証明はできないが、非常に悪いように見える」と判断する場合もある。つまり、この領域は全体的に酷く、全く使い物にならないように思えるため、探索の対象を他所に移すべきだということである。また、「この分野には既に多くの時間を費やしている。たとえ一般的には良い分野だとしても、これ以上は探索する価値がないのではないか」という考慮も働く。
こうした最適化技術は、いわば機械学習志向の考え方そのものであり、私の見解では、20年後には機械学習と最適化が統合され、区別されなくなるかもしれない。
これは私が20年以上注視してきたテーマの一つであり、年々その漸進的な融合が進んでいるのを感じる。非常に魅力的な現象であるが、同時にまだ欠けている概念があるように思える。
Meinolf Sellman: そうだ。そして、君が先ほど述べた点に焦点を当てると、機械学習は反復ゲームにおいて非常に強力だ。まるでブラックジャックでカードを数えるようなもので、勝つことが保証されるわけではなく、予測が外れる可能性もあるが、ゲームを何度も繰り返すことで大きなアドバンテージを得られる。
そして、そのために以前「ある期間、運用結果や利益、コストなどを追跡せよ」と言ったのだ。なぜなら、どんな一日でも実行した解が外れる可能性があるからだ。これは、誰かが「サイコロを振って、もし4が出たら負けで1ドルを払え、4以外なら100万ドルをあげる」と言い、実際に1ドルを支払いサイコロを振った結果4が出る、という状況に似ている。それが正しい判断であったのは、期待値が非常に高く、損失がどんな場合もごく小さいため、その戦略を反復することで実際に大きな利点が得られるからだ。そして、これこそが最適化において機械学習を活用する際の「ゲームのルール」であり、私たちはこれをハイパーリアクティブ探索と呼んでいる。Lokadではどのように呼んでいるかはわからないが、基本的にはこの考えなのだ。
つまり、これはInsideOpt Seekerを推進する原動力の一つであり、モデルと解くべき問題が明確になれば、ソルバーはあなたの代わりにこれを実行してくれる。さらに、毎日のように「今日はどこで焼くか?今日、どれだけの在庫をどこに移すか?」といった運用上の決定が必要となる。これらは、数週間や複数の生産日に渡って展開される事例である。
そしてあなたはソルバーに「ねえ、実際にこの空間を探索する戦略を見直してくれ。別の探索方法であれば、もっと良い解が見つかったのではないか?」と問いかける。すると、Joannesが述べたような、例えば「他の探索空間を見始めてからどれくらい経過したか」といった実行時の特徴に基づいて判断が行われる。つまり、ここまで徹底的に探索した後で、次の一手を考え始めるのだ。
このような他の要因も影響し、同時にどれだけの項目を変更するか、または新たに検討を行うべきかという決定にも繋がる。たとえば、ある探索空間に入ったのがごく最近であれば、その空間で良い解を見つけるために、改善の可能な手段はすぐにでも採用すべきかもしれない。
しかし、しばらくすると、同じ空間に長く留まるうちに、「このままだと局所的には最適だが、全体的には他の変数をもっとうまく設定すれば、より良い解が得られるはずだ」となり、視野を広げる必要が生じる。これがまさに現在のパラダイムシフトである。つまり、「すぐに何もないと判断するか?」ではなく、「より良い探索方法を学ぶか?」という方向へと変わっているのだ。
Joannes Vermorel: AI探索に関して言えば、全くその通りだ。特に、Lokadがクライアントのために解決している問題の場合、ほとんどのサプライチェーンは、完全な解決ではなくとも、かなりの部分で貪欲な戦略によって対処できる。そしてその背景には、ダーウィン的な理由がある。もしサプライチェーンの状況が貪欲なアプローチに全く逆行するものであったならば、企業は超高級な最適化ツールを持つ余裕がなかったため、既にその状況は淘汰されていただろう。
つまり、サプライチェーンやプロセスを「大まかには正しい方向に進む」ように設計することが必要であり、これは設計上の重要な指針となっていた。しかし、細部に目を向けると、方向性は正しいものの、局所的には問題が発生する場合もあることが明らかになる。
一般的に、そう、Lokadは可能な限り貪欲な視点に大きく依存し、勾配が利用できる場合はそれをフル活用する。そして、最終フェーズで微調整を行い、運用においてより多くの余裕を持たせるための局所最適化を行う際に、レジリエンスを高める。もし、費用がほとんどかからない調整で運用上の余裕を大幅に増やせるなら、それは聴衆に具体的な事例を示すためのものだ。
例えば、あなたが倉庫を運営しているとしよう。あなたは、商品の出荷用に必要な梱包段ボールが0.1%の確率で切れてしまうと考えるかもしれない。確率は低いように思えるが、非常に安価な段ボールが不足するだけで、数年に一度倉庫を停止するのは極めて馬鹿げている。だから、「本当に少量なので、数か月分の余剰を確保しよう」と判断するのだ。
段ボールはたたむことができ、ほとんど場所を取らず非常に低価格である。だからこそ、わずかな追加最適化で、「段ボールのリードタイムが3日で、在庫はすでに1か月分ある」といった意見が出る。そして、人々は「十分だ、これ以上は必要ない」と判断する。しかし、シミュレーションを行うと、「それでもなお0.1%のリスクが存在する。これはかなり馬鹿げている。むしろ3か月分は確保すべきだ」と結論付けられる。
そして、「安価ではあるが、量的にはかなり多い」とも言われる。しかし、「本当に安いし、スペースもほとんど取らない。何故リスクを冒すのか?」とも考えられる。このように、直感に反して、数年に一度だけの出来事と思われるものが、実際にはいくつもの事象の積み重ねであることもある。
こうした、まるで別の人生の出来事のように人間の感覚では認識しにくい希少な事象をカバーできるような優れた最適化が必要となる。人は転職することも多く、同じ職場に20年も居続けることはほとんどない。だから、たとえば3年に一度程度の事象であれば、倉庫の管理者は一度もその光景を見たことがないだろうし、チームの多くのメンバーも実際に見た記憶はない。
つまり、認識閾値以下の希少な事象は、人間が感知できる範囲に限界がある。しかし、その影響は極端であり、いろいろな要因が重なれば、例えば0.1%に加えてさらにごくわずかな要因が重なり、最終的には毎月1件は発生する可能性のある問題となる。これは、リスクを十分に考慮していれば防げたはずの事象である。
しかし、あちこちで若干多めに支出するのは直感に反するかもしれない。なぜ追加コストを支払うのか?それは、たとえ希にしか起こらなくとも、支出を怠るとほぼ確実にトラブルに見舞われるからである。
Meinolf Sellman: そうだ。そしてこれは、証明可能な最適解を持っているときに陥りがちな罠でもある。一見、「これが証明された最適解であり、良好な予測もある」と聞こえるが、予測がわずかに外れると、その最適解は解の隅々までリソースを使い切っているため、極めて脆弱になり、予測の僅かなずれで性能が大きく低下して惨状となる。
そして、あなたは「見てくれ、期待利益は80セント減るが、倉庫を閉鎖せざるを得なくなるリスクは75%低減する。これはお得だろう?」という技術を求める。これは実際に成立すべき好条件であり、技術が見つけ出すべき交渉条件そのものである。なぜなら、「ひとつを制約してもうひとつを最適化しよう」とするのは、別のトレードオフの罠に陥るため、非常に困難だからだ。
また、「これらすべての懸念を総合して、最良の妥協点、すなわち特定の事象に対する最も安価な保険を見つけ出せ」と言える技術が必要である。これが、意思決定と不確実性の問題をどれほど把握し難いかという点を、ある意味で締めくくっている。
しかし、本質的にはそういうものである。ある予測未来に対して最適な解があれば、その解は僅かに異なる未来に対しても十分に機能するだろうというのは誤解である。実際に起こりうる多くの未来に対抗するための、優れた妥協案の運用計画を積極的に模索する必要がある。そして、その計画はリスクと期待リターンが合理的にトレードオフされるものでなければならない。
Conor Doherty: 訂正が必要なら訂正してください。しかし、確率的最適化の究極的な目標は、すべての制約とトレードオフの間でバランスをとる最適な妥協案、すなわち理想的なトレードオフまたは決定を見つけることだと思います。それは完璧な決定ではなく、すべての個別の問題を満たすための最良の妥協策である、ということですよね?
Meinolf Sellman: 正解です。数学的にはそのように解けるかもしれませんが、人々をその方向に導きたくはありません。要点はこうです。もし何が起こるか正確にわかっていたならば、ほとんどの場合、より良い解決策が存在していただろう。しかし、未来を完璧に―つまり99.9%ではなく、完全に―知ることができない以上、あらゆる可能性に対して本質的に良い妥協策を実行する必要があるのです。
そして、これこそが確率的最適化が提供するものです。これにより、システムの脆弱性が解消されます。これを頑健最適化と言うかもしれませんが、それはすでに特定の技術用語となっているため、実際には使用できません。しかし、要するにその意味です。運用におけるもろさ、すなわち脆弱性を取り除き、非常に信頼性が高く、継続的で一貫した結果を得ることができるのです。そして同時に、あなたの期待利益は、当初考えられていた以上に上昇するでしょう。
なぜなら、交差検証の性能や証明可能な最適性だけに頼ると、本質を見失ってしまうからです。未来を完璧に知っていないというコスト―つまり、最適化で未来を完璧に知っていると仮定することのコスト―が存在します。これがシステムを脆弱にする原因であり、予測が100%正しいと仮定している点にあります。これが従来の最適化技術の機能原理であり、それを捨て去り、最新の技術を用いなければ、運用コストを容易に20%削減することはできないのです。
Conor Doherty: では、ありがとうございます。そろそろ締めに入るかと思います。ヨハネス、最後に一言いただいてから、ミーノルフに締めの言葉をお願いしたい。何か付け加えたいことはありますか?
Joannes Vermorel: つまり、最も興味深いのは、最高のサプライチェーンとはどのようなものか、そして最もリスク調整された意思決定とは、企業が穏やかに稼働し、全てを吹き飛ばすような絶対的に壊滅的な判断が下されない状態を意味するということです。
そして、人々は、これまで市場から全く注目されなかった一つの商品を見出し、「これこそが超ニッチな商品だ。全力を尽くして、一気に100万ユニットを売り上げよう」と言う、史上最も輝かしいサプライチェーン戦略を期待するかもしれません。しかし私は、それはまさに魔法のようなものであると言います。いや、スティーブ・ジョブズのような起業家なら実現可能かもしれませんが、ほとんど不可能に近いのです。
つまり、未来を掌握し、金の延べ棒のようなチャンス、ビットコインのような機会を見出して全力投球し、莫大な利益を得られるという考えは非常に馬鹿げています。実際、優れたサプライチェーンの管理とは、穏やかに機能している状態です。リスクを十分に考慮した意思決定により、状況が悪いときは実際にごく僅かに悪化し、状況が良いときはほとんどの場合非常に好調で、しっかりと収益を上げられるのです。
そして、意思決定を振り返ると、「もし知っていたら、別の判断をしていただろう」と思うかもしれません。しかし、当時の状況に基づいて正直に評価すれば、「当時の判断は合理的だった」と納得できるはずです。後知恵に惑わされて判断を曇らせてはいけません。なぜなら、それが大きな弊害となるからです。
例えば、以前は私たちのクライアントの中にはそうしなくなった者もありますが、航空宇宙業界では、AOG(航空機の地上待機)インシデント、すなわち部品が欠品して航空機が飛行不能となった際に、徹底した事後分析を行っていました。しかし実際には、航空機を常に稼働させるために30万近いSKUを在庫として保持している場合、特に1個あたり50万ドル以上する部品が含まれると、すべての部品が常にすぐ手に入る必要はないのです。
私たちの調査では、例えばこれらのAOGは、在庫のリスク構造に見合った通りの発生率であったため、特段の調査を行う必要がなかったことが明らかになりました。これが私の結論であり、おそらく確率的最適化の最も難しいセールスポイントは、その目立たなさにあるということです。つまり、ただ穏やかに機能するだけで、問題は大幅に深刻化せず、成功例も極端ではなく、しかしはるかに頻繁に現れるのです。
しかし、改めてお聞きします。過去30年間、試合の60〜70%を連続して勝ち続けたサッカーチームを覚えていますか?それとも、常に敗北しているにもかかわらず、連続して10試合、最も名高いチームに勝利したチームを覚えていますか?当然、極端な成功の連続は印象に残り、「あれは素晴らしかった」と記憶に刻みますが、平均的に優秀でありながらもごく普通な実績は忘れ去られてしまうのです。
ご覧のとおり、私の主張はこうです。確率的最適化から得られるのは、穏やかで目立たないが、平均としては非常に良い意思決定であるということです。もし悪い結果になっても、それはわずかな悪化にとどまり、身を滅ぼすようなことは決してありません。多くのダメージコントロールが働いているのです。
そして、興味深いことに、ロカドではクライアントとの議論の中で、生産運用を数年続けた後、クライアントが実際にはほとんど意見を持たなくなるという現象があります。つまり、最悪というわけではなく、むしろ最高の賛辞として、「あなたたちのシステムはあまりにも平穏すぎるので、サプライチェーンを優先事項から除外してしまっている」と言われるのです。まるで水道水のように、平穏で特に気に留める必要がなく、ただ機能しているだけなのです。そして、それで問題ないのです。私たちが劣っているわけではなく、明らかにサプライチェーンは水道供給ほど平穏ではないものの、そんな雰囲気があるのです。
Conor Doherty: では、ヨハネス、ありがとうございます。ミーノルフ、習慣に従い、締めの言葉はゲストであるあなたに譲ります。どうぞ、お願いします。
Meinolf Sellman: はい、改めまして招待いただきありがとうございます、コナーさん、ヨハネスさん。ヨハネスが述べたことに関してですが、我々の運用チームはしばしば驚かされる一方で、クライアントは驚かないという現象を目の当たりにします。そして、それこそが理想的な状態なのです。運用チームは、かつては毎週のように地獄のような日があったのに、突然、2ヶ月間もスムーズに運用できることに驚くのです。すべてがただ機能し、突拍子もない事態は一切発生しなくなったのです。
しかし、もっと重要なのは、クライアントが突然サービスを失うなどの事態に陥らなくなったという点です。これこそがあなたのビジネスの目的であり、そのためにこの種の技術を用いて運用を行うべき理由です。クライアントに大きな驚きを与えたくはありません。そして、そのおかげで、静かな島で地味なマルガリータを飲みながら、低い分散の平均的なリターンを堪能できるのです。
Conor Doherty: さて、皆さん、これ以上質問はありません。ヨハネス、本当にありがとうございました。ミーノルフ、こちらも大変光栄でした。ご参加いただき、感謝します。そしてご覧の皆さん、ありがとうございました。また次回お会いしましょう。