00:00:00 Robert Fildesによる開会の挨拶
00:01:08 Conor Dohertyがパネルとテーマを紹介
00:03:11 Nicolas Vandeputの視点
00:06:16 Sven Croneの発表
00:10:34 Alexey Tikhonovの視点
00:15:01 意思決定における自動化の必要性
00:20:13 人間間での情報共有は時間の無駄
00:25:29 人的介入に関する視点
00:30:23 予測の評価
00:35:18 財務的視点と意思決定
00:40:14 予測誤差のコスト
00:45:43 自動化と信頼
00:50:27 拡張AIとその応用
00:55:03 AIが人間の翻訳者に与える影響
01:00:16 AI導入における明確なビジョンの重要性
01:06:00 閉会の所感と需要計画担当者の未来
01:11:50 聴衆からの質問:病院向け予測
01:15:38 聴衆からの質問:モデルと人的バイアス低減

パネルの背景

このパネルは、Conorによる記事批判 FVAに応じて、Robert Fildes(ランカスター大学名誉教授)により最初に提案されました。この記事は、第44回国際予測シンポジウムを運営する同組織、International Institute of Forecastersが制作したForesight Q2 2024版で再掲載されました。その後、パネルは学界と業界双方からより均衡の取れた視点を提供するため、Sven Crone、Nicolas Vandeput、Alexey Tikhonovを加えて拡大されました。

パネルディスカッションの概要

2024年7月、ディジョンで開催された第44回国際予測シンポジウムで撮影されたパネルでは、4人のスピーカーが「AI/MLの新時代における需要計画と判断の役割」について議論しました。Lokadの通信責任者であるConor Dohertyが司会を務め、パネルはAlexey Tikhonov(Lokad)、Sven Crone(Lancaster University & iqast)、Nicolas Vandeput(SupChains)で構成されました。議論は、需要計画へのAIの統合、意思決定における予測の価値、そして需要計画担当者の未来を中心に展開されました。パネリストたちは、需要計画における人的判断の役割、AIが需要計画担当者に取って代わる可能性、そして予測における精度の重要性について、それぞれ異なる見解を示しました。

詳細な概要

フランス・ディジョンで開催された第44回国際予測シンポジウムは、International Institute of Forecastersによって主催され、「AI/MLの新時代における需要計画と判断の役割」についてのパネルディスカッションが行われました。ディスカッションはLokadのConor Dohertyが司会を務め、パネリストにはLokadのAlexey Tikhonov、iqastのSven Crone、SupChainsのNicolas Vandeputが参加しました。本セッションは、ランカスター大学名誉教授であるRobert Fildesによって紹介されました。

ディスカッションは、Nicolas Vandeputが機械学習の時代における需要計画のビジョンを概説するところから始まりました。彼は、需要予測を情報ゲームとみなし、自動化された機械学習による需要予測エンジンを作成し、モデルに含まれていない情報で人間の需要計画担当者が予測を補完し、プロセスに関わる全ての人の付加価値を追跡するという4段階のプロセスを提案しました。

Sven Croneは、AIと予測に関する自身の経験を共有し、需要計画におけるAIの採用が遅れていることに言及しました。彼は、需要計画プロセスにAIを統合する複雑さについて議論し、将来的にAIが需要計画担当者に取って代わる可能性があることを示唆しました。しかし同時に、予測の多様性にも触れ、業界ごとに異なるアプローチが求められることを強調しました。

Alexey Tikhonovは、需要計画は時代遅れの手法であり、判断に基づく予測介入は無駄であると主張しました。彼は、リスクの構造的パターンを捉える確率的予測を提唱し、経済的視点と自動化が欠如しているとして需要計画を批判しました。また、彼はサプライチェーンにおける意思決定プロセスの完全な自動化を主張し、サプライチェーンに要求される意思決定の複雑さと規模がこれを必要としていると述べました。

パネリストたちは、意思決定における予測の価値についても議論しました。Nicolas Vandeputは、予測は意思決定を促進するために行われるものであり、可能な限り多くの情報を処理できるモデルを求めるべきだと強調しました。また、彼は予測を評価する際には、ビジネス成果ではなく予測精度に焦点を当てるべきだと提案しました。なぜなら、後者は予測者の管理の及ばない多くの要因によって左右されるためです。

Sven Croneは、需要計画の産業的視点について議論し、長期的な戦略的意思決定とシナリオベースの計画の重要性を強調しました。また、付加価値の測定における課題とプロセスにおける判断の重要性も強調しました。

Alexey Tikhonovは、異なる意思決定につながらないのであれば、より精度の高い予測の価値は疑問であると問いました。彼は、意思決定の価値は予測だけに依存するものではなく、意思決定の推進要因など他の要因にも左右されると主張しました。

パネリストたちは、予測に対する信頼性についても議論し、Nicolas Vandeputは、人間または機械によって生成された予測に信頼を築く唯一の方法は、プロセスの各ステップの精度を追跡することだと提案しました。Sven Croneも信頼が重要であると同意し、AIとシンプルで透明性のある手法を組み合わせることでプロセスの一部を自動化できると示唆しました。

パネリストたちは、需要計画担当者の未来についても議論しました。Sven Croneは、需要計画担当者は将来的にも役割を担うと考えていますが、意思決定の頻度の増加と利用可能なデータ量の増大により、より一層の挑戦に直面すると考えています。Nicolas Vandeputは、需要計画担当者の役割が、データや情報の収集、構造化、クレンジングに焦点を当てる方向へと進化すると見ています。一方、Alexey Tikhonovは、長期的には需要計画担当者は知能システムと競争できなくなると考えています。

パネルは質疑応答セッションで締めくくられ、パネリストたちは、需要計画における自動意思決定を行う条件や要件、需要計画における判断の役割、そして統計的バイアスに人的判断のバイアスを組み込むことで全体のバイアスを低減する方法などのトピックに関する聴衆からの質問に答えました。

全文書記録

Robert Fildes: 私はRobert Fildesです。本セッションを紹介いたします。物流上の理由からセッションの順番が入れ替わっており、今から約1時間、需要計画担当者の変化する役割と、AIや機械学習の進展によってその役割が大幅に変わる可能性について議論します。まもなくパネリストたちが知恵の言葉を述べます。Paul Goodwinと私が判断の役割に関する多数の実証的証拠について話すセッションは、本日15:10に午後の部へ移されました。いずれにせよプログラムに記載されています。はい、判断に基づく調整についても議論しますが、この部屋ではなく別の部屋で行います。それでは、そのときにお会いできることを楽しみにしており、刺激的で出来れば論争を呼ぶ議論を期待し、司会のConorにバトンタッチします。

Conor Doherty: では、Robert、ありがとうございます。皆さん、こんにちは。私はConorで、Lokadのコミュニケーション責任者です。学界と産業界からの著名なパネルがステージに加わっていることを大変嬉しく思います。すぐ左には、Lokadのビジネスおよびプロダクト開発者であるAlexey Tikhonovが、さらにその左には、Lancaster UniversityのDr. Sven Crone(iqastのCEOで創業者)が、そして最後になりますが非常に重要なNicolas Vandeput(SubChains)がいます。さて、本日の議論のテーマはご覧の通り、AIおよび機械学習の新時代における需要計画と判断の役割です。

ステージに立っている皆さんを考えると、活発な意見交換が行われると確信しています。また、技術の進歩は通常、その進歩が人間の関与にどのように影響するかという疑問を投げかけるものだと思います。ですので、3人のパネリストがそれについて議論するのを非常に楽しみにしています。それでは本題に入る前に、今日の限られた時間を考慮し、少し事務連絡をさせていただきます。各パネリストには、テーマに関連した自らの視点を発表するために5分間が与えられます。最初はNicolas、その次がSven、最後にAlexです。

その後、彼らの視点の詳細や意味合いを引き出すための質問をいくつかさせていただきます。そして、もし皆さんがお話しできる状態であれば、聴衆からの質問も受け付けたいと思います。申し上げたいのは、時間が限られているため、マイクが渡される前にいくつかのアイディアをお持ちいただけるとありがたいということです。では、まずはNicolasにバトンタッチします。どうぞ、テーマに関するあなたの視点をお願いします。

Nicolas Vandeput: ありがとう、Conor。皆さん、こんにちは。素晴らしい、スライドがありますので、機械学習の時代における需要計画の卓越性に関する私のビジョンと、サプライチェーンの需要予測において機械学習と人間による補完をどのように統合できるかをご紹介します。スライドには4つのステップが示されています。それでは説明いたします。

私にとって最も重要な点は、需要予測を情報ゲームと捉えることです。つまり、将来の需要に関するできる限りのデータ、情報、洞察、あるいは何と呼ばれるものであっても収集するということです。それは、プロモーションカレンダー、どれだけの広告を行うか、売上データ、クライアントに所在する在庫、あらかじめクライアントから受注している注文などが含まれます。業界によっては異なる場合もありますが、基本的に最初のステップは、これから起こることについての情報を見つけることです。あなたはジャーナリスト、リポーター、探偵のようなものであり、この情報を探しに行くのです。

そして、この情報がすべて揃ったら、整理可能なデータを機械学習に投入し、自動化され、完璧な機械学習需要予測エンジンを作成する必要があります。ここで自動化とは、ツールでありエンジンであり、人間による手動での修正、レビュー、微調整が不要であることを意味します。データサイエンスチームが行うか、自動的に処理される、完全に自動化されたものです。完璧というのは、機械学習エンジンが、具体的にはプロモーション、価格、在庫切れ、広告、天候、休日など、ほとんどのビジネスドライバーに対応できる必要があるという意味です。つまり、ほとんどのビジネス要因に対して堅牢であり、完全に自動化されていて、手を加えたりレビューしたりする必要がないのです。

これができれば、人間、つまり需要計画担当者は、このモデルに含まれていない情報に基づいて予測を補完することが可能です。たとえば、担当者がクライアントに電話し、あるクライアントが「今月は本当に厳しいので注文しません」と言ったとしましょう。その情報は機械学習モデルには通知されず、モデルはそれを認識できませんが、担当者は知っています。したがって、担当者は予測を確認し、モデルが把握していない情報に基づいて修正するべきです。

最終ステップは、予測付加価値です。これは絶対に重要なステップであり、むしろこれから始めるべきだと思います。つまり、プロセスに関わる全ての人の付加価値を追跡する必要があるということです。補完前後の予測精度を追跡し、時間が経つにつれてその補完が価値を付加していることを確認する必要があります。もちろん、誰にでも運が良い時と悪い時はありますが、それは全く問題ありません。すべての補完が価値を付加するわけではありませんが、長期的には平均してこれらの補完が価値を生んでいることを証明・示すのが目的です。したがって、時間をかける価値があるのです。これが、機械学習と需要計画担当者を統合するための4段階のビジョンでした。

Conor Doherty: ありがとうございます、Nicolas。では、次はSvenにバトンタッチします。

Sven Crone: ありがとう。はい、ありがとうございます。私はLancaster UniversityのSven Croneで、助教授として約20年にわたりAIと予測に関する研究を行ってきました。ですので、率直に申し上げると、私はAIに対して非常に偏った見方をしていると言わざるを得ません。長年にわたり予測にAIを活用しようと試みてきましたので、その根本的な偏りをご理解いただければと思います。同時に、私たちは大手多国籍企業が新技術を活用できるよう支援する小規模な会社も設立しましたが、振り返ってみると非常に困難なものでした。本日のパネルでは、ぜひとも取り上げるべき、誰もが気にしているが口に出しにくい「部屋の中の象」について議論すべきだと思います。

このビジョンは何年も前からあり、統計をAIに置き換えることも、逆にAIを統計に置き換えることもできます。実際、需要計画プロセスに関してはあまり革新的な変化を遂げていないと思います。これが私の根本的な偏見です。この点に関して共有できる経験として、多くの需要計画担当者に、指数平滑法やARIMAアルゴリズムの理解を促すためのトレーニングを行ってきたことがあります。それが決して容易な作業ではなかったのは断言できます。需要予測においては取り入れやすい部分もありますが、単純な技術であっても彼らに受け入れさせるのは非常に難しいのです。ですので、後ほどその技術がさらに発展し、人々がどのように関わらなければならなくなるかについて少し話し合うことになるでしょう。

しかし、現状は、約10年前にはAIの利用は非常に限られていたものの、ニューラルネットワーク自体は60年近く前から存在しており、初期の革新、特に1980年代にまで遡る歴史があります。しかし、採用は比較的緩やかでした。ここ2、3年で、我々は実務者会議で定期的に調査を行っています。たとえば、ブリュッセルで開催されたASMという実務者会議で講演した際、聴衆に対してAIやMLの概念実証を実際に行っている人がどれくらいいるか調査したところ、約50%にのぼりました。これは10年前の5~10%から大幅な増加です。現在は50%が概念実証を行っており、まだ本番運用ではないにせよ、かなりの企業がすでに本番運用に移行しており、実際にこの技術を試している優れた企業も見受けられました。聴衆に恐れはなく、その他にもいくつか興味深いケーススタディが存在します。しかし、注目すべきは、成功するプロジェクトと同様に失敗するプロジェクトも多いという点です。

つまり、聴衆の中にはAIプロジェクトが成功しなかった大きな割合が存在しており、これはまさに、技術であるembeddingを、単なる予測工程以上の需要計画プロセスに統合するという交差点にあたると思います。業界を見ると、マスターデータ管理、データクレンジング、優先順位付け、エラーメトリクス、統計モデルの運用、そして場合によってはエラーの分析、アラートの特定、その上での調整といった工程が必要です。ちなみに、たとえ完全な統計的ベースライン予測プロセスを持っていたとしても(今日でも大多数の企業はこれを持っていませんが)、GartnerはS&OP成熟度の各段階を美しく示すマップを提供しています。

レベル4に位置する企業は非常に少なく、ほとんどの企業はレベル1、2、3のいずれかに位置しています。たとえ統計的プロセスを持っていたとしても、時系列の履歴を自動的または手動でクレンジングする方法は判断に依存します。どのアルゴリズムを選ぶか、またどのメタパラメーターを探索対象とするかは、いずれも判断の問題です。つまり、多くの判断が介在しますが、伝統的には統計的ベースライン予測の最終調整という判断について考えられてきました。そして将来を見据えると、O.W.によって設計されたS&OPプロセスの革新において、大きな動きやイノベーションは見当たらず、エグゼクティブたちは進捗の不足、あるいは進捗不足の印象に深い不満を抱いています(プロセス自体の開発においてはしばしば進展があるものの)。

しかし、実はユニリーバのCEOが「需要計画を廃止すべきだ。COVID時代には機能しない」と述べたのを耳にしました。需要計画担当者が職を維持するためには大きな課題があり、AIを活用しなければならない状況です。そして、あなたがおっしゃったように、もしこれらすべてを実現できれば、AIは判断的な調整段階においてさえ需要計画担当者を置き換える現実的なシナリオがあると私は考えています。しかし、まだその段階には至っていません。皆さんのご意見を伺うのを楽しみにしています。

Conor Doherty: では、ありがとう、Sven。Alexey、あなたのご意見をお願いします。

Alexey Tikhonov: ありがとうございます。私の提案は根本的に異なるものになります。まず、需要計画はサプライチェーンの一部であり、その目的は不確実性の下で、制約の中で、利益を生む意思決定を行うことにあるため、視野を拡大する必要があると考えます。この目的に関して、私の見解では、需要計画は時代遅れのアプローチであり、判断に基づく予測介入は、たとえ予測精度をわずかに向上させたとしても、無駄な取り組みです。なぜなら?

需要計画は、予測と意思決定を分離する必要があると前提しているため、時代遅れのアプローチです。この分離は必然的に単純なツールの選択へと導きます。なぜなら、人間同士のインターフェースを介在させるため、情報を極めて簡単な方法で伝達する必要があり、誰もが理解できる一点予測を選ぶからです。精度メトリクスの計算も単純であり、その数値について議論し、上下に調整することが可能となるのです。しかし、残念ながら、このようなツールの選択は、利益を生む意思決定を下すことを阻害してしまいます。

利益を生む意思決定を行うためには、財務リスクと財務リターンを評価する必要があります。それは、リスクの構造的パターンを捉えることができる場合にのみ可能です。私の知る限り、この目的を果たすツールは確率的予測と呼ばれるもので、単一の一点予測の代わりに、あらゆる可能な未来がどのような姿をしているのか、その各未来の確率について、知見に基づいた意見を提示するものです。

ここで話しているのは需要だけではありません。例えば、考慮すべき不確実性として、リードタイムの不確実性が挙げられます。これは特に、海外から輸入される商品の場合に関連してきます。また、食品生産を扱っている場合は歩留まりの不確実性が、eコマースでは返品の不確実性が存在するかもしれません。すなわち、複数の不確実性の源があり、それらを統合して後工程で意思決定を導き出すためには、確率的モデリングと呼ばれる特定のツールが必要となるのです。

需要計画は、もっとも可能性の高いシナリオである一点予測という、未来の一つのバージョンしか提供しません。しかし、リスクは分布の両端に集中しているため、私たちはその裾野にこそ関心があります。そして、需要計画の視点は必然的に、一つの意思決定オプションのみを考慮することにつながります。一点予測に基づき、安全在庫計算の数式や単純な在庫方針を適用して意思決定を行うのです。しかし、この意思決定は本当に利益を生み出すのでしょうか?もし上下に変更した場合、期待される収益性はどのように変わるでしょうか?私の予測は一点予測でしかなく、そのシナリオに対する確率を示すことができないのです。

需要計画の第三の問題は、経済的視点が全く欠如している点にあります。予測精度をパーセンテージで評価する、あるいは単位での精度を扱う各種指標を用いたとしても、財務的視点が抜け落ちています。したがって、必要なのは期待コストや期待リターンを見積もることであり、さらに、製品ごとの在庫意思決定を比較するための副次的な要因も評価する必要があります。たとえば、すべての小売業者は、紙おむつの在庫があることが、プレミアムチョコレートの在庫を持つよりもはるかに重要であることを知っています。なぜなら、前者が欠ければ顧客が失望し、顧客のロイヤルティを失うからです。

需要計画は、広範な自動化を妨げる要因となります。何を自動化するのかというと、単なる予測だけではなく、最終的な意思決定の生成を自動化することです。全体のパイプラインを自動化し、生の取引データを、最小発注数量(MOQ)や価格差引などの全ての意思決定制約をすでに考慮した実行可能な意思決定へと変換する必要があります。

そして最後に、所有権が存在しなければなりません。現状では、予測が別のチームに引き継がれ、そのチームが意思決定を下すという移行プロセスが存在するため、最終的な意思決定に対する所有権がなく、結局、責任のなすりつけ合いが発生してしまいます。「ああ、あなたの予測が不正確だった、あるいは判断的な上方修正があったために、我々は誤った意思決定をしてしまった」という具合に。

まとめると、需要計画の視点は時代遅れであり、私たちはより優れた方法を持っているということです。ありがとうございました。

Conor Doherty: さて、本日は全てにおいて意見が一致するわけではありませんが、その点について一言返答させてください。いくつかの点ではあなたに全面的に同意しています。あなたはポイント予測と区間または確率分布予測の違いについて言及しましたが、それは同意できる点です。しかし、何年も前からその手法を用いている多数のソフトウェアパッケージが存在するにも関わらず、実務者はそれを無視しています。ただし、需要の数値だけでなく、そのリスクも併せて伝えることの価値は皆理解していると思います。

SASは長い間これを行い、Forecast ProやForecast Xでさえも同様の取り組みをしているのに、それが広く無視されているのはなぜでしょうか?おそらく、需要計画担当者が区間予測を理解しない理由について議論すべきでしょう。とても興味深いテーマです。さらに、あなたが指摘したもう一つの良い点は、需要計画と在庫計画、サプライネットワーク計画、生産計画との間に断絶が存在することであり、統合的な解決策を導く上で不利になっている点です。

しかし、大手多国籍企業を考えると、何万人もの従業員が介在して意思決定を行っているため、プロセス自体は既に定められており、彼らが自由に知識を共有するわけではありません。そして第三に、私たちが何を考慮すべきかについても検討が必要です。需要計画を見る背景は皆異なり、私は業界の多国籍企業、たとえば多国籍運輸会社、ファストムービング消費財、製薬業界から来ています。一方、あなたはより小売業的な視点や背景を持っているのかもしれませんが、それらは総合的に扱われるべきものです。

ところで、SASのCharlie Chaseによる非常に優れた書籍が存在します。彼は需要主導型サプライプランニング、すなわち需要と供給の調整について執筆しています。それは、情報共有、期待値の共有、そしてS&OPにおける長期(大体6〜18ヶ月先)のリスク管理、さらにはS&OEが1〜4ヶ月先を見るというプロセスとして、最終的な一点予測がどうであれ、非常に価値のある情報共有を可能にするのです。

ですので、意思決定の統合に関しては多くの課題が残っていることには異論はありません。しかし、需要計画は複数の目的を持っていると私は考えます。ただし、今日の議論の趣旨は自動化に関するものであり、たとえAIが自動化の文脈で用いられ、主に精度が注目されているとしても、実際に情報共有に注目する人は非常に少ないのです。予測の堅牢性に関する興味深い論文はいくつかあります。例えば、非常に反応の良い機械学習モデルで予測を頻繁に更新した場合、リードタイムに基づいて生産計画が狂い、在庫過剰や在庫不足が発生し、生産指示が出されるという事態が起こるかもしれません。

したがって、需要計画プロセスおよびその中での予測の貢献に焦点を当てるべきだと私は考えます。他はサプライプランニングやネットワークプランニング、生産プランニングの問題となり、議論を難しくしてしまうからです。しかし、その点が重要であるという点には全く同意します。

Alexey Tikhonov: 短いコメントを一言。私の主張は、より良い情報共有やより良い予測が必要だというのではなく、意思決定部分を完全に自動化すべきだということです。サプライチェーンは極めて複雑であるため、実務者が予測プロセスに関与すべきではありません。たとえば、小売業で1億の売上高を持つ中規模企業であっても、何万ものSKUや数百の店舗が存在し、それらを掛け合わせることで、各SKUごとに毎日の意思決定が必要となるのです。

たとえ「週に一度この意思決定を行う」という決められたサイクルがあったとしても、実際にはそれらの意思決定を毎日再計算すべきです。なぜなら、人間の処理能力は限られており、「需要が急増した場合、通常のサイクル前にその変動を把握すべきだ」とコンピュータが常に監視する必要があるからです。したがって、たとえその大半が「本日は購入しない」という些細な意思決定であっても、日々再現される必要があります。

人間の処理能力には限界があり、人間同士で情報を共有することは時間の浪費になります。私たちはできる限り自動化を進め、資本主義の原則に則って、資産としての意思決定ロボットを構築すべきです。そうして初めて、サプライチェーンから利益を引き出すことが可能になるのです。

Nicolas Vandeput: ちょっとだけ私のスライドに戻っていただけますか?それを整理したいのです。そこで、私のフレームワークから始め、議論をさらに過激に展開していきたいと思います。私たちは皆、優れた意思決定を行うために予測をするという点で意見が一致していると考えています。そして、どのタイプの予測がより良いのか、この粒度、この期間、一点予測など、様々な意見があるでしょう。しかし、結局のところ、意思決定を下すために予測をしているという点では皆同意しているのです。

では、なぜ私たちは皆、自動化に強く傾倒するのでしょうか?それは、莫大な数の予測と意思決定を大規模に行わなければならず、ばらつきを抑えたいからです。人間が関与すれば、ばらつきの問題が発生し、予測や意思決定が多数生じる問題が出てきます。私の考えでは、予測とは、いかに多くの情報を処理できるか、そしてその処理能力がどれほど優れているかに尽きます。だからこそ、できる限り多くの情報に対処できる最良のモデルを求めるのです。

私たちの技術は10年後には変わっているかもしれません。将来的には、世界中のすべての情報に対応できる単一のモデルが存在する可能性もあります。たとえば、COVID-19パンデミックを考えてみましょう。2020年3月中旬と仮定した場合、たとえ現代の最先端の学習技術を用いた予測エンジンがあったとしても、人間としてはCOVIDが進行し、今後数週間で世界や都市の状況が変わることを予見できる一方で、モデルはそれに気づいていないのです。

もちろん、一点予測であれ確率的予測であれ可能ですが、最終的には人間が、モデルがアクセスできない情報を補完・再評価する必要があります。だからこそ、一点予測にこだわる議論は本質的な意味を持たず、結局のところ、どれだけ多くの情報をモデルに供給できるかという問題に帰着するのです。

そして、もし特定の情報をモデルに供給できないのであれば、その時は人間がその情報を補完すべきです。だからこそ、モデルが処理できない情報に基づいて、最終的な意思決定や予測をレビューできる最後の1人の人間が存在することは常に理にかなっているのです。

Sven Crone:私は、ここで話しているのは異なる業界のことであると思います。需要計画を見る場合、小売業界において日々何万もの意思決定を行うのであれば、相当な自動化が必要だという点では、全く同意します。

しかし、私たちはかなりの期間英国の小売業者と協力しており、そこでさえ、極端な天候の影響やドイツにおけるCOVIDによる閉鎖がシャワージェルとトイレットペーパーに与える影響など、不確実性が支配する事柄に対して、品揃えの調整が行われています。

しかし、例えば主要製品が2から400品目程度ある製薬メーカーであれば、それらは人間によって十分に管理可能です。実際、なぜ多くの企業が何とかやっていけるのかというと、調査によれば約50%の企業が非常に単純な統計手法を用いており、何とかやっていけているのです。彼らは利益を上げ、成長し、サプライチェーンに柔軟性を持ち、すべてにS&OPを組み込んでいます。

つまり、私たちが抱える問題は実に多様であり、これがこの会議で常に私が魅了される点です。ここには、さまざまな予測手法が一堂に会しており、スマートメーター向けの電力負荷を示す事例もあります。はい、数十万台のスマートメーターがあり、分単位の予測を行っているため、人間が介入する余地はありません。

しかし、もし非常によく理解されている少数の重要なアイテム、例えば製薬会社におけるワクチンのようなものがある場合、需要計画には多様なアプローチがあるのです。

私たちが予測で行っていることは、製品や市場の持つ多様性と同じく多様であり、それがこの分野の美しさです。だからこそ皆がバーに集まり、予測について全く異なる事柄を語り合うのです。しかし、小売業界の話に戻ると、自動化は確実に可能だという点では全く同意します。

私たちは、すべての異なるソフトウェアパッケージに十分な市場が存在するという点については意見が分かれているものの、そのおかげで市場には専門的なソリューションが存在します。たとえばSAPのような大企業は小売業向けに専門的なソリューションを持っており、消費財や製薬業界、その他の分野向けとは異なる動作をします。だから、異なる視点からの意見であっても、基本的には一致していると思います。

Conor Doherty:アレックス、何かコメントはありますか?

Alexey Tikhonov:少し意見があります。予測プロセスに人が介入する必要があるという主張には同意できません。人が価値を追加できるのは、この意思決定エンジンの入力部分において、data semanticsを明確にし、より多くのデータを提供し、すべてのアルゴリズムや意思決定エンジンを作り上げるエンジニアに対して、データがどのようにビジネスで活用されるかを説明することで、全体像の理解を深める場合です。

そして、彼らは最終段階で、意思決定エンジンが生み出す決定を検証し、自らの判断で非常識または不正確だと思われる決定を見つけ出し、その数値的なレシピを再検討して何が問題なのか、どの仮定が間違っているのか、なぜ誤った決定を下しているのかを明らかにすることで価値を付加できます。もし途中で介入して予測に手を加えたり、意思決定を上書きしたりすれば、それはリソースが投資されるのではなく消費されるのと同じです。まず何よりも、robotizationを改善する方法を検討すべきです。なぜなら、手作業で行えば時間を浪費するだけだからです。

ちなみに、予測ではなく意思決定から着手すべきです。例えば、MOQ MOQ が100ユニットある場合に、『需要が50ユニットではなく55ユニットだ』というより良い予測を提示されたとしても、MOQは変わらないため、私の観点からは、たとえ一方がより正確であっても、どちらの予測も実質的には意味をなさないのです。結局、同じ意思決定を下しているのに、より計算コストのかかる、潜在的により正確な予測を生み出すために追加のリソースを投資しているからです。つまり、予測精度が向上しても、総合的には同じ意思決定を下しながら余分なリソースを消費しているため、結果的にマイナスの状況になってしまうのです。

だからこそ、私はプロセスの各ステップに手動で介入することに反対するのです。自動化をより堅牢で信頼性があり、合理的なものにするために、全体のレシピを見直す必要があります。

Sven Crone:午後におそらくRobertやPaulが予測付加価値について議論していたのに、その前に議論がなかったのは本当に残念です。なぜなら、高度な統計手法に加えて、人の判断が大きな価値を付加できるという多くの証拠があるからです。

そして、今日ここで提起された疑問は、機械学習が統計および判断による付加価値を上回ることができるのか、あるいは同等なのかということです。そして、総所有コストの問題も重要な問いです。どちらがより効率的なのでしょうか?

私が確信しているのは、ニコラスが以前に報告または言及した多くの事例が存在するということです。実際、全体を自動化することで、判断的な調整を行うよりも多くの価値が付加されている事例です。しかし、次の質問に進みましょう。

Conor Doherty:実際、これは一種のつなぎであり、転換とも言えるものです。つまり、根本的な問い、基本的な問題に進むためのものだと思います。あなたの話を聞く限り、道具的な不一致はあるものの、全体としては一致しているように思えます。

実はまず、ニコラス、あなたに伺いたいのですが、先ほどあなたは(もし引用が不正確であればご容赦ください。意訳ですが)「予測を用いてより良い意思決定を行う」と述べました。これは、予測がより大きなプロセスの中で道具的な役割を果たしているということであり、そこから価値はどこにあるのかという問いが生じます。

もし予測をより大きな目的を達成するためのツールとして用いるのであれば、価値はどこにあるのでしょうか?家を建てるための道具に価値があるのか、それとも家そのものの構造に価値があるのか?この例えでは、家が意思決定を意味します。

Nicolas Vandeput:予測に関しては、二つの重要な問いがあると思います。一つ目は、あなたの予測は正確かどうかです。そして、正確性の測定方法については興味深い議論が交わされるでしょうが、今日はそれは割愛し、まず予測がどれほど正確または優れているかを評価することを考えます。

二つ目の問いは、与えられた予測に基づいて、あなたの会社がどれほど適切な意思決定を行えるかということです。残念ながら、これを担当するチームは、入力、出力、KPIが異なる別々のチームです。

サプライチェーンの観点からは、予測者や予測エンジンを作る人々を、悪い意思決定や意思決定に関するKPIの責任者として責めることはできません。なぜなら、彼らはその決定には直接関与していないからです。同時に、非常に悪い予測であっても、運が良かったり、悪い予測にもかかわらず優れた意思決定を下す決定者がいる可能性もあります。

その結果、非常に良いビジネスKPIが得られる場合もあります。どのKPIが適切かは議論の余地がありますが、どちらの方向にもあり得ます。私自身は予測を評価する際、ビジネス成果ではなく、純粋に予測の正確性に注目すべきだと思っています。なぜなら、ビジネス成果は予測を作る人間や機械の手に負えないほど多くの要因によって左右されるからです。

非常に興味深いのは、私がいくつかのクライアントでシミュレーションした結果、予測の質—正確性の測り方については議論の余地がありますが—、特にバイアス、例えば非常に楽観的なバイアスがかかっているのか、あるいは適切にキャリブレーションされたツールを持っているのかによって、結果として得られる供給チェーン最適化エンジンが、非常に異なる方針を取る可能性があるということです。

つまり、最適な方針や意思決定の方法は予測の質に応じて変わる可能性があります。さらに、もし今日、政治的バイアスによってすべてが大幅に過大評価される予測から、実際に機械学習で作られた予測に移行する場合、同時にサプライチェーンの意思決定プロセスも見直す必要があるのです。

人々はそのプロセスツールエンジンに依存しています。歴史的に予測は常に30%高く出されていました。だから、もしそれを変更するのなら、供給プロセスも併せて変更する必要があります。両者は統合されるべきです。しかし、サプライチェーンの視点からは、できる限りKPIを独立して評価すべきだと思います。

Conor Doherty:ありがとうございます。スヴェン、あなたの意見は?改めて質問すると、もし予測が何か別のことを達成するためのツールであるなら、その価値はどこにあると考えますか?意思決定の質にあるのか、それとも予測の質にあるのか、自由に定義してください。

Sven Crone:その点には既に触れたと思います。私にとって、需要計画、すなわちガートナーの定義する需要計画やオリバー・ワイトのプロセスは、産業的な視点で捉えるべきものです。例えば製薬業界や消費財業界では、通常、あなたが注目するよりもはるかに長い期間、例えば6ヶ月から18ヶ月先を見据えています。費用のかかる判断は戦略的なものです。長期的な計画を立て、予測を行い、ギャップを埋める活動を行い、はるかに長い期間にわたって需要と供給の調整を試みます。プロモーション情報も天候情報も、disruption情報も持ち合わせていません。したがって、シナリオベースの計画や、在庫ポジションに具体化していくシナリオのエンドツーエンドの計画が求められるのです。

しかし、それは長期的な話です。大多数の業界では、依然として約3ヶ月間のフローズン期間が存在します。つまり、その期間外のタイムフレームを見据えているのです。一方、最近ガートナーに取り入れられたS&OEは、全く異なる視点でこれを捉えています。長期的な視点では、透明性やコミュニケーションが重要であり、変動する予算、再調整される予算、ボリュームとバリューの調整に備える必要があります。これは非常に集約的なプロセスであり、階層の上位、マーケット、チャネルを見ますが、個々の製品には焦点を当てません。

その後、日々の業務、すなわちS&OEの話になります。S&OEでは、自動化された意思決定や標準化された意思決定があり、正確性が重要である一方で、透明性(しばしば見落とされがちです)や堅牢性も重要です。しかし、この会議の発表の約85%が正確性について議論しているのが現状です。堅牢性に関するセッションも設けられており、これは喜ばしいことです。しかし、全体のプロセスを評価する上で最も重要なイノベーションは、予測付加価値だと思います。これは、各構成要素がどのように価値を追加しているかを見る、非常に経営者寄りの視点です。なぜなら、リソースは価値が追加される部分に投資すべきだからです。

残念なことに、これにはマスターデータ管理のようなものは含まれていませんし、それを測定するのは困難です。また、統計的な予測を実施する際に不可欠だと考えるデータクレンジングのようなものも取り入れられておらず、最終的に人間に依存する部分に焦点が当たっています。しかし、予測精度、すなわち一般的にはコスト加重やボリューム加重で全体のエラー指標を見た場合に、学者が手を出さないような指標で最適な意思決定がなされているかどうかを評価するのは難しいのです。本質的に見ているのは、付加価値が何であるかという点ですが、多くの需要プランナーが実際にツール内で統計アルゴリズムの選択を行い、その選択を上書きすることもできますが、その価値は統計アルゴリズム自体に帰属されます。つまり、今日の判断には大きな価値があり、それは測定可能だと思います。そして、多くの企業がこれを採用しており、付加価値はそのための良いツールとなっています。改めて言いますが、私は在庫パフォーマンスなど短期的なものに比べ、長期的な視点を重視しています。

Conor Doherty:では、ありがとうございます。

Alexey Tikhonov:予測精度の変化や改善、そして予測付加価値プロセスについて話す際、用語が混乱していると感じます。より適切な名称は『予測精度付加』であって『付加価値』ではないのです。なぜなら、私にとって「価値」とは即座に財務的な視点を喚起するものであり、その視点は意思決定によって左右されるからです。あなたのビジネスの成果は、下す意思決定とその実行の度合いに完全に依存しています。つまり、この視点には他に何も関与せず、意思決定とその実行のみが重要なのです。

意思決定について考えると、例えば、予測その1が意思決定Aにつながり、より正確な予測その2があるとします。その正確性の差がどれほどかは分かっていたとしても、問題は、このより正確な予測が実際に異なる意思決定につながるかどうかです。もし異ならなければ、たとえより正確であっても無駄なことになります。つまり、見かけ上はより良い付加価値があるにもかかわらず、財務的にはネットでマイナスになるのです。そして、もし意思決定が異なる場合、つまり意思決定Aから意思決定Bに切り替えた際に、追加でどれだけの利益が得られるのかを、投資したリソースとの差と比較してどのように評価するのでしょうか。私にとってこれは未解決の問題です。両方の予測モデルを用いて両方の意思決定の潜在的リターンを評価することは可能ですが、結局のところ、二つの選択肢を同時に試すための二つの並行世界は存在せず、最終的には一つだけを選ばなければならないのです。

さらに、意思決定の価値は予測そのものだけに依存するわけではありません。意思決定の推進要因など、他の要素も考慮する必要があります。例えば、私たちはエールフランスの航空機部品のMRO部門と協力しています。つい最近、彼らと共に意思決定エンジンを実装したところ、ロボットが航空機用の補助動力装置を数十台(全体で数百万ユーロ相当)購入するという大規模な発注が、ロボットによって引き起こされました。人々は「間違いだろう」と言いましたが、調査が始まると、どこかで誰かが市場平均よりもかなり低い価格を設定してしまったことが判明しました。そして、ロボットがそれをキャッチし、即座に実行指示を出したのです。これは予測精度とは全く関係ありませんが、この意思決定には計り知れない価値があります。

ご覧のとおり、私たちは予測精度に焦点を当てていますが、意思決定の価値に影響を与える他にも多くの要素が存在します。ですから、金銭的価値について語るとき、予測だけに注目するのではなく、意思決定を導く全プロセス、何が考慮に入れられ、どのような意思決定プロセスがあるのか、どの要素が重要でどの要素が二次的なものなのかを見直すべきだと考えます。

Sven Crone: 補足すると、私も同意しますし、最初のラウンドで既に述べられていたように、在庫に関する意思決定を行い、その上で在庫の意思決定を評価すべきだと思います。公平を期すなら、学術界では大多数の研究者が、あるいは多くのジャーナルが、これを良い実践または最低限の実践として採用しているのが現状です。生産経済学やISER、在庫協会のジャーナルをご覧になれば、サービスレベルやリードタイムに関するトレードオフ曲線上で実際に意思決定コストを測定し、それに伴う在庫コストを提示する学術発表が多数見受けられるでしょう。これは実務では全く見かけないものです。

実際のところ、これは非常に難しい作業ですが、可能です。もちろん仮定を設けなければなりません。サプライチェーンは複雑ですが、私はあなたに全面的に同意します。意思決定コストは正確に把握すべきです。しかし、ここでGranger(1969)の非対称損失関数に話が戻ります。通常、意思決定コストを直接把握することはできないため、何らかの仮定を設ける必要があります。私が大きなギャップ、もしくは見落としだと考えているのは、予測精度(測定方法は問いません)とそれに伴う意思決定コストとの関連性を確立できていない点です。

実際、私たちはそのための研究プロジェクトを実施しました。過去にこのような取り組みを公表した企業はジョンソン・エンド・ジョンソンのようにごくわずかです。つまり、予測精度が1パーセントポイント向上すると、その通常は加重コスト加重MAPEにより、完成品在庫や流通センターの急行生産コストなどで約800万米ドルに相当するのです。彼らはこの関係をどのように確立したかを詳細に示していました。私たちは最近、TESAを用いたボトムアップシミュレーションを発表しました。ウェブ上にあるいくつかの計算ツールは完全には信頼できませんが、予測のエラーが非常に高価である、という点、すなわち次の段階の安全在庫や在庫に関する意思決定に直接コストがかかるという事実は重要だと考えています。これは生産計画や原材料調達、長期的な意思決定には及ばない話です。

だからこそ、これは実際に見落とされている点だと思います。これが、企業の需要計画チームが依然として小規模である理由の一つです。もし自分たちの意思決定がどれほど高コストで、予測がいかに価値あるものであるかを理解していれば、もっと多くのリソースが割かれていたはずです。ちなみに、TESAにおける数値は、大まかには企業規模によりますが、具体的な数字を公開することは許されていません。例えるなら、1台のブガッティ・ヴェイロン分です。ブガッティ・ヴェイロンは価格が非常に固定されているため、在庫における予測精度1パーセントポイント向上は、直接的に150万ドルのコスト翻訳に相当します。現在、他の数社とも連携して、この点を確立しようと努めていますが、これは非常に重要な問題です。問題を直接解決し、意思決定コストを提示する必要があります。たとえプロセスが分離されていても、同様の評価は可能です。そして、これが欠けている要素だと思います。私は完全に賛同します。理想的には、在庫または意思決定コストとの直接的な連関を実現すべきであり、学術界でもその実践が進められています。

Conor Doherty: 議論されている点、特に仮定に関して、いくつかのポイントをまとめて進めたいと思います。つまり、需要計画者が「これは間違っている、手動で上書きする必要がある」という仮定もあれば、予測や自動化モデルの構築において採用される仮定もあります。これらは区別すべきものであり、名称がどうあれ、私の質問はこうです。今日話している内容について訓練を受けていない経営陣が、自動生成された予測と、例えばあなたの机、すみません、あるいはニコラスやアレックスの机を通った予測とで同じレベルの信頼を置くのは合理的でしょうか?

Nicolas Vandeput: 私のスライドに戻っていただければ、最も一般的な質問を数語で要約すると「どうすれば機械学習を信頼できるのか?」というものです。もちろん、機械学習を統計ツールに置き換えることもできます。しかし、私はこの質問を「では、人間をどう信頼すればよいのか?」に変えたいと思います。なぜなら、人々は「ニコラス、どうすればあなたを、あなたの機械学習を信頼できるのか?」と言うからです。そこで私は「では、あなたのチームをどう信頼するのか?」と問います。これが本質的な問題だと考えています。そして、これを追跡し回答するための唯一の方法は『予測付加価値』と呼ばれるものです。つまり、プロセスの各ステップの精度を追跡するのです。それが人間であっても、機械であっても、クライアントからの情報、クライアントからの予測であっても、すべてのステップにおいて、その前後の精度を追跡する必要があります。

そして、さらにプロセス全体の精度を、無料で利用できるようなシンプルな統計モデルなどの統計的ベンチマークと比較することをお勧めします。週単位、月単位、または日単位で、あなたの予測期間に応じてこれを行うことで、プロセスの中で人間であったり機械であったりする部分が、実際に価値を追加し正確であることを実証できるのです。これが唯一の方法です。もしこれを行わなければ、部屋の灯りが消えているのと同じで、暗闇の中にいて何も見えない状態になってしまいます。

また、需要計画の改善プロジェクトを推進したい企業から連絡が来ると、最初の質問は「予測付加価値を追跡していますか?」というものです。もし追跡していなければ、私のモデルが価値を追加しているか、うまく機能しているかどうかを判断する手段がなくなってしまいます。これが「どうすれば機械学習を信頼できるか?」という質問に答える最初の一歩です。それは「どうすれば人間を信頼できるか?」というのと同じ質問であり、その答えは、予測付加価値を追跡する必要があるということなのです。

Alexey Tikhonov: 私は、意思決定に焦点を移すことが重要だと考えています。どうすれば予測を信頼できるのでしょうか?予測が良いのか悪いのかは、その予測がどのような意思決定を推奨し、どのような意思決定が導き出せるかを見るまで分かりません。その観点から、実務者はしばしば非常に鋭い直感を持っています。もし非常識な意思決定が行われれば、彼らはそれを指摘し、なぜそう思うのかを教えてくれるでしょう。たとえば、購入注文が過剰な場合、適正な数量や良い購入の目安を示し、その理由を説明してくれます。ですから、予測精度の追跡は必要です。また、先に述べたように、人間が判断に基づいて予測を上書きするプロセスは、その介入効果が極めて短命であるため、ほとんど無駄だと言えます。

上書きの効果は次の年度まで持続するものではありません。おそらく次回の購入注文に影響するだけで、その次には影響しないでしょう。つまり、非常に高価で信頼性の低いリソースを投入していることになります。また、時間の都合で詳しくは語れませんが、その判断による上書きの背後にあるプロセスについても議論すべきです。これらは半定量的な性質を持っており、自動生成された予測のように問題を検査・分解して何が問題かを明らかにする厳密なプロセスが存在しません。したがって、可能な限り自動化する必要があります。では、どのようにして信頼を得るのでしょうか?それは、あなたが天気予報アプリを信頼するのと同じ方法です。たとえば、アプリが一貫した予測を行い、高い降水確率を示したときに実際に大抵の場合雨が降るのであれば、またはスパムフィルタのような技術であれば、信頼が構築されるのです。

メールクライアントに初めて導入されたときのことを思い出してください。誤分類されたメールの割合が非常に高かったため、スパムフォルダを頻繁に確認していました。現在では、連絡先に登録されていない人物からのメールが届いた場合のみスパムフォルダをチェックし、本当にそこにあれば「スパムではない」とクリックして、以後そのメールがスパムに振り分けられなくなります。ご覧の通り、信頼は時間をかけて醸成され、適切なプロセスが必要なのです。私たちはこれを実験的最適化と呼び、意思決定エンジンを微調整します。一度適切な結果が出始めたら、あとは指標を追跡するだけです。そう、予測精度を追跡するのです。もし大幅に変動した場合は、エンジニアが実務者とともに背後で何が起こっているかを検証する必要があります。しかし、この意思決定パイプラインに手を加えて手動介入するべきではありません。壊れた部分を修理し、その後はまるで機械のように運用し続けるべきです。メンテナンスを行い、車を運転するのと同じようなものです。

Sven Crone: そうですね、信頼は重要な問題だと思います。過去10年、20年を振り返れば、統計的予測を用いて実用化しようと試みた企業は非常に多かったのですが、なぜそこまで懐疑的な見方が生まれたのでしょうか?なぜ多くの企業が何度も試みては中断を繰り返したのでしょうか?過学習については誰もが知っていますし、概念実証やパイロットスタディの際、将来の変数すべてを用いたサンドボックス実験を行う際には非常に慎重な設計が必要であることも皆さんご存知です。そして、自由度やメタパラメータ、先行する指標が多すぎるために、ある分解での漏れ出しにより、実際には実現しない精度のレベルを簡単に約束してしまうのも容易なことです。ある精度を約束し、その後COVIDが発生し、経営陣はなぜ目標精度に届かないのか理解できなかったのです。私たちには明らかでしたが、彼らにはそうではなかった。そして、結果として信頼は失われたのです。

Sven Crone: 信頼、これは一般に情報システムの分野で扱われる技術受容の問題だと思います。技術受容は大きな問題であり、これをどう伝えるかを分析するためのカンファレンスも開催されています。そして、その一因は技術全般の受容度に関係していると思います。例えば、最初の数回は、サンフランシスコで自動運転車に乗ることに対して多くの人が懐疑的になるでしょう。もしかしたらそうでなくても、20年後には誰もがそれを快く受け入れるようになるでしょう。つまり、使い勝手が良く、何も問題が起こらない状態が信頼を築くのです。また、情報を適切に伝えることも必要です。しかし、答えは説明可能なAIにあるとは思いません。誰もが「アルゴリズムは自らを説明すべきだ」と言いますが、私自身、時系列で変動する12の季節指数に対してガンマ係数0.4がどのような影響を与えるのか必死に説明しようとしても、どのマネージャーも理解できませんでした。しかし、最終決定を下すトップのマネージャーは、この在庫への大規模な投資を信頼できるのか、そして自分のチームが効果的かつ効率的に働いているのか、最終的には判断しなければならないのです。

そして、私はそのために、統計に対する信頼が大いに失われたと考えています。おそらく、当時最先端とされたにも関わらず、劣るソフトウェア実装やサンプル内での過剰パラメータ化が原因でしょう。モデル選択に関する多くの証拠がこれを示しています。そのため、これらの革新の多くは広く採用されず、むしろ若く革新的な企業に取り入れられているのです。医学の分野で信頼を構築する一歩として、画像から乳がんを検出するという驚異的なケーススタディがあります。そこで、機械、つまりアルゴリズムは非常に高い正確性、真陽性率の向上、偽陽性率の大幅な低下を示し、個々の命にかかる莫大なコストが伴うにもかかわらず、医師たちはそれを採用しませんでした。1980年代に至っては、いくつかの意思決定プロセスが採用されなかったのは、信頼が得られなかったからであり、彼らは自分自身を他者以上に信頼していたのです。

現在、私たちが構築しているソリューションでは、AIが外れ値の補正を行いますが、その外れ値を需要計画に際立たせます。AIはモデル選択も行えますが、私たちはむしろ有意義だと判断した順位付けを強調します。データから読み取れる現象、例えば「これは非常に季節性が高く、かつ混乱がある」といった点を説明しようと努めます。この拡張的なアプローチは医師向けにも応用され、単に分類結果を示すのではなく、画像上で乳がんが検出される可能性のある箇所をハイライトし、「がんかどうか」という真偽の答えだけでなく、がんである確率を示します。これにより、時間が重要な状況下で確率順に並べ、明確にがんであるものやがんでないものだけでなく、不確実なものに注目することが可能となり、医師たちはその専門知識を実際に活用できるようになりました。 専門知識を活用することで、急速に大きな受け入れへと繋がったのです。

ですから、システムの設計、意思決定プロセスの設計が非常に重要であり、すべてが自動化に依存するわけではありません。というのも、ABCやXYZ、新製品、エンディング製品などが存在するからです。すべてを自動化すべきではなく、一部はAIで自動化し、他は透明性のあるシンプルな手法を用い、さらに別の部分は堅牢なアルゴリズムで自動化する必要があります。しかし現状、技術に対する受容と懐疑の度合いを考えると、たとえ皆が次の誕生日パーティーの計画にGPTを愛用していたとしても、拡張AIは信頼獲得への良い一歩であり、将来的には完全にAIで自動化が可能になると考えています。

Conor Doherty: それについてコメントしてください。さて、再度触れると、お二人とも非常に良い点を挙げてくださったので、その比較の一つを詳しく掘り下げたいと思います。アレクセイ、あなたは天気予報アプリの例を挙げました。つまり、気象学の基礎は長い間、確率的予測に基づいているということです。そしてそれを自律走行車と、少なくとも間接的に比較しました。その例を用いて質問を提起します。アレックスの例で言えば、部屋にいる全員に「来週は休暇を取らなければならず、目的地はバミューダだけだ」と告げられ、天気予報で来週津波が来ると伝えられたら、あなたは自費でバミューダに向かいますか?ほとんどの人は「いいえ」と答えるでしょう。では、まったく同じ金融と確率的予測の視点をもって、同じ人々全員を会社に集め、アルゴリズムで生成されたランク調整、リスク調整された決定の優先順位付きリストを示したらどうでしょう。ああ、絶対に信頼できません。これもまた、選択的な信頼の欠如なのでしょうか?ご意見をお願いします。

Alexey Tikhonov: 簡単にコメントさせていただきます。自動化における新技術の採用に抵抗する人間の本当の問題は、自分が不要になったり追いやられたりすることへの恐怖だと思います。実際、通常はその逆の現象が起こります。確かに、経済的に効率が悪い部分は自動化します。例えば、以前は弊社のウェブサイトを多言語で翻訳するために翻訳者を雇っていました。なぜなら、たくさん発行し、累計で約40万ユーロほど費やしていたからです。しかし今では、何かを発表するたびに、LLMで翻訳が行われています。

弊社には、Markdownページを入力として受け取り、Markdownのすべての構文やショートコードをそのまま保持しながら、翻訳が必要な部分だけを他の言語に翻訳するプログラムがあります。コストは非常に大幅に下がり、約2桁、つまり今では100分の1の費用で実現できるようになりました。では、人間の翻訳者に100倍の料金を払うべきでしょうか?そんなことはありません。では、今後も人間の翻訳者は必要でしょうか?必要です。例えば、法的文書を作成する場合、一語や一つのカンマが莫大な費用に繋がる可能性があるため、人間の翻訳者を使うべきです。ですので、人間の翻訳者は依然として必要ですが、異なる分野で必要とされ、法務分野での需要は従来以上になるでしょう。

同様に、サプライチェーンにも当てはまります。例えば、利用可能な人材が不足しているために現状がそのまま維持されている領域もあります。注文を出す際、最小発注数量(MOQ)があるかどうかが事前に分からないことが多く、その情報を取得する必要があります。人間を使うこともできますし、AIのコパイロットを使うこともできますが、構造が整っていない情報を意思決定エンジンに入力するためには、やはり人間が必要なのです。ですから、今後も人間は異なる種類の進化するタスクに対して必要であると思います。

Sven Crone: 機械翻訳技術の受け入れに関して、重要な部分に触れたと思います。IBMは1982年にすでにニューラルネットワークを使用していたのですから、存在はしていましたが、翻訳精度、あるいは誤訳率は約90%で、人間が多くの文字や単語を修正しなければならなかったのです。10語に1語は誤り、それは許容される基準以下であったため、受け入れられなかったのです。

そして今、もしある閾値を超える精度、必ずしも人間レベルではなくても、得られるのであれば、技術の大規模な採用が急速に進むのです。予測の分野では、ゼロを含む時系列に対して乗法モデルを不注意に適用した実装例も見られ、その結果、年に一度起こる現象がある100の時系列のうち10例で急騰すると、信頼が失われ受け入れられなくなるのです。

つまり、自動化を実現するためには、堅牢性を確保する必要があります。これも良い指摘だと思います。通常、我々は堅牢性のあるモデルではなく、正確性の高いモデルを構築しようとします。ニューラルネットワークには常にこの問題が付きまといます。また、我々自身も技術採用に積極的であるため、偏りがあるとも言えます。例えば、技術を心から愛する私の弟ほどではありませんが。年齢的な要素もあるのです。しかし、何が信頼を生むのでしょうか?例えば、ある大手ソフトウェア企業が上層部の会議でLLMモデルを積極的に検討しており、最近そのような決定がなされたという話もあります。また、IBF(Institute of Business Forecasting)のEric Wilson氏はブログで、AIが需要予測プロセスを全面的に支配することはなく、全員が職を維持できると率直に述べています。

しかし、最近、取締役会の場で、投入された膨大な知識―プロモーション情報、混乱、サプライチェーンなど―を学習したLLMモデルが最終的な予測を提示し、CEOが「なぜこの数字なのか」と尋ねた例がありました。人々はそれぞれ異なる見解を示しました。マーケティング部門は異なった意見を、財務部門はまた別の意見を持っていました。しかし、唯一、LLMモデルだけが、その数字が正しい理由を理解できる議論を提示することができたのです。そして、これはまた別の偏りを生む要因かもしれませんが、もし人々に説得力のある物語を語ることができれば、信頼が生まれるのです。たとえそれが間違っていたとしても。

ですから、例えば1000製品というコンテキストで、需要予測担当者がCEOとともに「なぜ6ヶ月後に数量が倍になるのか」を包括的に議論する場合、全ての数字を何ヶ月もかけて分析し、価値に変換し、各チャネルごとの上位からの調整を試みたにも関わらず、ふとその理由を思い出せなくなることがあるのです。しかし、LLMモデルはそれを論理的に説明することができました。これにより、「LLMモデルはすべての販売会議や主要顧客との打ち合わせを読み込むことができない」「すべてのファネル情報を取得できない」といった意見に反論できるのです。むしろ、ファネルを正当化し、サプライの数値と整合させ、はるかに多くのデータを処理できるため、人間よりも優れた調整を実施できる場合もあり得るのです。これにより、信頼を飛び越えて、直接的に精度へと進む可能性があります。しかし、実際にこれらのモデルは、現状の説明ができることで信頼を提供できるという証拠もあるのです。

Nicolas Vandeput: さて、興味深い質問が浮かんできました。そして、ついに私が反対するテーマにたどり着いたように思います。

まず取り組みたいのは、需要予測における機械学習の採用に関するチェンジマネジメントです。どんな技術にも賛否両論があります。LinkedInに投稿するたび、必ず同じ側から「それは決してうまくいかない。私は絶対にやらない」と言われるのが実情です。もう説得しようとはしないことにしました。皆さんは今のままでいてください。私はより良いサプライチェーンを作ろうとする人たちと共に働いていきます。

これまでに多くのクライアントを見てきましたし、すばらしいリーダー、平均的なリーダー、そして劣ったリーダーも見てきました。自動化プロセスを成功裏に実装したいのであれば、どのプロセスであっても、部屋にいるリーダーが全員に将来の各自の役割について明確なビジョンを示す必要があります。需要予測に戻りますが、これはどのプロセスにも当てはまります。もし需要予測担当者に「あなたの仕事は予測を変更し、モデルを修正・調整することだ」と伝えたら、人々はその通りに動くでしょう。しかし、業務は変わるべきです。今後は、需要予測エンジンに投入するデータをできるだけ良いものにし、モデルに供給される情報の範囲を超えて、新たな情報を見つけ出し、必要に応じて予測を補強することがあなたの仕事になるべきです。そう伝えなければ、人々は給料を正当化するために毎日予測を変更し続けるでしょう。つまり、採用のためには、皆が何をすべきかという明確なビジョンを示すことが極めて重要なのです(これは、私の洞察に基づくレビューやインサイト収集のスライドにも関連しています)。

さて、ここで付け加えたいのは「説明可能性」についてです。これは未解決のテーマであり、私自身も理解を深めている最中ですが、私にとっては説明可能性は全く必要ないと考えています。車の仕組みが分からなくても使い続けますし、もしその仕組みを知ったからといって「もう使わない」とメルセデスにメールを送るようなことは決してしません。インターネットの仕組みすら分からなくても、何の問題もなく利用しています。

もしサプライチェーンが、予測結果の利用や信頼において説明可能性や物語性に依存するならば、スケールアップは決して達成できません。なぜなら、プロセスがある人間の説得力―つまり、良い物語を持っていて他人に予測を使わせるための能力―に依存してしまうからです。私にとって必要なのは、予測の精度がどのような指標であれ信頼でき、長期的に精度や意思決定の有意性が示されることなのです。つまり、物語が理にかなっているからではなく、定量的に優れているからこそ、物事、プロセス、人々、そしてモデルを信頼するのです。単に物語だけに頼れば、それは失敗に終わります。実際、物語の良さだけでプロジェクトを獲得し、その後、モデルを稼働させても価値が生まれなかったコンサルタントを何度も見てきました。だからこそ、私はできる限り物語には依存しないようにしたいと思います。

Conor Doherty: ほかにコメントはありますか?義務はありません。

Alexey Tikhonov: 説明可能性、つまり物事がどのように進行し、意思決定や予測がどのように生み出されるのかについて、少しだけ触れさせてください。

私が話せるのは、Lokadで取り組んでいることだけです。私たちは「設計時からの正確性」という原則で問題に取り組んでいます。多くの人々が抱く問題の一つは、物事の仕組みが理解できないために信頼が欠如することです。そこで私たちは「ホワイトボックス化」と呼ぶ手法を採用しています。できるだけ、パラメーターの意味が理解できる明示的なモデルを使い、分かりにくい特徴量エンジニアリングは避けています。こうすることで、誰もが物事の進行状況を理解できるのです。これらのモデルは決して理解しにくいものではありません。皆さんには、ぜひ我々のM5予測コンペティションへの提出物をご覧いただきたいと思います。Lokadチームは、不確実性チャレンジで1位にランクされました。弊社CEOであるJoannes Vermorelによる講演をご覧いただければ、このモデルが非常にシンプルであることに驚かれるでしょう。たかがシンプルなモデルが、最先端の結果を出せたのです。

予測精度を僅かに向上させるために、最先端のAIを使用する必要はありません。サプライチェーンでは、厳密に正確であるよりも、大体合っていることが重要です。だからこそ、例えば確率論的手法を選ぶのです。これにより、不確実性の構造が示され、経済的要因と組み合わせることで、その不確実性の構造を金融リスクの構造に転換し、サービスレベル目標の達成に単にランク付けされるのではなく、リスク調整された十分な根拠に基づく意思決定が可能になるのです。

人々は、大局的な「何をしているか、なぜそれをしているか」という話は理解できます。しかし、細部に立ち入ると、好奇心があれば理解するかもしれませんが、大局が把握できればそれほど重要ではありません。例えば、通常、人々はコンピュータを使用しますが、ランダムアクセスメモリがどのように計算を処理しているかといった内部のメモリ割り当てには興味を示しません。誰もそんなことに関心はありません。車内のコンピュータチップについても同様です。確かに、ロボットがギアのシフトを制御していますが、通常はその仕組みに興味を持つ人はいません。それは本質的な意味を持たず、知っていたところで運転が安全になるわけではありません。

Conor Doherty: 実は締めの言葉をお願いしようと思っていました。皆さんは、これらの手法の「どのように」は、必要な訓練を受けていないと理解が難しい一方で、「何が」起こっているか、たとえば精度が上がっているのか、より良い意思決定がなされているのかは理解できると広く認識しているように思います。では、締めとして30秒ほど、需要予測担当者の未来はどうなるとお考えですか?既に皆さんのお考えは想像できるのですが、ニコラさんとスヴェンさんの場合、以前「完全なエンドツーエンドの最適化自動化にはまだ至っていない」と示唆していたように見受けられました。あなた方の視点から、5年後、10年後には需要予測担当者の職は存続しているのでしょうか?

Sven Crone: 外部のデータ利用や技術の採用率を考えると、需要予測担当者の仕事は今後5年以上先も必ず存在すると確信しています。企業がリストラクチャリングやイノベーションを迫られる圧力はそれほど大きくなく、デジタル化への取り組みを見ても、多くの企業はクラウドストレージすら導入していないのが現状です。ヨーロッパの大手多国籍企業がこれほど順調に運営できているのは驚くべきことです。

それはおそらく、素晴らしい人材が存在するからでしょう。しかし、長期的には、採用しなければ、もしソフトウェアベンダーが採用しなければ、自動化せずに履歴修正のような意味のある意思決定をサポートしなければ、本当に危険だと思います。そして、私が主張したいのは、説明可能性は「ニューラルネットワークがどのように動作するか」を理解するためではなく、「これらはどの入力変数が投入されたか」を把握し、「プロモーションが5週目から12週目に移動したことを考慮しましたか?」といった質問に答えられるために重要だということです。これらの質問は非常にシンプルなものです。

しかし、長期的には、利用可能なデータが増えるにつれて、需要プランナーにとって非常に困難になると思います。意思決定の頻度が高まっているため、私たちは月次から週次、さらには小売業者に合わせた週内予測へと移行していくでしょう。プロモーションが増え、混乱も多発しています。これほど多くの混乱が起きると、短期間で膨大な情報に対処するのは実質的に非常に困難になるでしょう。したがって、すべてのデータが揃っているとしても、長期的には機械学習モデルと精度や信頼性の面で競争できるとは思えません。

Conor Doherty: ありがとう、Sven。Nicolas、あなたの締めくくりのご意見をお願いします。

Nicolas Vandeput: わずか1分でまとめると、今後数年間で需要プランナーの役割はどのように進化するのかということになります。私にとって、彼らはほとんどの時間をデータ、情報、洞察を収集、整理、構造化、クレンジングすることに費やし、その大部分を機械学習モデルに入力する人々です。需要予測は自動化され、機械学習モデルに投入できない情報や洞察は、これらのプランナーが手動で補足して予測に反映させるでしょう。しかし、彼らは外れ値の検知や手動での修正、モデルの微調整、パラメータの調整、モデルの選定などに時間を割くことはありません。これらの作業は100%自動化されるべきであり、人間が行うべきではありません。プランナーは、情報と洞察の発見、収集、クレンジングに専念するのです。

Conor Doherty: ありがとう。そしてAlexey、あなたの締めくくりのご意見は?

Alexey Tikhonov: 私は、現在、需要計画は「インテリジェンスシステム」と呼ばれるソフトウェア製品のニッチな領域を占めていると考えています。その理由は、企業向けソフトウェアは通常、システム・オブ・レコード(例えば ERPs やその他のトランザクションシステム)、システム・オブ・レポート(ビジネスインテリジェンスアプリケーション)、そしてシステム・オブ・インテリジェンスの3種類に分類されるからです。システム・オブ・インテリジェンスは新興の分野であり、意思決定の自動化が可能なシステム、たとえばLokadがクライアントに提供しているシステムなどがこれに該当します。そして現在、需要プランナーはこの分野との競争を試みています。

私の理解では、長期的には彼らは競争に勝てず、敗れるでしょう。なぜなら、人間は素晴らしい存在で非常に賢いものの、単一の意思決定においてはロボットを凌駕し、常にロボットが気づかない追加の情報や優れた洞察を生み出すからです。しかし、これはスケールアップできません。人件費は高く、私たちは非常に大規模なサプライチェーンについて扱っているため、これを拡大することはできません。これが、長期的に見て彼らが置き換えられる主な理由です。同じ理由から、パリではもはや水運び人はおらず、水道が普及しています。なぜなら水道は安価だからです。もちろん、未開発国の小さな村では、規模の経済が働かずバケツで水を運ぶ人々がまだ存在しますが、いずれその村にも水道が導入されるでしょう。ですから、長期的には彼らの役割はなくなるのです。そして現時点で、すでに一部の企業はその体制を廃止しています。

Conor Doherty: ステージ上の皆さん、洞察とご回答、誠にありがとうございました。ここでマイクをお譲りします。ご質問はございますか?では、私が急いでマイクをお渡しします。もちろん、マイクは後方にあります。さて、あまり多くないはずですが、Robert、では手を挙げたのはどなたですか?

Audience Member (Bahman): 皆さん、ありがとうございます。私の名前はBahmanです。Cardiff Universityから参りました。非常に短いコメントをさせていただきます。利益を生む意思決定について言及されましたが、ここで強調したいのは、実際にSvenも触れた「スペクトル」の点です。利益追求を目的としていない何千ものサプライチェーンが存在することを考慮すべきだと思います。

私の理解では、パネルは主にサプライチェーンに焦点を当てていましたが、需要計画には全く異なるスペクトルが存在します。考えてみれば、世界中の何百万もの病院が需要計画を行っており、1つ、2つ、または3つの時系列データを扱っています。だからこそ、私の質問は、予測を一つの入力として依存する中で、自動意思決定を行うための条件や要件とは何か、という点に関するものです。他にも多くの入力があり、その一部は予測かもしれませんが、大部分はそうではないのです。

Sven Crone: その質問にお答えしてみます。例えば、病院ではreplenishmentの大量在庫、血液のような重要な製品、あまり重要でない製品、さらにはがん治療薬など、注文生産や在庫生産される製品が存在します。私の経歴は病院や医療システムにあるわけではないので、業界やサプライチェーンマネジメント、物流といった、Gartnerによって定義される大企業が導入している明確に定義されたプロセスに焦点を当てました。これらのプロセスは試行錯誤を経て検証され、予測付加価値を測定しています。

確かに、あなたの言う通りで、これは薬局や病院など、他の多くの産業にも適用可能でしょう。しかし、その分野での採用例についてはあまり根拠がありません。ただし、世界GDPのおよそ6分の1を占める大企業が主導する物流サプライチェーン産業では、こうした事柄に関するイノベーションの欠如が大きな問題となっています。しかし、これが他の分野に適用されるべきでないという意味ではありません。

Audience Member (Bahman): つまり、もしかするとより適切な用語は「サービスサプライチェーン」かもしれません。例えば、病院では救急サービスのための需要計画が行われています。それは必ずしも製品に関するものではなく、サービスそのものに関するものです。ですから、私の質問は、より自動的な意思決定を行うための要件に関するものです。救急部門では、実際には1つの時系列しか扱っていない場合があり、そこで数百万、数千の時系列を扱うわけではないからです。

Sven Crone: あなたの言う通りだと思います。非常に興味深い分野で、予測コミュニティとしては、他の分野ほど注目してこなかった多くの領域があります。例えば、神経ネットワークを用いた予測に関する1万件の論文のうち、その半数が電力に関するものであるのに対し、製薬に関する論文はほとんどありません。これは良い指摘だと思います。もっと重要な事柄に注目すべきです。

Conor Doherty: すみません、ニコラ、途中で切ってしまいました。次の質問にお答えいただいて構いません。次の質問にバトンタッチしたいと思います。

Audience Member: こんにちは、とても素晴らしいディスカッションをありがとうございました。私の質問は判断の役割に関するものです。すべての専門家は異なる判断基準を持っているため、人間の判断から生じるバイアスと、AIまたはMLモデル(いずれかの統計モデル)から生じるバイアスというパターンがあります。つまり、人間の判断と統計モデルの両方からバイアスが生じるので、需要計画を行う際に、人間の判断によるバイアスを統計的なバイアスにどのように組み入れて全体のバイアスを減らすことができるでしょうか?よろしくお願いします。

Nicolas Vandeput: ご質問ありがとうございます。これは私がサプライチェーンで直面する典型的なケースです。まず、過去の予測実績を確認します。もし予測に非常に高いまたは非常に低いバイアス、つまり過大予測や過小予測が見られる場合、必ず理由が存在します。多くの場合、人々は安全側に回りたいという気持ちから、供給プロセスがうまくいっていないことや在庫管理の方法が分かっていないために過大予測をしてしまいます。そのため、方針や安全在庫目標を見直す代わりに、非常に高い予測に依存してしまうのです。あるいは、楽観的になりたい、予算に合わせたいという理由で非常に高い予測をする場合もあります。

一方で、過小予測は、人々がボーナス獲得のために予測を下回ろうとすることから生じるかもしれません。通常、もしサプライチェーンで非常に大きなバイアスが発生している場合、それは不適切なインセンティブや供給プロセスの問題であり、その仕組みを解消し、人々の再教育や供給プロセスの改善を行い、特定の人物が予測を高くまたは低く変更できないようにする必要があります。これはプロセス面の問題であり、予測を極端に操作するインセンティブがない人々に依存すべきです。

モデルに関しては、長期にわたって非常に高いまたは非常に低い予測を生成するモデルがある場合、一ヶ月だけの誤差ではなく、複数期間にわたって同じ問題が発生しているとすれば、それはモデルエンジンの最適化方法に起因する問題である可能性が高く、最適化に使用されるKPIが適切でないことが原因であると考えられます。おそらく、MAPEに依存していると推測されますが、それはまた別の話題です。

Conor Doherty: アレクセイに結びの言葉を述べる機会を与えていただけますか? もうすぐ終了しなければならないので。

Sven Crone: ニコラスの発言に付け加えたいことがあります。LLMが判断を下し、その判断に対する調整を行うという話をする際、その仕組みについて詳しく触れていませんでした。しかし、最近の多くの証拠は、すべてのデータを一つのLLMで学習して一つの価値を算出するのではなく、実際にはペルソナを使ってトレーニングすべきであることを示しています。つまり、サプライチェーン用のLLM、ファイナンス用のLLM、CEO用のLLM、マーケティングおよびキーアカウント管理用のLLMが、それぞれ異なるデータで訓練されるのです。多くの場合、これらのバイアスはキーアカウントとサプライチェーンの意思決定に伴う異なるコストから生じています。しかし、エージェント同士が対話し合い、統合されたプロセスを議論することで、実際に得られる情報が向上し、意思決定が洗練される可能性があります。

S&OPにおいて合意に達するという良い実践が見られることは珍しくなく、その合意は単一のLLMの判断よりも正確である場合が多いです。バイアスが存在し、意思決定プロセスがある中で、最終的に誰かが情報に重みを付けて決定を下すのは非常に恐ろしいことです。それはまるで幽霊のようです。

Conor Doherty: アレックス、最後の一言をお願いします。それから終了しましょう。

Alexey Tikhonov: 同じ質問についてですが、私の考えでは、このバイアスはポイント予測という視点での問題です。通常、意図的に予測にバイアスをかけるのは、リスクの構造を捉える上で予測が単純すぎるためです。最も起こりうる未来のシナリオを予測し、その上でモデルの残差が正規分布に従うと仮定しますが、実際はそうではありません。だからこそ、大部分のリスクが集中している方向、例えば右側の裾に予測をシフトさせるバイアスを導入するのです。サービスレベル目標を達成できない裾の確率を予測するためにバイアスをシフトさせるのです。

確率的な視点に切り替えれば、このバイアスは不要になります。なぜなら、あなたが得るのは「この未来がこの確率で、あの未来がこの確率で起こる」という意見だからです。リスクの構造を十分に正確に捉えるパラメータを訓練できれば、その上にコストや利益、さらにはトレードオフの意思決定を可能にする上位の要因といった経済的な視点が加わるだけで済むのです。たとえば、予算が常に制約されている中で、どちらか一方の製品を追加で購入すべきかを判断する場合などです。確率的な視点を持てば、この問題は解消され、バイアスが不要になります。

Conor Doherty: それでは、時間が少しオーバーしてしまったことは承知しています。追加の質問がある方は、ステージの隅で受け付けます。改めて、Sven、Nicolas、Alexey、本日はご参加いただき誠にありがとうございました。良い一日を。