00:00:00 サプライチェーンにおける生成型AIの影響
00:02:06 AIにおけるプロモーションの現実
00:03:35 生成型AIの可能性と誇大宣伝の比較
00:04:56 AIの可能性に対する前向きな見通し
00:06:54 技術の早期導入リスク
00:08:21 好奇心駆動型の成長のためのAI活用
00:10:14 現代のスマートなウィキペディアとしての生成型AI
00:11:34 言語モデルがプロセスに関する洞察を提供
00:13:39 大型言語モデルによる顧客フィードバックの拡大
00:15:37 自然言語を用いたユーザーインターフェースの進化
00:17:38 大型言語モデルによる分析を通じた文書生成
00:19:43 仲間として見なされる大型言語モデルが影響を変える
00:21:37 デジタル同僚との未来の意思決定
00:26:46 賢明なAIエージェントへのタスク委譲
00:29:02 需要計画における効率向上
00:30:58 予測と価格設定のダイナミクスに関する洞察
00:32:51 需要レビューの議事録が成熟度を高める
00:35:08 ジョアネスがAIの将来の可能性を探る
00:37:14 ミーティングでの議論のリンク付けは大型言語モデルには困難
00:40:26 需要レビュー会議がパフォーマンスを向上させる
00:44:34 AIツールがミーティングの参加形態を変える
00:48:49 コミュニケーションの進化がプライバシー問題を浮き彫りにする
00:52:39 技術がビジネスの秘密保持慣行に影響を及ぼす
00:55:43 生成型AIが認識の変化を探る
00:57:00 アルゴリズムにおけるAIの複雑な現実 vs. 生成型AI
00:58:10 生成型AIがブロックチェーンの後継となる
00:59:45 文化的機能不全が資金の浪費を引き起こす
01:00:38 直感が生成型AIによる財務的浪費を防ぐ
01:03:00 経営層向けの実践的なサプライチェーン教授法
01:05:39 現代における知的タスクの機械化
01:09:02 自動化による生産性の展望
01:11:02 フェアウェルを伴うインタビューの締めくくり
概要
生成型AIに関する話題は、財務諸表を凌駕している。短期的な成果は控えめであり、事務作業の高速化、より賢明なトリアージ、ミーティングの規律などが、人間の関与のもとで見られる。長期的には、インセンティブが整えば、コンテナ輸送のような変革を引き起こす可能性がある。禁止措置は単に利用をスマートフォンに押し込むだけであり、ガードレールの方が規制よりも効果的である。 「価値のギャップ」とは技術そのものではなく、調達における見せかけに問題があることを示している。リーダーには、600問に及ぶRFPではなく、機械的共感と実証が求められる。大型言語モデルは学習しない。文脈やRAGがボトルネックとなるため、情報のキュレーションが重要である。経営層にとっては、知的作業を機械化するか、さもなくば競争に遅れをとるかの選択であり、現場では、単調な作業の軽減やより良いデフォルト設定によってプランナーの業務効率が向上する。 楽観論者は5年、悲観論者は20年と予測している。いずれにせよ、今日のスプレッドシートに依存する現状は、限られた時間しか持たない。
詳細な概要
生成型AIは、財務諸表以上の話題を呼んでいる。パネルは、サプライチェーンにおける短期的な影響は控えめだが確実に存在すると認識しており、事務処理の高速化、文書トリアージの改善、反復作業の軽減などが挙げられる。長期的には、組織がインセンティブや期待を整えれば、コンテナ輸送と同様の大きな変革をもたらす可能性がある。誇大宣伝は「解決策」を約束する一方で、現実はトレードオフを提示している。
二つの力が逆方向に働いている。一方では、実用的な成果があり、言語モデルは「スマートな参照」ツールとして機能し、脆弱なRPAのユースケースを安定させ、自由形式の顧客や供給業者からのフィードバックからシグナルを抽出し、会話型のダッシュボーディングを可能にする。また、指導を受けた「デジタル同僚」としてミーティングを行動と成熟へと促すこともできる(ただし、人間が関与している場合に限る)。一方で、技術的な限界も無視できない。今日の大型言語モデルは、真に学習するわけではなく、静的なパラメータと増え続ける文脈ウィンドウの中で動作するため、逆に気を散らす要因となる。いわゆる「知識のフライホイール」は、技術的な問題に偽装された組織上の問題であり、RAGは助けになるものの、スケールと関連性のフィルタリングには依然としてコストがかかる。
政策の選択には結果が伴う。大型言語モデルの使用を禁止しようとする企業は、時間の節約効果があまりにも大きいため、個人デバイスでの回避策を見出すだろう。プライバシー、データ管理、支出といった合理的なガードレールは、シャドーITを誘発する一律の禁止措置よりも効果的である。適切に用いられる透明性は、エンドツーエンドのパフォーマンス向上につながるが、本能的な秘密主義はしばしば利点よりも機能不全を助長する。
「生成型AIの価値ギャップ」は、技術自体よりも調達の儀式に関する問題を示している。経営者が技術に対する「機械的共感」を欠くと、世界の飢餓を解決するためのパイロットプロジェクトに賛同し、その後その分野を失望すべきものと宣言してしまう。解決策は、単なる流行語ではなく、実データに基づく概念実証、測定可能な成果、そして供給チェーンをコストのサイロとして扱うのではなく、利用可能性を収益とマージンに結びつける物語による、より良いガバナンスである。
取締役会レベルでは、事例は単純だ。21世紀は、20世紀が物理的作業を機械化したように、知的作業を機械化する。事務作業の自動化を進める競合他社は、より速く、より正確に動くだろう。現場では、単調な作業を排除し、より良いデフォルト設定を提示し、プランナーの効果を高めるツールを提供することが求められる—ただし、システムがブラックボックスになることなく。
タイムラインは楽観論者と悲観論者を分ける。もしモデルが文脈処理を改善し、組織が知識のキュレーションを学べば、意味のある成果は5年以内に現れる可能性があるが、文化やプロセスが遅れれば、20年が現実的となる。いずれにせよ、ダッシュボードの壁、スプレッドシートによる単調作業、そして劇場級の選抜プロセスといった現状は、複利的な効率向上と接触すると存続できなくなるだろう。
全文書起こし
Conor Doherty: サプライチェーンでは、少なくともここ2年間、生成型AIについての話題が絶えませんでした。しかし、2025年9月には、そのトーンが少し変わりました。今、皆は「それはどのような違いをもたらしたのか?」そして「その違いはプラスなのかマイナスなのか?」という、若干異なる質問をしています。
さて、本日のゲストであるクヌート・アリックが、ジョアネスと私と共にパリのスタジオに加わり、この問題について議論します。クヌートはマッキンゼーの名誉パートナーであり、25年以上にわたってサプライチェーン管理を教えてこられました。そして何より、彼はサクソフォンが非常に上手です。
議論に入る前にお伝えしておきますが、もし私たちのLokadでの活動を気に入っていただけたなら、LinkedInでフォローし、YouTubeチャンネルを購読してご支援ください。では、本日のクヌート・アリックとの対談をご覧ください。
クヌート、本日はご参加いただきありがとうございます。スタジオにお迎えできて大変うれしいです。これはLokadTVでの3回目のご出演かと思います。
Knut Alicke: はい、そう思います。今回が実際にお会いできる初めての機会でもあり、本当にうれしく思います。そして、実はあなたが新しいLokadのソファに初めて座る方でもあります—もちろんジョアネスさんと共に、プロフェッショナルに初披露という形で。
さて、始めるにあたって、クヌート、既に多くの方があなたのことをご存知だと思います。あなたはマッキンゼーの名誉パートナーであり、25年間、サプライチェーンサイエンスおよびサプライチェーン管理を教えてこられました。そこで最初の質問ですが、どうやってサクソフォンを演奏する時間も見つけているのですか?
振り返ると、サクソフォンを演奏することが本当に好きで、軍隊時代はバンドで演奏していました。そのとき、普通の学生以上に練習に熱中するようになりました。自分のレベルを維持するために、夜間や週末に練習し、常に自分を忙しくさせるバンドを持つようにしているのです。
Conor Doherty: 一言記しておくと、あなたは軍隊で音楽を演奏していたのですね。つまり、多彩な人生を歩んでこられたわけですが、それはビジネスやサプライチェーンへのアプローチに影響を与えているのでしょうか?
Knut Alicke: そうは思いません。当時は影響を受けるには若すぎたので、19歳の時は、朝から夜まで練習し、その後ハンブルクで素晴らしいコンサートを楽しむという一年間をただ満喫していただけです。多くのジャズコンサートに通い、腕を磨いたことが、私にとっての唯一の影響でした。
Conor Doherty: ここにいる皆、ジャズのファンであると同時に生成型AIのファンでもあります。それがこのスタジオに集まった理由だと思います。ジョアネスさん、すぐにお話を伺いますが、まずはクヌート、テーブルを整えてください。私が一つの主張と質問を提示しますので、その後でお答えください。
主張は次の通りです。サプライチェーン—いや、世界全体が—少なくともここ2年間、生成型AIに沸いています。そして、それはサプライチェーンの風景を変えたのです。質問は、あなたはこれに同意しますか?もし同意するなら、それは状況を改善したのでしょうか、それとも悪化させたのでしょうか?
Knut Alicke: まだ大きな変化は起きていないと言えます。ただ、生成型AIは今後、サプライチェーンの管理と運営方法を大きく変えると考えています。私はそれを、貨物のグローバルな流れを変え、効率化と標準化をもたらしたコンテナの発明に例えています。生成型AIに関しても、同様の転換点に来ていると感じています。
同時に、現状は明らかに盛り上がっています。人々は新技術の短期的な影響を過大評価し、長期的な影響を過小評価しがちです。今日、私たち全員がChatGPTを使っているように、生成型AIがサプライチェーンのパフォーマンス向上やプランナーの業務を楽にする可能性を考えると、今後数年で多くの変化が見られるでしょう。しかし、まだ初期段階であり、わずか2年しか経っておらず、モデルは急速に進化しています。状況は変わるでしょうし、後ほどより詳細な事例についても議論するつもりです。
Conor Doherty: ジョアネスさん、クヌートの意見に同意されますか?現状は改善されているのでしょうか、それとも悪化しているのでしょうか?
Joannes Vermorel: はっきり言って、状況は改善されていると考えますが、その影響はまだ小さいです。個々の分野では非常に良い成果が見られており、これらのツールは極めて有用です。現時点では、事務的な作業を迅速にこなすためにサイドでGPTを利用するという点が話題になっており、これは非常に良いことです。
モデルは著しく進化しています。より大きな文脈を扱えることで、長い文書をアップロードし、「この契約書に、これこれに特有の条項があるかどうか調べてください」と指示できるようになりました。以前は50ページの文書をスキャンしてその部分を見つけるのに1時間かかっていたのが、今では30秒でできるのです。これは非常に素晴らしい点です。
将来的にはどうなるかは見守ることになります—短期的な影響と長期的な影響についてのあなたの意見に同意します。しかし、現状、我々が教えているように、生成型AIによって非常に厄介な問題も生じています。今日では、学生が宿題を完全に丸写ししてしまう状況すら起こり得ます。もはや「学生の宿題」という概念はなく、ChatGPTが全てを片付けてしまうのです。教授にとっては、スペルミスのない答案を提出する学生全員に低評価を与える以外、真偽を見極めることはほぼ不可能です。なぜなら、スペルミスがなければ、ChatGPTが作成したと判断せざるを得ないからです。
このギャップによって誤った教育を受けた人々が出てくることは、様々な問題を引き起こす可能性があります。しかし、企業において生成型AIを積極的に取り入れてリスクを取っているのは、いわばバイブコーディングに全面的に取り組む企業のようなものであり、サプライチェーンにおいてはまだ始まったばかりの分野です。
私の理解では、現状での利用は非常に表面的なものに留まっています。実際に活用されている例は、間違いなく低いハードルでの迅速な成果、すなわち「低い果実」を取るような簡単な勝利に過ぎません。より危険で複雑、かつ大きな影響を及ぼす用途は、私の知る限り、まだ始まっていません。
Knut Alicke: これについてコメントさせてください。いくつかの考えがあります。インターネットが始まった25年前を振り返ると、多くの企業がインターネットの利用を基本的にブロックしていました。従業員がニュースを読んだり私的なことに走ったりするのを懸念していたのです。しかし、今日ではそれが普通となり、大きな価値を生み出しています。
現在、多くの大企業がChatGPTやその他の大型言語モデルの使用をブロックしていますが、それは最悪の選択です。従業員に正しい使い方を教育する必要があり、秘密情報をアップロードせずに利用できる環境を整えるべきです。最終的には、学び、機会を探求する好奇心旺盛な組織を目指すべきです。
学生に対しても同様です。私が教える際には、「この問題もChatGPTを使って解き、どこが正しく、どこが間違っているかを分析してください」と求め、使用を促しています。そうしなければ、何が可能かを学ぶことはできません。
Joannes Vermorel: 私は、LLMをブロックする企業は、2000年代初頭に起こったことを再体験することになると思います。当時、人々は面倒な制限を回避するために、モバイルデバイスとEDGE接続を用いてインターネットに接続していました。企業レベルでブロックしても、人々は自分のスマートフォンの個人アカウントで利用するでしょう。なぜなら、事務作業における生産性向上のメリットはあまりにも大きく、抵抗するのは極めて困難だからです。
5分で済む作業があるのに、なぜか3時間も費やすべきだと誰かに正当化させるのは非常に難しいです。一度、その作業に対して道徳的正当性を感じると、他のすべての作業にもそのツールを使いたくなる誘惑が非常に強く働きます。
Conor Doherty: これは短期的/長期的な視点に関わる問題です。短期的には、クヌート、生成型AIがサプライチェーンにおいてもたらした主なプラスの影響は何だとお考えですか?
Knut Alicke: 私たちがよく見ているのは、何かが理解できないときに、非常にスマートなウィキペディアとして活用できるということです。調べて学ぶことができるのです。また、非常に事務的で反復的なタスクに対しては、私が「スマートなロボティック・プロセス・オートメーション」と呼ぶ手法が有効である事例も見受けられます。従来、プロセスが少し変わるとRPAは再プログラミングを余儀なくされ苦戦しましたが、ここでは初期の成功例が確認されています。
もし少し先に進んで考えるなら、私がGenAIアプリケーションに求めるビジョンは次のようなものです。サプライチェーンにおける典型的なプロセスは、アルゴリズム的な観点から明確に定義されているはずですが、現実は全く異なります。人々はそのルールを回避する方法を見つけます:数字の手動変更、信頼の欠如、その他いろいろ。その結果、期待通りにはいきません。
ここで言語モデルの力が発揮されます。データからは、なぜプロセスがうまくいっていないのか、その理由が見えません。ただ、forecast accuracy(予測精度)が低下しているのがわかるだけです。なぜでしょうか?それは、この人物が数字を変更したからです―そして、その理由が理解できないのです。では、「サプライチェーン・アバター」、つまりデジタルなヨアネスがその数字を変更した人物と対話し、徐々に何が起こっているのかを明らかにしてみてはどうでしょうか?本当の理由は、彼らがプランナーを信用していなかったり、顧客に尽くしたかったり、過去に在庫切れが起こった結果かもしれません。そうすれば、信頼を構築するか在庫を増やすことで解決できます。ここで、モデルが大きな価値を提供できるのです。
Conor Doherty: これは、プロセスを間接的に改善するためのツールのようなものです―議論を通じた対話、「なぜそうしたのですか?」という具合に。ヨアネス、LLMを組み込んで、ほぼ自動的にプロセスを変革する他の例はありますか?
Joannes Vermorel: はい。たとえばサービスの質を考えてみましょう。多くの企業は、さまざまな形態のNet Promoter Scoreを採用しています。週に一度や月に一度、顧客にアンケートを実施し、B2Cの場合はサンプル調査を行うこともあります。従来の方法は選択式の質問―非常に低解像度です。なぜそのような方法を取るのでしょうか?というのも、他の方法では200~500件もの自由形式の回答が集まり、何かしら処理するのが困難になるからです。
LLMを使えば、あらかじめ決められた枠組みに顧客を無理に当てはめる必要がなくなります。もしかすると、顧客はあなたが問題だとも気付いていなかった点について、文句を言うかもしれません。「英国式ではなく、米国式のプラグの付いた機器が届きました。自分でなんとかしましたが、とても煩わしかったです。」あなたのチェックリスト「製品に損傷はありましたか? はい/いいえ?」では「いいえ」と答えたとしても、実際には問題が残っているのです。
従来、自由形式のものはどれも面倒でした。仕入先に関しても同様です。LLMを活用すれば、パートナーが自由形式で入力した情報を、問題を狭い枠に当てはめることなく統計情報に変換するシステムを想像できます。これにより、プロセスを根本的に再考することが可能になります。
Knut Alicke: これを踏まえて、ダッシュボード作成に関連するすべてのことについて話しましょう。新しいシステムを導入する際、大部分の時間は何を表示するかを定義することに費やされ、その後ハードコードされます。誰もが新しいアイディアを持っています。自分のシステム―つまりLLM―に「これとこれを見せて。x軸にはこれを、y軸にはこれを強調してほしい」と話しかけ、すぐにその結果が見られる世界を想像してください。気に入れば標準にし、そうでなければ調整するのです。
ユーザーインターフェースは、必要なものを自然言語で探せるものになるでしょう。さらに、システムはあなたが見落としている要素も提供すべきです。あるKPIや別のKPIを求めたとしても、非常に重要なサービスレベルを見逃すことがあります。すると、このデジタルなヨアネスが「これらは興味深いですが、サービスについても調べましたか?サービスと在庫との相関はどうなっていますか?何か変化があるのでは?」と問いかけるかもしれません。
Joannes Vermorel: Lokadでは、全く異なるアプローチで同じ問題に取り組んでいます。ダッシュボードの典型的な問題は、企業環境においてすぐにメトリクスの壁―膨大な数字に囲まれて―になってしまい、正確に何を見ているのか分からなくなることです。
例えば、リードタイムを日単位で測定するとします。それが営業日なのか暦日なのか、外れ値は除外するのか、もし一度も納品されなかった場合は無限として扱うのか、あるいは例えば1000とするのか―様々な慣習が存在します。我々のアプローチは、ダッシュボードの動的構成ではなく、LLMがこの数字に至る全コードを参照し、重要なポイントを英語でまとめ上げるという、極めて詳細なドキュメントをその場で生成する方法です。スコープは何か?何をフィルタリングしたのか?どのくらい前までさかのぼるのか?
私たちはダッシュボードと数字に溺れており、その意味合いを理解するのが困難です。これが、我々が戦っている課題なのです。
Knut Alicke: ここで、クライアントと検討したもう一つのアイディアを提案します。リーン生産方式でよく知られている「5 Whys」―子育てをしている人なら誰でも知っているでしょう―は、なぜそれが起こっているのかを問い続け、根本原因に辿り着く手法です。これは非常に強力です。KPIの壁を踏まえて、何か問題がある場合は、LLMを使ってどんどん深掘りし、真の原因と、例えば在庫といったパラメーターをどこで変更すればパフォーマンスが改善するかを見つけ出すのです。
Joannes Vermorel: 全くその通りです。再び申し上げますが、新技術、特にAIを捉える際、多くの人はそれを単なるツールと考えがちです。しかし、Knutの話し方は、あたかも対等に交流する同僚―デジタルなチームメンバー―のように捉えています。
Conor Doherty: それは適切な表現と言えるでしょうか?
Knut Alicke: はい、その通りです。例えば、大学から新たに同僚を採用する状況を考えてみましょう。彼または彼女は入社して研修を受け、メンターやコーチの下で育成されます。最初は単純なタスクをこなし、次第に複雑なタスクにも取り組むようになります。当初は10ユーロの買い物をするかもしれませんが、年月とともに100,000ユーロの取引になるかもしれません。この同僚を成長させるのです。新入社員がすべてを知っていることを、誰も期待しません。
興味深いことに、プランニングツールを導入する際、プランナーはそのツールに魔法のような働き、全てを知っていることを期待します。では、なぜデジタル同僚としてGenAIボットを採用しないのでしょうか?もちろん、それも訓練が必要です。ビジネスの文脈、常に苦情をつける特定の顧客の詳細、そして「最も大きな声で叫んだ順に対応する」といった点など、我々固有の文脈をモデルに理解させる訓練を施すのです。
このモデルは非常に高速で動作し、人間には不可能なデータの取り扱いや解析が可能です。これと特定の知識とを組み合わせれば、本物のデジタル同僚が誕生するのです。将来的には、経験豊富なビジネスパーソンがこのモデルと同僚のように会話し、意思決定の質を大幅に向上させる未来が訪れると私は予見しています。彼らは退屈な作業―Excelからのコピー&ペーストなど―に煩わされることなく、「これについて考えましたか?あれはどうですか?」といった提案を受け、その上で自らの経験と照らし合わせ、はるかに良い判断にたどり着くのです。
Conor Doherty: この比喩―いや、例え話―は気に入りました。例えばメンターの例を取ると、ただ誰でも選べるわけではありません。効果的に教えるためには特定のスキルセットが必要です。そのメンターがLLMを訓練するために必要な重要なスキルとは何でしょうか?専門のコーダーやコンピュータサイエンティストでなければならないのでしょうか?
Knut Alicke: オープンで、好奇心旺盛で、透明性があることが求められます。良いメンターは、単に教えるだけでなく、フィードバックを受け入れ、相互に得るものがあります。私は自分のデジタルコピー―デジタルKnut―の訓練を始めました。ある時点で、「このデジタルKnutは何も知らない。私のことすら理解していない」と非常に苛立ったことがありました。しかし、もしそれが実際の同僚であれば、私も苛立つでしょうが、継続してコーチングし、育成を続けるはずです。デジタル同僚の場合、私自身のデジタル版も育成が必要なのです。全く同じことです。
Joannes Vermorel: ここで、GenAIの深刻な限界に触れています。現状、LLMは何も学習していません。技術的には、事前に訓練されたモデル―インターネットの大部分やWikipediaなど、大量のデータを投じて訓練した静的なモデル―を使用しているのです。パラメーターは変更されず、ChatGPTには記憶もなく、ステートレスです。調整できるのは、コンテキストだけです。
幸いなことに、昨年以降、コンテキストのサイズは飛躍的に拡大しました。最新のモデル―例えば、APIレベルのGPT-5では―400,000トークンのコンテキストウィンドウがあるとされています。これは非常に大きなものです。すべてを入力として使うことはできず、私の計算では約270,000トークンほどが入力に使用でき、残りは推論のために使われるのです。
しかし、現在のパラダイムの厄介な点は、ある種の結晶化した知能を持つモデルであっても、それが静的であるということです。コンテキストを充実させることはできますが、モデル自体がそれ以上に知能を向上させることはなく、初日と同じインテリジェンスに留まります。つまり、コンテキストを豊かにすることはできても、モデル自体がより賢くなるわけではありません。
そのコンテキストを維持するのは一体誰なのでしょうか?技術的には、知識のフライホイールという概念が語られます。誰がそれを維持するのか?LLM自身が、自らの情報バンクから情報の断片を追加・削除してフライホイールを維持するのでしょうか?ChatGPTは、許せばあなたに関する情報の断片を記録し、再注入します。しかし、コンテキストに過剰な情報を追加すると、余計な雑多な情報が紛れ込み、パフォーマンスが低下してしまいます。いくら何百ページものコンテキストを加えても、LLMはどんな質問に答える際もそれをすべて読み込まなければならず、結果として無関係な情報がパフォーマンスを悪化させる原因となります。
ですから、LLMエージェントを真の同僚として活用するには、ある面ではスーパーインテリジェンスを持ち、またある面では何も学習できないために極めて愚かと言える―少なくとも現在のパラダイムでは―状態です。
Conor Doherty: 両方の見解をそのまま受け取ったとしても、このデジタル同僚に任せられるタスクもあれば、人間が担当するタスクも存在するでしょう。まず、Knut、あなたはどのタスクをデジタル同僚にすぐに委ねると感じ、またどのタスクは人間が担当すべきだと考えますか?
Knut Alicke: 100%何も任せるとは思いません。常に人間が介在するのが重要です。例えば、診断を行う際、データを収集し、分析を行い、サプライチェーンでは需要予測、需要レビュー、S&OPなどを理解するために実際に人にインタビューを行います。しかし、それが必ずしも全ての真実を示しているわけではありません。これは製造業における現地見学(Gemba walk)のようなもので、会議室では輝かしいプロセスが説明されますが、実際の現場は全く異なるのです。
ここで私は、GenAIがプロセスを観察することで大きな価値を提供するのを見ています。例えば、需要レビュー会議を想像してください。しばしば、資料が不十分であったり、議題が守られなかったり、アクションプランが定まっていなかったりします。多数の参加者がビデオもマイクもオフで接続し、ほとんど発言せず、わずかな人だけが話す状況です。もしあなたのGenAIボットが会議を傍受し、進行役に「ここはこうすべきです、ここに問題があります」とフィードバックを提供できれば、それを大規模に同時進行で行えます。たとえば、200人の需要プランナーがいれば、全員に「ここはもっとよく、または違うやり方ができるのでは?」と指導することが可能です。これが、人々へのコーチングの方法です。
今日見られる応用例としては、調達が挙げられます。多くの小さなカテゴリーや製品が、時間や人手不足のために十分にチェックされないロングテールな支出において、エージェントがすでに価値を加えています。エージェントが分析を行い、比較し、価格の再交渉を促すことで、低コストで成果を出すことが可能になります。これは、ハイエンドのアイテムには適用されないかもしれませんが、ロングテールに対してはまず実施し、その後他のカテゴリーに展開していくことができます。
Conor Doherty: あなたが説明した、会議を監督するAIボットの例――実際に、異なるシナリオで約20回実験を行ったとおっしゃいました――その実験について、もう一度説明していただけますか?
Knut Alicke: 私は、現実に近いデータを用いた実験のため、合成データセット――合成企業――を作成しました。そして、「この予測はどうなっているのか?予測そのものもできますか?価格はどうなっているのか?プロモーションとの相関は?」といった分析を実施しました。さらに、手動の入力も作成しました。2人の需要プランナーを用意し、1人は予測を増加させ、もう1人は予測の精度を向上させるようにしました。伝統的なKPIである予測付加価値は、前者では非常に悪く、後者では良好でした。
その後、音声モードのChatGPTと対話し、自分が需要プランナーの一人であると主張しました。なぜなら、モデルがどのように反応するかを理解したかったからです。モデルは、企業の文脈、SKU、顧客、変動、初めのプランナーの肯定的な偏りなど、すべての情報を把握していました。私は、サプライチェーン担当者が私を理解してくれず、生産部門が私の求めるものを提供してくれないという不満を述べ、それが予測を増加させる必要がある理由だと説明しました。少し大げさに言い過ぎた部分もありましたが、現実を反映していました。
結果は興味深いもので、ボットは話を注意深く聞き、徐々にどのように改善すべきかを提案し始めました。すぐに「あなたの予測は馬鹿げています。常に30%増やすのはおかしい」と断定するのではなく、控えめかつ慎重に、ヒントやアドバイス、コツを示してくれたのです。
もう一つの実験として、マイクオフ、ビデオオフ、発言なしといった問題を含む、架空の需要レビュー会議の文字起こしを20件作成しました。最高水準の需要レビュー会議がどのようなものか、何が含まれるべきで何が含まれるべきでないか、典型的な問題点を私自身が説明し、モデルを訓練しました。その後、モデルに何が問題かを評価させ、非常に基本的なものから最高水準までの成熟度モデルを定義させ、文字起こしの成熟度を評価させました。評価は非常に良好で、結果も一貫しており、おそらく私が訓練したからこその同じ発見を得られたのでしょう。
もし実際の会議を傍受し、聞いた内容を反映するボットを想像してみてください。それは大幅な効率向上をもたらします。例えば、20人が参加し、そのうち15人がビデオオフ、マイクオフで接続しているとしたら―実際に接続する必要がなくなるのです。節約された時間で何ができるでしょうか?改善すべき点はたくさんあります。これは単なる診断にとどまらず、既にコンテキストがあるため、即座に継続的な改善に取り組むことができるのです。
Joannes Vermorel: このような未来は、何らかの形で実現すると私は信じています。現在のLLMのパラダイムであれ、主な問題はデータまたは知識のフライホイールにあります。LLMは学習できないため、知識の断片をどのように分割し、後で利用するために保存するかをLLM自身が決定しなければなりません。この問題はまだ十分に解決されていません。将来的には、学習機能が本質的に組み込まれたLLMの後継モデルや、あるいは代替理論が考えられるでしょう。
事例に戻ると、会社全体での受動的な傍受、自動的なアーカイブと整理―意見交換、そして自動化によって更新される現在の企業のマインドマップとしての洞察や理解のライブラリ―これにより、莫大な価値がもたらされるでしょう。
現状、我々は近似的な手法に頼っています。たとえば、2時間の会議を記録して非常に整理された議事録を作成するという方法です。これは有用で時間を節約しますが、後で容易に参照できるものではありません。LLMは、特定の議題が議論されたかどうかを見つけるために、すべてを再スキャンしなければなりません。あなたが尋ねなければ、「これは議論された」と「別の2つの会議でこれが議論され、矛盾がある」という接続を自ら行うことはありません。
我々には学習が欠如しています。学習は存在せず、モデルにとって「ひらめき」の瞬間はありません。モデルはコンテキストウィンドウを線形に処理する静的で堅固な知能を持ってはいますが、その知能は非常に非人間的な方法で発揮される一方、深い学習には至らず、限界があるのです。
奇妙な点の一つとして、データ管理においては、技術に関係なく、モデルは自動的に改善されると私は考えています。なぜなら、より多くの例を取り込むからです。現在、ChatGPTにプロンプトの作成を依頼すると、2年前と比べてはるかに優れた結果が得られます。なぜなら、その背後のコア技術が進化したのではなく、良いプロンプトの例がウェブ上に大量に存在し、モデルにフィードバックされているからです。何十万もの人々がヒントやコツを投稿し、ChatGPTはそれを学習の一部として再取り込みしています。
知識管理においては、十分な人々が有用な知識の断片といえるヒントを投稿すれば、これらのツールは多くのヒューリスティックを統合することで改善されるでしょう。
Knut Alicke: 会議ノートの例に基づくと、ボットがすべてを知っているとは期待できません。だからこそ、デジタルクルー、つまりデジタル・ヨアンネス、デジタル・コナー、デジタル・クヌートといった概念に立ち返ると、人間が最初のループに入る必要があります。あなたは議事録を持ち、「ここはうまくいっていない、ここはうまくいっていない」と印をつけます。そして、文脈をどんどん構築していくのです。これを10回行えば、モデルは既に80%の事象を見抜けるようになります。これがいわゆる80/20の法則です。私の25年以上の経験では、80%は常に同じであり、訓練することができます。その上で、特定のケースに対して追加の文脈を提供するのです。
例えば「そもそもこの需要レビュー会議は必要なのか?」といった問いを吐き出すことはないでしょう。それは結果とは呼べません。しかし、構造と成果を改善し、ひいてはより優れたサプライチェーンを実現するためには、近い将来それが可能になるでしょう。
Joannes Vermorel: Lokadでは、計画会議の要約時に含めるプロンプトの一部として、「日付やドルまたはユーロの価格が言及された場合は、それを分離して、その日付にアクションの呼びかけが付いているか確認する」といったヒントを加えています。質の高いメモを作成するために、まず議論をスキャンし、日付で一旦停止し、アクションの呼びかけを捉え、財務額についても同様に―リスクは何か?―といった2段階のアプローチを取っています。こうして、LLMに本当に有用なものを識別するためのヒントをプロンプトとして提供しているのです。
これがLokad流の方法です。さあ、これをLokadがウェブ上に公開し、何十万もの人々が自分たちのヒントを公開したらどうなるでしょうか。「この会議のためには、非常に効果的な要約を得るためのリストはこちらです」と。だからこそ、人々がヒントやコツを投稿することで、知識のフライホイールは進化していくのだと思います。
しかし、解決されていない根本的な問題は、スケールで知識を管理する方法です。最も近い近似手法はRAG(Retrieval-Augmented Generation)ですが、これは依然として粗雑であり、十分にスケールできません。大企業では、すぐにLLMの容量を超えてしまいます。たとえトークンウィンドウ―現在は非常に長い―を超えなくても、数百ページのほぼ無関係な情報を投入すると、優れたパフォーマンスは得られません。もっと優れたものが必要です。
状況を何とかしのぐ方法としては、線形スキャンやマルチパスといった手法があります。最初のパスで無関係な情報を除去するというものですが、これらはすべて、現行パラダイムにおいて学習が二級市民であるという事実への応急措置に過ぎません。
Conor Doherty: 人間側に目を戻すと、カメラの外では話しやすい人も、カメラとマイクを前にされ、記録されていると分かると、いきなり遠慮し始めます。永久的に記録が残るため、参加意欲が変わってしまうのです。これを、AIツールが聴取、記録、解析、アーカイブ、そして場合によってはパフォーマンス指標を決定していると分かっている需要計画会議に当てはめてみてください。これが、参加や賛同にとって問題になると思いますか?
Knut Alicke: 初回の会議では確かにそうですが、2回目以降は半減します。その後、さらに薄れていくのが常です。リーン手法の現場見回りでは、最初は全力を尽くしている様子が見受けられますが、翌日、さらにその次も同様に、プロセスに固執する姿勢は薄れ、通常の習慣に戻ってしまいます。5日目になると、より多くの問題が浮上します。
これらの会議に関与するコンサルタントとしては、最初の会議は比較的うまく進むものの、その後何度も再接続するうちに、人々は「おお、これは普通だ」と気付き、何が起こっているのかが明らかになってきます。まだ不明なのは、このボットが悪くないと人々をどのように納得させるかという点です。
一つの方法として、サプライチェーンのアバターを作成することが考えられます―あなたがハンサムなら、あなたそっくりのアバターにする―そうすれば人々は信頼を築き、自然とそのアバターと対話するようになるでしょう。それでも話すことに同意しない人もいますが、それは彼らの損失です。
Conor Doherty: ガードレール、すなわち技術を取り入れながらも安全とセキュリティを確保する、という点についてですが、例えばクライアントミーティングや需要計画担当者、診断の場面では、数字、日付、価値といった非常に機微な情報が議論されます。こうした中で人々はセキュリティや安全策について懸念を抱くかもしれません。
Joannes Vermorel: 全くその通りです。約20年前、電子メールがまだ新しかった頃、私がコンピュータサイエンスの学生に教えたことの一つは、「すべてのメールは永遠に公開されるものと考えなさい」というものでした。一度送信したメールは制御不能になり、転送される可能性があるのです。当時、「あなたのすべてのメールがUsenet―当時のRedditに相当する―に流出すると想定せよ」と言っていました。それに沿って書くべきなのです。
私たちは、今後20年間で記録を取る受動的リスニングツールに抗うことが非常に困難な、奇妙な世界に突入しようとしています。生産性向上の可能性があまりにも多いため、抗うのは難しいでしょう。企業はそれを受け入れ、多大な時間を節約できることに気付くはずです。ここで言うのは2年後ではなく20年後の話です。
今日のような電子メールのやり取りは、70年代の人々にとっては奇妙に感じられるでしょう。プライベートな会話が常に全国紙に流出するリスクがあるという考えは、当時は常識外れに響いたはずです。自分が送った1通のメールが何十人にも転送されるという事実は日常茶飯事です。人々は、メールを転送する際に許可を取る必要があるとは感じていません。郵便の手紙はプライベートなものでしたが、第三者に転送するのは許されなかったのです。
Knut Alicke: 訓練の観点に戻ると、何を共有すべきか、何を共有すべきでないかを人々にしっかり認識させる必要があります。私たちの著書からのもう一つの例ですが、ある寄稿者は、自身のS&OPプロセスで最も重要な3社のサプライヤーを招待したいと考えたと述べました。皆が「無理だ、彼らに生産計画がばれてしまう」と不満を言いましたが、彼は「それこそが私が共有したい内容であり、彼らが事前に準備できるようにするためだ」と答えました。対象は数千ではなく、最も重要な3社なのです。
透明性を高めることで、より良い結果が得られます。しばしば「もし彼らに我々のことが知られたら…」という恐れがありますが、実際に知られれば、彼らはより良い準備ができ、サプライチェーン全体も向上します。これらのモデルにも同じことが言えますが、明らかに、もし本当の秘密があるなら、それが翌朝新聞に載るのは望ましくありません。
Joannes Vermorel: 私の見解では、これが組織を変革するのです。例えば、私の両親の世代がプロクター・アンド・ギャンブルで働いていた時代、内部は準軍事的な体制で、階層は非常に厳格で、プライバシーと秘密保持が最重視され、情報は知る必要がある者にのみ配布されていました。今日のプロクター・アンド・ギャンブルは、50年前とは全く異なります。
この技術は、「すべてが公開されても、我々には隠すべきものがほとんどない――なぜなら、競争優位はそこから生じるものではない」と主張する企業側に市場をシフトさせるでしょう。確かに、時には情報を秘匿することが優位となる場合もありますが、秘密が重要でないビジネスモデルも存在します。今後、この方向に事業がシフトしていくでしょう。
これらのツールを真に安全に保つことは難しいでしょう。例えば、テクノロジースタートアップの監査を行う際、私は一切のデバイスを使わず、ペン、紙、ノートブックだけで対処します。そうすれば、何も偶発的に漏洩することはありません。すべてがアナログであり、データが漏れるということは私のノートブックが盗まれることを意味し、私の筆跡は非常に読みにくいため、ある程度情報が覆い隠されるのです。
総じて、企業はメールを通じてよりオープンな運営を受け入れており、50年前のように秘密を守って事業を展開することは容易ではなくなっています。今や誰でもビデオを撮ってTikTokにアップロードできるため、問題が複雑化します。もし公開すべきでない情報が存在するなら、最初からそれを持たないべきかもしれません。なぜなら、誰かが作業環境や汚れたキッチンの様子をビデオにアップロードする可能性があるからです。この技術はさらにその流れを加速させ、秘密がほとんど存在しない世界におけるあなたの競争優位性を複雑にしていくでしょう。これは、技術の展開に時間がかかるため、今後20年にわたる継続的な議論となるでしょう。
Conor Doherty: ガードレールは多面的なものです―セキュリティと支出です。ジェネレーティブAIがサプライチェーンを悪化させたと主張する向きもあり、「ジェネレーティブAIの価値ギャップ」――莫大な投資に対してほとんどリターンがなく、パイロットプロジェクトの煉獄に陥っている――と指摘されます。あなた方のお考えでは、これがGenAIの変革的影響の認識にどのような色合いを与えるのでしょうか?
Knut Alicke: 先に述べたように、まだその段階には達していません。我々は依然として初期段階にあります。賢明な同僚がこう言っていました。パイロットを行う際、CEOや事業部長に、日常的にChatGPTを使用しているかを尋ねなさい。そうすれば、何が可能で何が不可能かが分かります。これには非常に興味をそそられました。
もし経営者が何が可能かを理解していれば、パイロットが実施されないか、あるいは適切なスコープと期待値で設定されるでしょう。そうでなければ、パイロットは世界の飢餓問題を解決するために設定され、結果的に失敗するだけです。
多くの人々は依然として、GenAIとAI、デジタル、アルゴリズムを混同しています。それが常に新しい言葉として使われ、あなたの行うすべてが今やGenAIであるかのように感じられますが、それは事実ではありません。価値を付加できる範囲、可能なことに絞り込めば、今後数年でその影響が現れるでしょう。
もう一つ考えられるのは、影響の捉え方があまりにも局所的であるという点です。サプライチェーンにおいて、適切な業務の最大のインパクトは依然として「在庫の確保」にあります。在庫の確保は高い利益率と高い収益をもたらします。それでも多くの人々は、サプライチェーンは単にコストと在庫管理でしかないと考えています。全体をエンドツーエンドで統合し、自身の影響を見直すことで、全体のパフォーマンス向上が実感できるでしょう。
Joannes Vermorel: 私はこれが完璧なブロックチェーンの代替になると考えています。もっと真面目に言えば、すべての流行語には通常、何らかの本質的な技術的要素が存在します。しかし、エンタープライズsoftware vendorsの世界に属しているということは、大企業のエンタープライズソフトウェアに関する購買プロセスが悲惨であることを意味します。多額の資金が無駄にされ、その無駄遣いがGenAIに向けられているのです。もしGenAIがなければ、そのお金は別の流行語に浪費されるでしょう。
その因果関係は「GenAIが無駄を生み出す」のではなく、「購買プロセスが機能不全であるために資金が無駄にされ、その無駄遣いがその日の流行語に向けられる」というものです。2、3年前はブロックチェーン、5年前はビッグデータ、10年前はデータマイニングでした。
上司がChatGPTで遊ぶというあなたの指摘についてですが、鍵は機械的共感にあります。直感的に、このツールが何をでき、何ができないかを感じ取れますか?ブロックチェーンや暗号通貨についても同様です。たとえば、ビットコインを購入し、使用したことがありますか?その仕組みを理解していますか?技術を把握できなければ、それは良くありません。
残念ながら、我々は600の質問が並ぶRFPという惨めなプロセスに戻ってしまっています。我々は受け手側として、「あなたがファックスアーカイブに使っている部屋は耐火性ですか?」という質問を受け取ります―これは1か月前に受けた質問です。
Knut Alicke: 同意します。そしてもうひとつの観察ですが、ソフトウェアの選定プロセスは非常に奇妙です。私はいつもクライアントに「なぜこの500もの仕様が必要なのか」と尋ねます。すべてのソフトウェア会社は、デフォルトで何にでも適合するように提示します。なぜなら、ソフトウェア会社は現実ではなくビジョンを売っているからです。その後、彼らはすべてを約束する派手な会議に進むのです。
例えば新車の購入を考えてみましょう。30秒のYouTube動画を見ただけで車を買いますか?おそらく違うでしょう。実際に車に乗り、触れて、運転したいものです。なぜソフトウェアに対して同じことをしないのでしょうか?それが動作していることを証明する概念実証(Proof of Concept)を行わないのはなぜでしょうか?
これは能力の問題に帰着します。人々は大まかにその中身を理解する必要があります。私たちは皆教える立場にあるので、さらに実践的なサプライチェーンを教え、これを取締役会に持ち込む必要があります。だからこそ、『Source to Sold』という本を執筆し、取締役会レベルで何が効果的で、何が効果的でなく、どこにインパクトがあるかという物語を確実に伝えようとしたのです。
Conor Doherty: ちなみに、私は「JV—機械的共感」と書き留めていました。あなたがそう言うだろうと知っていました。我々はしばらくの付き合いになりますね。
これで終盤に差し掛かりました――二つの重要な質問です。一つは取締役会レベルに、もう一つは現場の担当者に向けてです。Knut、まずは取締役会に対して、どのように変革的な価値を提示して説得するのか、そして現場ではどのように提示するのかを教えてください。
Knut Alicke: 取締役会レベルでは、取締役会が使う言葉―ビジョン、成長、マージン―に合わせた言語で物語を構築する必要があります。この新技術が、顧客や消費者にとってより良く、より収益性の高い未来を実現するためのビジョンの実行を支援するというストーリーを描くのです。
現場では、取締役会で述べたすべてのことは事実であると同時に、これが人々の日常生活を助けるという認識を得る必要があります。もし単なるブラックボックスのようなツールで、生活をより困難にするだけなら、うまくいきません。生活を楽にし、人々が全体のパフォーマンスに貢献できるようにしなければなりません。
もし倉庫で現場を視察すれば、ピッキング担当者は常に5,000もの改善アイデアを持っています。彼らが愚かだからやりたくないのではなく、知ってはいるものの尋ねられる機会がないだけなのです。プランナーについても同様です。あなたはこう伝えなければなりません。「こちらには、より優れたプランナーになれるように支援し、あなたの生活を楽にし、あなたの仕事をより面白くする新たなクールなツールがあります」と。
Joannes Vermorel: 取締役会向けの提案ですが、21世紀は知的作業の機械化の時代です。20世紀が肉体労働の機械化の時代であったのと同様です。もし膨大なホワイトカラーの事務員の機械化を進めなければ、必ず競合他社がそれを実行し、より少ない人員で迅速に多くの成果を上げるでしょう。
ホワイトカラーの人々が何をしているのかをじっくり見てみる必要があります。サプライチェーン計画では、多くの企業で数百人が毎日同じスプレッドシート(何万行にも及ぶ)をチェックしています。最大の課題は、これらの業務がいつ完全にロボット化されるかという点です。問題は「もし」ではなく「いつ」なのです。5年後か50年後か、意見は分かれるでしょうが。
Conor Doherty: 以上で最後の質問でした――ありがとうございました。
Joannes Vermorel: 私は楽観的な側です。クヌートは、この技術が人々の生活を長期にわたって改善すると考えていますが、現状が不十分であることには皆同意するでしょう。いずれ、現状以上の成果を上げる企業が現れるはずです。
オペレーショナル志向の方へ:Lokadではロボット化を進めていますが、これは厳しい議論を伴います。あなたは、仕事をよりチャレンジングに、そしてより興味深くする何かを受け入れる覚悟がありますか?スプレッドシート作業の単調さには一種の安心感がありますが、それは非常に退屈です。
もし、あなたが極めて退屈な作業に快適さを感じているなら、それは良いことではありません。もし、仕事に挑戦しその質を高めたいという意欲があるなら、これは仕事の自動化革命に参加する一生に一度の機会です。あなたは、日常的な自動化の一歩上の、はるかに賢いことに取り組む人々の一員となるでしょう。
これがLokadのビジョンの一部です:タスクをロボット化し、人間はその自動化を監督する。もう一つのアプローチは、人々自身を大幅に生産性向上させる方法です。スプレッドシート作業の現状を打破するための、どちらも有効な視点です。
Conor Doherty: Knut、通常、ゲストに締めの言葉をいただく慣習があります。あなたの視点をもう少し詳しくお聞かせいただけますか?Joannesは、AIが意思決定プロセスを引き継ぐことが、あなたの見解よりも突然かもしれないと示唆しているようです。あなたの立場に馴染みのない方のために、近い将来および中期的な進化についてどのようにお考えですか?
Knut Alicke: 私の希望について― 楽観的な見方と悲観的な見方の二つを示しましょう。楽観的なシナリオでは、モデルはさらに優れ、文脈や新たな発明を通じて学習できるようになるでしょう。これにより、プランナーの生活は大幅に簡素化され、意思決定の質は向上し、知的にもはるかに挑戦されることになる― しかし、すべての人がそれを好むとは限りません。これはおそらく今後5年間で起こるでしょう。
悲観的な見解― 悲観主義者は経験豊富な楽観主義者です。25年前を振り返ると、McKinseyに入る前、私は家電向けの計画ソフトウェアを手がけるスタートアップで働いていました。当時、私たちのソフトウェアと意思決定の質は、今振り返ると驚くべきものでした。今でも、その水準には遠く及ばないクライアントが多くいます。これを踏まえると、悲観派は「いつかは到達する」と言いつつも、おそらく20年後になるだろうと考えています。
Conor Doherty: では、楽観的な見方、悲観的な見方、そして黙示録的な見方―つまり、まるでスカイネットが明日、いや来週にでも現れるかのようなシナリオ―というのは、適切でしょうか?
Knut Alicke: スカイネットは起こりません―少なくとも一つの出来事としては。
Conor Doherty: もし未来でこれを見ている方がいれば、ぜひメッセージを送ってください。質問はこれで以上です、皆さん。Joannes、参加していただきありがとうございました。Knut、素晴らしかったです。スタジオに参加していただき本当にありがとうございました。そして、他の皆さん、仕事に戻りましょう。