00:00:07 サプライチェーン業界における機械学習のトピックの紹介。
00:00:46 IKEAのデータと分析リーダーであるAlexander Backus氏の紹介。
00:02:20 自己成就予言の概念の説明。
00:03:03 自己成就予言がサプライチェーンに及ぼす影響についての議論、例えばビジネス目標や需要と供給の影響など。
00:07:14 サプライチェーンにおけるフィードバックループが世界をより複雑にし、特定の製品の過剰在庫がその販売にどのように影響するかの説明。
00:08:53 サプライチェーンにおけるフィードバックループと人間の行動の影響についての議論。
00:10:41 需要予測における販売データの使用と単純なアプローチの潜在的な影響についての説明。
00:13:08 機械学習システムにおけるゼロ予測の問題とブルウィップ効果についての説明。
00:15:17 在庫切れバイアスの説明とそれに対処するための技術。
00:17:22 在庫切れの普及度と在庫切れバイアスへの対処方法の効果についての議論。
00:18:15 製品への顧客の認識が需要にどのように影響するかの説明と在庫レベルの販売への影響。
00:20:17 損失マスキングとその目的の説明。
00:20:26 モデルに在庫レベルへのアクセスを与えることで、在庫レベルの変動が販売に与える影響を理解するのに役立つ方法の説明。
00:22:14 因果推論のための機械学習モデルの使用の制約と交絡変数の影響についての議論。
00:25:54 確率的予測がゼロ予測の影響を軽減するのにどのように役立つかの説明。利用可能な情報の「曖昧さ」を認識すること。
00:27:04 確率的予測モデルの利点の説明。
00:28:44 ポイント予測に比べて確率的予測モデルの利点。
00:30:42 フィードバックループと予測への影響について。
00:34:35 価格が予測にどのように影響するか。
00:36:32 部分的な可観測性とサプライチェーン管理のモデル作成における課題の説明。
00:37:04 バンディットフィードバックの概念と、電子商取引の推奨システムでのその有名な応用との比較。
00:37:17 サプライチェーン管理における意思決定の影響を予測する教師あり学習の制約についての議論。
00:38:01 ポリシーベースの強化学習アルゴリズムの説明。
00:41:06 実世界のサプライチェーン管理に強化学習アルゴリズムを適用する際の課題と、過去のデータからのオフライン学習を開始する解決策についての議論。
00:44:55 習慣や過去の実践が会社の価格変動にどのように影響するかの議論。
00:46:41 強化学習における探索と活用の説明。
00:50:57 予測におけるフィードバックループをパラダイムの変化として認識する必要性。
00:52:45 AIをビジネスプロセスに組み込む際の技術的および文化的な課題。
00:53:57 サプライチェーン業界におけるモデリングと意思決定の課題についての議論。
00:54:55 サプライチェーンプロセスにおけるフィードバックループの存在を認識すること。
00:55:06 予測に基づくアプローチではなく、意思決定に基づくアプローチに移行すること。
00:57:27 特に大手の電子商取引企業を含むサプライチェーン業界のトレンド。
01:01:03 IKEAのサプライチェーンの課題に取り組む新しいメンバーをオンボーディングする際に求められる資質についての議論。

要約

Nicole Zintの司会で行われたインタビューで、Lokadの創設者であるJoannes VermorelとIKEAのデータおよび分析リーダーであるAlexander Backusが、サプライチェーン業界における機械学習とAIの応用について議論しています。このインタビューでは、自己成就的な予言とフィードバックループがサプライチェーン管理に与える影響や、予測に機械学習モデルを利用する際の課題に焦点を当てています。インタビューでは、確率的予測などゼロ予測問題を回避するアプローチや、サプライチェーン予測における不確実性の認識の重要性も探求されています。パネリストは、不確実性を受け入れる必要性、意思決定モデルに移行する必要性、およびステップバイステップで変化を取り入れてサプライチェーン管理を改善する重要性を強調しています。

拡大要約

このインタビューでは、Nicole ZintがLokadの創設者であるJoannes VermorelとIKEAのデータおよび分析リーダーであるAlexander Backusの間で、サプライチェーン業界における機械学習とAIの応用についてのディスカッションをモデレートしています。彼らは自己成就的予言の概念とそのサプライチェーンへの潜在的な影響、フィードバックループの役割、および予測に機械学習モデルを利用する際の課題について議論しています。

自己成就的予言とは、信念と行動のフィードバックによって直接または間接的に真実になる予測のことです。サプライチェーン管理では、予測は意思決定プロセスに影響を与え、最終的に未来を変えることがあります。Vermorelは、自己成就的予言が本質的に良いものでも悪いものでもないことを指摘しています。それらは単に状況をより複雑にするだけです。

フィードバックループはサプライチェーンで一般的であり、人々が予測に反応し、それが将来の予測に影響を与えることがあります。Vermorelは、これらのループが価格の調整や製品配置の調整など、さまざまな方法で現れることを強調しています。また、競合他社が企業の予測に対応して戦略を変更することで、追加のフィードバックループが生じる可能性もあると述べています。

Backusは、予測における機械学習モデルにおける販売データの重要性を説明していますが、販売と需要は同じではないと指摘しています。販売データは供給やその他の要因に影響を受ける可能性がありますが、需要は推測する必要がある未観測の数量です。彼は、この2つの間の違いを明確にすることと、予測プロセスでの相互作用を考慮することの重要性を強調しています。

サプライチェーンの予測において、フィードバックループや自己成就的な予言が考慮されていない場合、機械学習モデルは問題を引き起こす可能性があります。Backusは、サプライチェーンの小さな逸脱がシステムによって拡大される「ブルウィップ効果」について言及しています。これにより、売上の減少や不正確な予測などの悪影響が生じる可能性があります。彼は、人間の行動に影響を受けない天気予報と、これらの複雑なフィードバックループの影響を受けるビジネスの結果の予測を対比しています。

フィードバックループや自己成就的な予言によって引き起こされる課題を緩和するために、Vermorelは企業がサプライチェーンシステムの複雑さを受け入れ、ポイント予測だけでは不十分であることを認識すべきだと提案しています。代わりに、彼らは予測が人間の行動や意思決定プロセスに与える潜在的な影響を理解し、予測の可能な影響を予測しようとするべきです。

訪問では、機械学習とAIをサプライチェーン管理に活用する際の複雑さについて探求し、自己成就的な予言とフィードバックループの理解が予測の精度と意思決定の改善にどれほど重要かを強調しています。

ゼロ予測問題は、需要の減少を感じ取り在庫を減らすためにシステムが少ない在庫を注文することで、需要がさらに減少し、注文が連続的に減少する状況です。この問題を回避するために、Vermorelは予測モデルで使用される指標を変更することにより、在庫切れのバイアスを除去することを提案しています。在庫切れの発生が比較的まれな場合には、在庫切れのある日の測定値をゼロにする方法がうまく機能しますが、在庫切れ率が高い業界では効果が低下します。

もう一つのアプローチは、機械学習モデルに過去および将来の在庫レベルデータへのアクセスを与え、在庫レベルの変動が将来の売上や需要に与える影響を学習させることです。この方法では、プロモーション、価格、容量、倉庫の制約、市場の力など、需要に影響を与えるすべての意思決定と要因を予測モデルに組み込む必要があります。

ただし、Backusは、必要な情報を持たない標準的な機械学習モデルを使用することは、在庫レベルの変化と需要の変動の原因と結果を混同するなどのミスを引き起こす可能性があると警告しています。これらの問題を回避するために、彼は確率的予測を使用することを提案しており、利用可能な情報の曖昧さを認識し、需要がゼロであるという絶対的な確信に収束しないようにしています。

確率的予測は確率を多くの値に広げることで、ゼロ需要に対する絶対的な確信に収束しにくくします。このアプローチでは、将来の需要に対してゼロ以外の確率を推定することにより、在庫がゼロに凍結することを回避します。また、顧客への対応と余分な在庫を保持することの非対称性を考慮し、より高いサービスレベルを優先します。

その利点にもかかわらず、確率的予測は完璧な解決策ではありません。在庫切れが繰り返し発生する場合には、将来の需要を過小評価する可能性があります。ただし、これにより在庫の管理がより堅牢になり、ゼロ予測問題を回避することができます。

結論として、機械学習技術と確率的予測を採用することで、サプライチェーンの専門家は需要をより正確に予測し、在庫管理レベルを向上させることができます。さまざまな要因を考慮し、利用可能なデータの不確実性を考慮することで、企業はより情報を基にした意思決定を行い、サプライチェーンのパフォーマンスを向上させることができます。

ジョアネス・ヴェルモレルは、サプライチェーンの予測における不確実性を認識することの重要性を強調しました。将来のイベントの完璧なモデリングは現実的ではないため、彼は確率的予測の概念について議論しました。確率的予測は、サプライチェーンイベントの固有の不確実性を反映し、ポイント予測とは異なる方法で未来を予測します。彼は確率的予測には確率分布が関与しており、未来は過去とは異なるようになると説明しました。また、彼は将来の動向に応じて予測を豊かにし、動的かつ条件付きの予測を行うことで予測を充実させるためのフィードバックループにも触れました。

アレクサンダー・バッカスは、ヴェルモレルの指摘に同意し、予測に関する問題を緩和するために価格設定などの過去の意思決定にモデルへのアクセスを与える方法について詳しく説明しました。彼は部分的な観測可能性という概念を紹介しました。これは、カウンターファクチュアルを知らずに意思決定の効果のみを観察することを意味します。意思決定の影響をより正確に予測するために、バッカスは将来の予測ではなく最適な意思決定を出力するように機械学習の問題を再構築することを提案しました。このアプローチは強化学習と呼ばれています。

この会話は、フィードバックループ、限られたデータ、および非ランダムな意思決定によるサプライチェーン管理における予測と意思決定の課題について展開されています。彼らは予測ではなく意思決定を出力するモデルに向けて進む必要性を強調しています。AmazonやAlibabaなどの技術志向の企業を含む業界のトレンドは、完璧な予測の考えを捨てて意思決定に焦点を当てることです。存在する課題にもかかわらず、パネリストは業界がサプライチェーン管理を改善するために段階的にこれらの変更を取り入れるべきだと合意しています。

ヴェルモレルは、人間、機械、プロセスから構成されるサプライチェーンの不確実性と削減できない複雑さの重要性を強調しています。彼は正確に間違っているよりもおおよその正確さを重視することを提唱しています。バッカスは、IKEAのような大企業内での課題に取り組むために優れたデータサイエンスの才能の必要性を強調し、グローバルな影響力と既成概念に挑戦する重要性を強調しています。

フルトランスクリプト

ニコール・ジント: 今日はIKEAのデータと分析のリーダーであるアレクサンダー・バッカスをお迎えしています。いつものように、まずはゲスト自身に自己紹介してもらいましょう。アレクサンダー、どうぞ。

アレクサンダー・バッカス: ありがとう、ニコール。ここにいられて嬉しいです。パリにいることができて素晴らしいです。私の名前はアレクサンダー・バッカスです。IKEA Inka Group Digitalの在庫と物流オペレーション領域でデータ分析をリードしています。データサイエンティスト、データエンジニア、データアナリストからなるグループを管理し、クロスファンクショナルなプロダクトチームで在庫物流オペレーション計画の最適化に取り組んでいます。私はデータサイエンスのバックグラウンドを持ち、KLM航空、ハイネケン、ボーダフォン・ジグゴ、ING銀行などの大企業でコンサルタントとして働いた経験があります。認知神経科学のPGDを修了した後、データサイエンティストとしてサプライチェーンで働くことは、データサイエンスにとって非常にエキサイティングなフィールドだと思います。たくさんのデータがあり、現実の意思決定に影響を与えるので、それは具体的なものです。利益だけでなく、サプライチェーンの廃棄物を減らすことでより持続可能な世界を作る手助けもできます。それが私がここにいる理由です。

ニコール・ジント: これらのトピックについて詳しく説明する前に、今日議論する概念を説明しましょう。まずは、自己成就予言とは何かを説明しましょう。

アレクサンダー・バッカス: アイデアは、ビジネスプロセスを最適化するために行う予測が、特定の意思決定プロセスに影響を与えるというものです。予測に基づいて意思決定が行われている、少なくともそれが望ましいとされています。それが起こると、予測自体が未来を変え、次回の予測に使用されるデータも変わることを意味します。これにはいくつかの課題があります。基本的に、自己成就予言とは、予測が予測されたために起こる予測のことです。つまり、ある方法でなると思ったために、未来に影響を与えるのです。未来だけでなく、予測が真実となる現実を作り出すこともあります。これはさまざまな方法で起こり得ます。たとえば、ビジネスや販売の予測がある場合、これはビジネスの目標になる可能性があります。

ニコール・ジント: つまり、マーケティング担当者は特定の決定を下します。例えば、「現在少し不足しているので、この目標に到達する必要があります。もう少し売り上げを伸ばすために、プロモーションを行う必要があります」と言います。実際に、あなたが行った予測が、この例では販売の最終結果に影響を与える決定の基準になっています。これはさまざまな方法で起こり得ます。別の例として、倉庫で特定の配送能力やピッキング能力を確保するための予測がある場合、それはリードタイムに影響を与えます。顧客があなたのeコマースのウェブサイトを見て、リードタイムが非常に長いか非常に短いかを見ると、需要に影響を与えることがあります。

アレクサンダー・バッカス: そうですね、需要は供給に影響を与え、供給は需要に影響を与えます。どちらの方向にも進むことができます。これが、あなたが指摘している効果です。ビジネスの目標になる予測がどのようにビジネス自体に影響を与えるか、どのような欠点があるかを教えてください。予測は、実際には供給チェーンのパフォーマンスを見るのではなく、到達を目指すものとしている場合です。

ジョアネス・ヴェルモレル: 欠点そのものはありません。これは供給チェーンの運営方法です。フィードバックループはどこにでもあります。私たちは基本的に人間の事柄に取り組んでおり、実践者が驚くのは、多くの工学校や多くの企業で、予測を惑星の動きの予測のようにアプローチしていることです。過去の観察があり、惑星の将来の位置についての声明をすることができる非常に明確なフレームワークがあるというアプローチです。しかし、予測者であるあなた自身は、惑星のような観測されている要素に何の影響も与えません。

ニコール・ジント: つまり、自己成就予言は必ずしも良いことでも悪いことでもないということですね。

ジョアネス・ヴェルモレル: はい、まさにその通りです。それが影響を与えないとは言えませんが、状況をより複雑で複雑にするだけです。そして、少し困惑するのは、多くの企業がポイント予測またはポイント予測以外のものに対して受け入れがたいと感じることです。つまり、将来が1つだけあると言っています。これがそれです。そして、それは基本的に過去の対称性です。過去の観察があり、過去と同じくらいクリーンで整然とした未来を持ちたいと思っています。つまり、同じものの続きです。

ニコール・ジント: はい、同じものの続きであり、本当に同じ性質です。つまり、過去について完全に明確なビジョンと将来について完全に明確なビジョンを持っています。そして、ちなみに、惑星の動きの場合、数百年先を見ない限り、将来の100年後の惑星の位置について完全に完璧なビジョンを持つことができます。

ジョアネス・ヴェルモレル: ここで興味深くなるのは、供給チェーンではフィードバックループがあることです。製品を大量に購入することで、実際には期待を作り出し、人々はその製品を売らなければならないと感じます。会社が大量の在庫を抱えることにならないようにするために、彼らは何が必要なのかを考え、大量の供給を大量の販売に変えるために必要なことをします。彼らは在庫に応じて価格を調整したり、時にはもっと日常的なことをします。店舗がある場合、もしも

ニコール・ジント: 少し違った方向に話を進めると、フィードバックループはどこにでも存在し、悪いものではありません。ただ存在しているだけで、再び、その中心には未来についての改善に基づいて考え行動することができる人間がいるからです。供給チェーンは非常に複雑ですので、これらの反応はさまざまな形を取ることができます。しかし、すべての供給チェーンには多くの人々が関与しており、時には、例えば、何かの不足を発表するという形でフィードバックループも発生します。その結果、人々はその何かを買いに駆け込み、心理的な影響により人為的な不足が発生することがあります。

ジョアネス・ヴェルモレル: まさにその通りです。不足を発表すれば、不足が起こる可能性が高いという考え方は新しいものではありません。比較的予測可能ですが、それでも、すべての手がかりを予測するのは難しいです。はい、供給チェーンの中心にいる人々の心理をある意味でモデル化しなければなりません。

ニコール・ジント: ジョアネス、あなたはこれらのフィードバックループについて言及し続けています。アレクサンダーさん、私たちの視聴者が理解するために、これらのシステムに実際にフィードバックされるデータは何ですか?供給チェーンのどの段階でデータをフィードバックしますか?

アレクサンダー・バッカス: 良い質問です。予測を行うための非常に重要な情報源は販売データです。そして、これは私たちがさきほど話した効果によって影響を受ける主要なデータでもあります。ジョアネスが説明したように、需要予測やビジネス予測の素朴なアプローチは、教師あり機械学習モデルを取り、基本的な回帰問題として扱うことです。つまり、「OK、教師あり学習アルゴリズムを使用して、過去のデータに基づいてこの数量を予測するだけだ」と言うわけです。そして、販売の将来を予測するためにトレーニングされたそのモデルを考えると、私たちが議論したフィードバックループの例について考えると、ここで有害または退化したケースが発生する可能性があります。つまり、モデルが需要や販売の低い予測を行い、それに基づいて低い容量計画を行い、したがって販売も少なくなり、最終的にはゼロになるという状況に陥ることがあります。モデルは需要が減少していると学習し始めますが、それは減少しているということです。逆に、逆方向にも進むことができます。

ですので、需要が低いと予測される状況になり、容量計画も低くなり、販売も少なくなり、最終的にはゼロになるという状況に陥ることがあります。モデルは需要が減少していると学習し始めますが、それは減少しているということです。逆に、逆方向にも進むことができます。

ジョアネス・ヴェルモレル: そうですね、歴史から学び、未来を予測するために機械学習モデルを使用する場合、このような素朴な方法では完全に間違ってしまう可能性があります。

ニコール・ジント: それはまるでバルホップ効果のように聞こえます。供給チェーンのミスや通常からの逸脱がシステムによって増幅されるということです。また、販売は必ずしも需要ではないことも述べました。たとえ在庫の50個を売ったとしても、需要が100個だった場合、販売は50個としか登録されません。この区別は、この問題の核心に関連しています。

アレクサンダー・バッカス: はい、需要自体は確かに観測されない量です。それを測定することはできないので、推測する必要があります。販売データはそれに最も近いものですが、それだけでは全体ではありません。

ニコール・ジント: ですので、私たちは予測が需要と販売に影響を与えるというアイデアについて議論しています。予測された需要が販売に影響を与え、フィードバックループを作り出すことがあります。天気予報を予測することとビジネスを予測することの違いを説明している人もいます。天気予報を予測することは影響を与えませんが、ビジネスを予測することは実際に影響を与えることができます。アレクサンダーさん、このフィードバックループについて詳しく説明していただけますか?また、先ほど言及したゼロ予測の問題を回避する方法はありますか?

アレクサンダー・バッカス: もちろんです。機械学習モデルが自身の出力データから学習すると、通常からの逸脱を増幅することがあります。例えば、何らかの理由で需要が少し減少した場合、モデルはシステムに対して注文を少なくするように指示するかもしれません。その結果、注文が少なくなるため、需要もさらに減少し、モデルはさらに少ない注文を提案することになり、ゼロ予測の問題が発生します。この問題は特に時系列の予測において一般的です。ジョアネス、機械学習システムでこの問題を回避する方法はありますか?

ジョアネス・ヴェルモレル: ゼロ予測は、在庫切れのバイアスを除去しない場合に発生するものです。在庫切れになると、売上がゼロとなりますが、それは需要がゼロであることを意味するわけではありません。Lokadでは、在庫切れのバイアスに対処するために少なくとも3つの手法を実際に使用しています。1つのアプローチは、予測モデルで最適化するメトリックを変更することです。時間を均一に適用するのではなく、在庫切れのある日には測定値をゼロにします。これは粗雑な方法ですが、うまく機能することがあります。

ニコール・ジント: 初めに通常使用されるメトリックは何ですか?変更することを提案するメトリックは?

ジョアネス・ヴェルモレル: 数千のメトリックがありますが、最も単純なものはL1、L2、またはMAPEです。問題は、メトリックを時間を均一に適用するかどうかです。通常、均一に適用することは望ましくありません。在庫切れのある日には測定値をゼロにしたいのです。

ニコール・ジント: ですので、ゼロにするとは、在庫切れのある日の寄与を除去することを意味しますか?

ジョアネス・ヴェルモレル: はい、信号が大幅に歪んでいることがわかっている日の寄与を除去します。その信号をカットすることはうまく機能しますが、かなり粗雑な方法です。

ニコール・ジント: 在庫切れが非常に一般的である場合は、それほど粗雑ではありません。多くの企業では、在庫切れは統計的には比較的まれなものです。サービスレベルが95%以上であるような場合、このような方法はうまく機能します。まるでまれな災害のようなものです。

ジョアネス・ヴェルモレル: いいえ、例えば、一般的な商品店、スーパーマーケットのようなものです。彼らは毎日95%以上のサービスレベルを持っています。それは問題ありません。問題になるのは、例えば、ハードラグジュアリーの店舗の場合です。この場合、ハードラグジュアリーの店舗は、例えば、カタログの中から500のアイテムを持っていることが一般的です。つまり、常に90%以上の在庫切れがあります。この場合、あまり意味がありません。ですので、業界によって異なります。食品などの業界では非常に高いサービスレベルが期待されます。あなたの商品は持っていることが期待されるものに向けられています。例えば、スーパーマーケットが通常ソーダのパックを販売している場合、その商品が見つかるという確信を持って店舗に入ることができるはずです。時々見つからないこともありますが、そのような出来事はまれです。ですので、見ている業界によります。

ニコール・ジント: そうですね、実際には、売上が需要について誤った信号を送ることがあります。売上がゼロの場合、ゼロ需要と誤って想定されることがありますが、実際には在庫がないためかもしれません。実際には非常に高い需要があるかもしれません。逆もまた同様です。他の商品の在庫切れが発生し、それが代替品として機能する場合、商品の売上が急増することがありますが、実際には在庫が不足していることを反映しているだけです。それにもかかわらず、顧客の認識では、それは悪いサービスであると思われるかもしれません。

ジョアネス・ヴェルモレル: はい、顧客は代替品を受け入れることができるかもしれませんが、それでもそれは劣った選択肢であると考えるかもしれません。ですから、興味深いのは、エージェント、顧客、そして彼らの考え方を考慮に入れて、顧客基盤に組み込まれる基本的な思考の流れを捉えるために需要のモデリングを調整する必要があるということです。

ニコール・ジント: このゼロの予測問題をどのように回避すれば、ゼロの売上がゼロの需要と想定されないようになりますか?

アレクサンダー・バッカス: ジランは、その信号を考慮に入れないようにすることを提案しました。技術的な用語で言えば、それは損失マスキングと呼ばれます。

ジョアネス・ヴェルモレル: はい、基本的にはそのデータポイントの寄与を除去します。もう一つの簡単なテクニックは、モデルに過去の在庫レベルと将来の予測を提供することで、これらの売上が在庫レベルにどのように影響を受けるかを理解することです。

アレクサンダー・バッカス: モデルは、それをモデル化することで、特定の在庫レベルの変動が将来の売上や需要に与える影響を学習することができます。基本的には、意思決定の影響です。

ジョアネス・ヴェルモレル: はい、それがみんなが行きたいところであり、以前の予測に基づいて行われたすべての意思決定を取り込んで予測モデルの入力としてフィードするということです。

ニコール・ジント: トレーニングする際に、在庫の決定だけでなく、ビジネスの指示によるマーケティングの決定なども在庫レベルに影響を与えることがあります。彼らは「これだけ売りたい」という目標を設定すること自体も意思決定です。市場の力があるからです。

アレクサンダー・バッカス: はい、市場の力です。プロモーション、価格データ、容量データなど、すべてを予測に入力として組み込みます。容量は需要にも影響を与えることがあります。リードタイムが急増すると、人々は代替品を探しに行きます。基本的には、ビジネス、倉庫などのすべての制約要素が需要に影響を与える入力信号として機能します。その後、モデルは過去のデータからこれらの信号の効果が需要に与える影響を学習し、それに対して補正を行うことができます。

これはモデリングのステップ2のようなものです。ここでは注意が必要なことがたくさんあります。興味深いのは、ビジネスユーザーがモデルを使用して、技術的な用語で言えば因果推論を行いたいということです。彼らは「このプロモーションを行った場合や在庫レベルを減らした場合、需要はどうなるのか?」といったことを調整したいのです。それはまるでシミュレーションのようなものです。

これが機能するためには、モデリングにはさらに注意を払う必要があります。私が説明した方法で行うと、在庫が少ないと需要が高くなるというような効果をモデルが簡単に学習してしまう可能性があります。なぜなら、実際の原因であるマーケティングキャンペーンが在庫を減らし、需要を増加させたからです。それは概念を混乱させます。これを共変量または逆因果関係と呼びます。必要な情報をすべて与えられていない標準的な機械学習モデルは、このような間違いをする可能性があります。

典型的な例は、天気が暑くなるかどうかを予測しようとする場合です。アイスクリームの販売数で予測できるかもしれません。もちろん、これは逆因果関係の典型的な例です。しかし、彼らは価格を下げたり在庫切れになったりしたかもしれませんし、それが実際の理由であるかもしれません。可能性はたくさんあります。

しかし、注意が必要です。これは、モデルに対してそれに関連する意思決定についての情報をより多く提供し、それがどのように関連するかを学習させるための方法です。ただし、モデル自体がこれらの関係を学習するのはかなり困難です、特にデータがない場合や多くのステップがある場合です。予測を行っても、ビジネスの中で誰かがそれを受け取って意思決定をするわけではありません。ビジネスの計画者によって情報が追加され、変更が加えられ、それに対してある程度盲目になります。再び問題が複雑化します。

L4 実際には、これらの新しい課題に取り組む方法について詳しく説明する前に…

Nicole Zint: 機械学習は、意思決定を出力し学習するよりスマートなモデルです。アレクサンダー、どのようにして各意思決定がビジネスに影響を与え、どの意思決定を行うべきかを見つけることができるのでしょうか?予測だけでなく、中間のステップも理解したいのです。しかし、その前に、ジョアネス、私たちは先ほど少し触れたゼロ予測モデルについて話しましたが、これはこの機械学習モデルにおける重要な概念です。Lokadでは、どのような予測手法の違いがありますか?確率的予測は、ゼロ予測の問題を解決し、私たちが議論したように、通常よりも大きな誤差になることを防ぐのに役立ちますか?確率的予測はそれをどのように変えるのでしょうか?

Joannes Vermorel: 確率的予測は、この点で非常に興味深いですし、一般的にはフィードバックループにも非常に役立ちます。これには2つの完全に異なる理由があります。1つ目は、私たちがある程度正確であることを試みるために、曖昧さの概念を導入するという考えです。完全に間違っているのではなく、少なくともおおよそ正しいことを目指します。

たとえば、ゼロ予測の状況では、確率的予測を行うと、持っている情報の品質がかなり曖昧であることを認識します。何が起こっているのかについて完璧なビジョンを持っていないため、需要が本当にゼロであるという絶対的な確信に収束することは、数値的にははるかに困難になります。確率的予測モデルが非常に優れているわけではないのですが、多くの値にわたる確率を考慮し、通常、サービスを提供できるか、単に1日分の在庫を保持するかという間に強い非対称性があることを加味すると、多くの状況では、1日分の余分なユニットを保持することをリスクを冒すよりも好む傾向があります。トレードオフは、非常に高いサービスレベルに向けられています。

したがって、確率的予測から得られるものは、確率が広がった状況です。将来についての数値的な声明である予測が、ただゼロの需要という退化した状態に急速に収束することはありません。問題が発生する可能性がありますので、繰り返し在庫切れが発生する場合、確率的予測は魔法ではありません。実際の将来の需要を過小評価する可能性が高いです。ただし、依然として需要が1つまたは2つまたは3つのユニットある可能性が非ゼロであると推定しているため、在庫がゼロに凍結することを避ける可能性が高いです。これが最初の議論です。それは一方向に拡大するのを防ぎます。

Alexander Backus: はい、特にフィードバックループがある場合、状況を完全に制御することは非常に困難です。ジョアネスが言及したように、一方向に拡大しないものを持つ方が良いです。

Nicole Zint: すべてを完全にマスターしていると思い込むことは重要です。再度言いますが、私たちが話しているのは惑星の動きではありません。30〜60%の不正確さは何も驚くことではありません。

Joannes Vermorel: したがって、私たちが将来について行う数値的な声明の不正確さの度合いは非常に高いです。少なくとも確率的な予測は、私たちが持っているこの巨大な周囲の不確実性を反映するものを提供します。再度言いますが、私たちは人間、反応できる人々をモデル化しようとしています。それは非常に非常に困難であり、最初に認識するべきことは、自分が制御していないということです。つまり、それらの人々-顧客、サプライヤー、競合他社-彼らは賢く、彼ら自身のゲームをしていて、たくさんのことをしています。起こることを完璧にモデル化できると主張することは、少し傲慢であると言えるでしょう。それは、アシモフのSF小説の基礎となるでしょう。そこでは、大規模な文明の未来を完璧に統計的にモデル化することができます。それは非常に困難であり、おそらく現実的ではないでしょう。

Joannes Vermorel: 確率的予測は、まったく異なる理由でも非常に興味深いです。2番目の理由は、過去と未来の間に完全な対称性がある点予測とは異なり、将来には一日あたりのSKUごとの1つの測定値があります。つまり、販売数や需要などです。そして、将来に投影すると、SKUごとに1日あたりの測定値が得られます。したがって、予測は過去の観測と非常に対称的です。しかし、確率的予測の領域に入ると、見ているものは確率分布または一連の確率分布です。したがって、過去と未来の間に非常に強い非対称性があります。突然、未来は完全に過去とは異なります。過去には観測があり、それらはユニークです。不確実性はなく、ある場合でも、それは測定自体の不確実性だけです。販売記録には事務的なエラーがあるかもしれませんが、規模の順序に関しては非常に非常に小さいです。これはほとんど常に供給チェーンでは不確実性がないと見なされることがほとんどです。一方、未来では不確実性が非常に大きく、それが確率分布です。

Joannes Vermorel: したがって、非常に興味深いことは、フィードバックループがもう1つの追加次元であるということです。これは予測を豊かにし、より堅牢にする方法ですが、確率的予測が確率を導入することに関連しているのに対して、フィードバックループは予測を高次の関数にする方法です。基本的に、予測は結果でもなく、確率分布でもなく、ポリシー、反応の一種を注入できるメカニズムです。したがって、誰かが行動すると、この誰かはあなた自身である場合さえ、予測に影響を与えることがわかるだけです。

Nicole Zint: したがって、フィードバックループの領域に入ると、状況はより動的で包括的になります。これが予測にどのように影響し、より難しくなるのか説明できますか?

Joannes Vermorel: フィードバックループの領域に入ると、ポリシーのような機能的な要素が必要な動的なものに対処しています。このポリシーは、在庫、価格、予測を表すさまざまな要素に対してどのように反応するかを指示します。フィードバックループによって予測はより難しくなります。そして、人々が「予測」と言うとき、通常はポイント予測を考えています。ポリシー予測の領域に入ると、人々が考えることができる範囲を既に広げています。確率分布になると、視覚化するのがはるかに難しくなります。

たとえば、価格が変動して供給チェーンの流れを維持するようになるという事実。企業が大量の不足を経験する可能性がある場合、最も自然な対応策は価格を徐々に引き上げて不足を軽減することです。逆に、大量の在庫過剰状態に陥る可能性がある場合、自然な対応策は価格を下げて需要を増やし、在庫を処分することです。これらの例では、将来についての予測は、価格政策に依存します。フィードバックループについて考え始めると、予測は条件付きになり、ある程度は制御可能なポリシーを考慮に入れます。

Nicole Zint: アレクサンダーさん、ジョアネスが確率的予測手法と時系列との比較で述べた強みと違いについて、同意されますか?

Alexander Backus: はい、価格などの過去の意思決定にモデルがアクセスできることで、この問題を軽減することができます。ジョアネスは時系列と確率的予測について話しましたが、私たちは将来の意思決定とトレーニングデータに影響を与える予測だけでなく、部分的な観測性も考慮する必要があります。つまり、実際には意思決定の効果しか観測できず、もしもより多くの能力や在庫があった場合に何が起こったかはわかりません。これは反事実と呼ばれます。課題は、すべての意思決定の影響を正確に予測するために十分に優れたモデルを作成することです。

この現象は、電子商取引の推奨システムでは非常によく知られており、サプライチェーンではあまり知られていません。これはバンディットフィードバックと呼ばれます。この用語は、カジノのスロットマシンでの報酬や引くアームを観察するだけの状況を指します。

Nicole Zint: それは同じ効果であり、推奨システムはそれに似ています。なぜなら、特定の広告を表示した場合、顧客に異なる広告を表示した場合に何が起こったかはわかりません。これには特定のモデリング手法があり、最初に話した単純な教師あり学習のセットアップでは対応できません。したがって、これはアクションの効果を予測するのに適していません。むしろ、機械学習の問題を再構築し、モデルが将来についての予測を出力するのではなく、最適な意思決定を出力するようにする必要があります。これがジョアネスが言及したものであり、ポリシーと呼ばれます。つまり、これをすべきだというモデルを学習します。これが表示すべき広告であり、サプライチェーンの文脈では、AからBに移動すべき在庫であり、予測そのものではなく、機械がどのような意思決定をしたかを機械が知らないままで意思決定を行います。理論的には、予測全体を完全にスキップして、これをすべきだと言うことができます。

Alexander Backus: これには特定の機械学習アルゴリズムがあり、より広範なクラスは強化学習と呼ばれています。これは実世界でアクションを起こし、その効果を観察し、報酬、財務報酬の観点でフレーム化するものです。そして、そのフィードバックに基づいてモデルを更新します。あなたは財務報酬について言及しましたので、例えば、この程度の在庫を注文するという決定を下し、サプライチェーンのパフォーマンス、口座に入ったお金などを観察し、それがシステムにフィードバックされることで、このような意思決定を行ったときの結果を理解します。

Joannes Vermorel: そういった財務的な強化学習や財務目標は、在庫コスト、逃した機会などを考慮に入れることができます。それについて詳しく説明することもできますし、このままにしておくこともできます。ですので、それを強化学習アルゴリズムで最適化します。これにより、直接意思決定を学習し、出力すべき意思決定を学びます。これにより、この自己成就予言をより受け入れることができます。最初の議論の始めで話したように、良いことでも悪いことでもありません。ただ無視することはできません。これにより、過去の意思決定の影響から学び、より良い意思決定を作成することができます。

Alexander Backus: それについて少し考える必要があります。なぜなら、それは実験もできる必要があるということを意味するからです。そして、このセットアップでは、もちろん、モデルが学習し、AまたはBを行った場合に何が起こるかを見ることは非常に困難です。

Nicole Zint: それでは、これが以前に本質的に適用されていないのはなぜですか、またはどこにも適用されていないのですか?

Alexander Backus: まあ、これがその理由の1つです。また、典型的な強化学習アルゴリズムはオンラインで学習しています。つまり、アクションを実行し、それに対する報酬フィードバックから学習します。これは、リアルワールドの設定では問題があります。リスクが多く関わっている場合や、最初に合理的な結果を出力するためのアルゴリズムの開始点がない場合です。ランダムに初期化されます。または、Google DeepMindのAlphaZeroがチェスをプレイするために学習している他の強化学習設定でよく見られるように、非常に良いシミュレーション環境が必要です。彼らはシミュレーションを持っているため、この強化学習アルゴリズムを試すことなく供給チェーンを犠牲にする必要はありません。

Nicole Zint: 他の人の供給チェーンを犠牲にする必要はありません。

Alexander Backus: 正確には、試行錯誤のウサギは必要ありません。しかし、これは私たちの場合において鶏と卵の問題です。なぜなら、現実の非常に正確なモデルが必要です。それがあれば、問題は既に解決されています。したがって、まず供給チェーンが必要であり、それを行う必要はありません。供給チェーンのモデルが必要です。それがあれば、トレーニングの必要はなく、機会を見つけることができるはずです。最初に戻ります。

そうですが、最近は歴史的なデータから学習する有望な方向があります。それはオフライン強化学習と呼ばれ、以前に行われた歴史的な意思決定から学習するものです。望ましいほどきれいに広がっていないとしても、以前に収集された実世界のデータに基づいてアルゴリズムをトレーニングすることは可能です。

Nicole Zint: スタート地点のようなものですか?

Alexander Backus: はい、スタート地点のようなものです。そしてそこから、よりオンラインの設定に移行するか、バッチでオフラインでトレーニングしてからリリースすることができます。いくつかのオプションがありますが、これには独自の課題もあります。ジョアネス、アレクサンダーが説明したことについて、あなたの意見はどうですか?オフラインで始めて、以前のデータから学習し、それによって、鶏と卵の問題を回避し、実際の供給チェーンに適用できるほど十分になり、それからどうしますか?これについてどう思いますか?

Joannes Vermorel: データの効率性は、供給チェーンにおけるあらゆる種類の機械学習アルゴリズムにとってほぼ常に懸念事項です。巨大なデータ量を持つことは滅多にありません。少なくとも、意思決定が行われる粒度でのデータ量はありません。供給チェーンの意思決定は、通常、SKUレベルで行われる必要があります。そして、バッチ処理が行われるため、店舗のSKUを見ている場合でも、1日あたりのユニット数は数百万ではありません。工場のSKUを見ている場合、大きなバッチがあり、1つのバッチあたり10,000ユニットになります。また、1日あたりのバッチ数は数百万ではありません。したがって、関連する観測量はまだ比較的限られています。

それは強化学習にとって常に課題となる側面の1つです。データがあまりにも少ないため、シミュレータは非常に興味深いものですが、私の講義の1つで簡単に触れたポイントでもあります。本質的に、確率的な予測とシミュレータの間には双対性があります。確率的な予測があれば、常に観測値をサンプリングすることができ、それによって確率的な予測からシミュレータを得ることができます。そして、シミュレータがあれば、多くのシミュレーションを実行し、それぞれの確率を計算することができ、再び確率的な予測に戻ることができます。非常に強い双対性があります。

はい、それは興味深いですが、非常に正確な確率的予測が必要です。それは非常に困難です。

Nicole Zint: 部分的な観測性は特に難しい問題です。たとえば、価格変動を調査したいとします。企業は過去10年間、ランダムに価格変動を行っていない特定の方法で運営していたかもしれません。非常に強い習慣がある場合もあります。たとえば、習慣が非常に強い場合、実際の原因を区別することが問題になることがあります。

Joannes Vermorel: もし会社が毎年1月末になると、年初のセールを行うことを決めた場合はどうでしょう?彼らは1月末に需要の急増として観測されるでしょう。しかし、季節性の影響はどうでしょうか?割引なしでも月末に需要の急増が観測されるでしょうか?そして、割引からの影響の割合はどれくらいでしょうか?

Alexander Backus: それが問題です。意思決定はランダムに行われていないため、観測されるものは通常の慣行をかなり反映しています。強化学習でその問題に取り組む方法の1つは、探索と活用のミックスを導入することです。活用は、観測したものに基づいて最善の行動を取ることであり、探索は、部分的にランダムであるため劣ると予想される新しいことを試すことです。

Joannes Vermorel: では、なぜ劣る可能性が高い行動を試すのでしょうか?答えは、最終的に優れたものを発見する唯一の方法だからです。それは研究開発のための投資です。非常に平凡な形を取ることもあるかもしれません。たとえば、店舗でキャンドルを販売しているとします。

Alexander Backus: そして気づくのですが、同じキャンドルを価格を4倍高くするか4倍低くするか試してみたらどうでしょう?どちらの選択肢も妥当かもしれません。もしサプライヤーから大量注文をすることで数量を大幅に増やし、基本製品の価格を大幅に下げることができれば、価格を大幅に下げることができるかもしれません。キャンドルをわざと選んでいますが、価格をはるかに下げることができ、観測される需要を10倍に増やすことができるかもしれません。

Joannes Vermorel: それは価値のあるトレードオフです。または完全に異なる経路を選び、“私はより高級なものを目指し、香りやフレーバーを追加し、より良いパッケージングを行い、価格を4倍にする"と言うこともできます。以前の需要の10分の1しかないかもしれませんが、価格がはるかに高い製品に対して半分の需要があります。

Alexander Backus: しかし、歴史を見ると、おそらく私たちが観測した変動はベースラインに比べてわずかな変動でした。私たちの歴史は、もっとクレイジーなシナリオを含んでいません。

Joannes Vermorel: はい、また、製品を取り上げて、「5つの異なる色のバリアントを導入したらどうなるか」と言うこともあります。

Nicole Zint: キャンドルのような製品を取り上げて、異なる色のキャンドルを導入すると、どの程度の自己食い合いが観測されるか、または実際に新しい市場に触れているかを知りたいです。例えば、キャンドルを取り上げて、キャンドルの色を複数導入すると、異なる色のキャンドルが自己食い合いを起こす割合と、完全に新しい需要をどの程度満たすかを知りたいです。

Joannes Vermorel: わかりませんし、おそらくこのレコーダーが私にそれを少し示してくれるかもしれません。しかし、大部分では、企業が何らかの機械駆動のランダム性を導入し始めると、ほとんどランダム性はありません。それはむしろ習慣パターンの問題です。また、それは企業の運営方法にも関係しています。たとえば、価格決定がある場合、それは単にアイデアを思いついた人だけではありません。それには方法があり、人々は「このような状況では、製品に割引を適用するべきです。それは通常の慣行であり、理にかなっています。」と言うように訓練されています。それは問題ありませんが、歴史データで観測される価格の変動のほとんどは、常に設定されている方法です。

Alexander Backus: しかし、それでもそれは良い出発点ですよね。あなたが言ったように、他に何をすることがありますか?供給チェーンを犠牲にするか、素晴らしいシミュレーションを作成するかですが、それはまた、良いデータがあるという考えに基づいています。しかし、私が言ったように、オフラインの方法で行う場合、私たちの既存の販売履歴やデータを見ると、通常の範囲からの大きな逸脱を見ることができないかもしれませんが、それはあなたの意見ではまだ正しい出発点ですか?

Joannes Vermorel: 私は、正しい出発点は少し異なると考えています。正しい出発点は、フィードバックループがある場合、これが基本的であることを認識することです。もし私たちがそれらのフィードバックループが実際に存在し、それらに取り組みたいと思うなら、それは予測自体へのパラダイムの変化です。それが本当の出発点です。残りは技術的な問題です。たくさんのモデルがあります。最も単純な強化学習モデルであるバンディットのようなものは、非常にシンプルです。一部は非常に複雑ですが、それらは技術的な問題です。私が実際の供給チェーンで観察したことは、それらのフィードバックループを受け入れることと同じくらいシンプルなものを実際に受け入れることが最大の課題であるということです。予測は決して同じになることはありませんし、私は数量的に言っているのではありません。パラダイムの観点から言っています。これらの予測を同じように見ることはできません。これはもはや同じオブジェクトではありません。これは異なる性質のものです。これは非常に難しいことですが、通常、私が受ける質問は、「私の予測はより正確になりますか?」というものです。フィードバックループを見始めると、フィードバックループがある場合に正確さをどのように測定するかという問題が生じます。それは独自の問題です。それは難しい問題です。

Alexander Backus: そうですね、それについて言及できれば、私たちは技術的な課題やデータの利用可能性の課題について議論してきました。しかし、私はJoannesと完全に同意します。企業の設定で適用されたり採用されなかったりする主な理由は、それがビジネスプロセスに深い影響を与えるからです。ですから、このような理論的な設定では…

Nicole Zint: では、あなたは電子商取引業界で最も技術志向のプレイヤーは誰だと思いますか?

Joannes Vermorel: トレンドとしては、私は非常に攻撃的な技術志向のプレイヤー、つまりdd.com、Amazon.com、Alibaba.comだと思います。そうです、彼らは本当にトップレベルです。彼らは非常に効果的です。

Alexander Backus: それに同意します。これらの企業は、技術とイノベーションにおいて業界のリーダーです。

Nicole Zint: では、世界は長年にわたって大きく変わりました。ジョアネスさん、あなたは今の私たちが住んでいる世界についてどう思いますか?

Joannes Vermorel: まあ、それは以前のように単純ではありません。世界はまだ進化していますが、過去数年間で多くの驚きがありました。すべてが予測可能な歴史の終わりではありません。世界は混沌としており、私たちは供給チェーンの人間、機械、プロセスの不確実性と複雑さを受け入れなければなりません。完全な制御はできませんので、私のアプローチは正確に間違っているよりもすべてを捉えるためにおおよそ正確であることです。

Nicole Zint: それは非常に興味深い見解ですね。では、Alexanderさん、新しいメンバーをチームに迎える際にどのような才能を探していますか?

Alexander Backus: IKEAでは、大企業の課題を解決するために優れたデータサイエンスの才能を常に求めています。私たちは多くのデータとグローバルスケールでの影響力を持っているため、既存の状況に挑戦する必要があります。

Nicole Zint: 両方とも貴重なご意見をありがとうございました。今日はお話しいただき、本当にありがとうございました。

Joannes Vermorel: はい、ありがとうございました。

Alexander Backus: お招きいただき、ありがとうございました。