サプライチェーン領域における説明可能AIのための確率的指数平滑法
Lokadの研究の一環は、シンプルで(かつ基本的な)ものを再考し、少しでも改良し(かつよりシンプルにする)ことにあります。このアプローチは、従来の研究論文が先行研究の複雑なバージョンであることが多い状況とは正反対です。したがって、私たちはデフォルトで、洗練度の向上よりも単純さの追求を目指します。LokadのR&DエンジニアであるAntonio Cifonelliは、このアプローチを博士論文において適用し、伝統的な指数平滑法モデルに対して、より説明可能な特性という形で改善を試みました。

モデルの特性としての説明可能性は、その本質や意図においてしばしば誤解されがちです—特にサプライチェーンに関しては。説明可能なモデルとは、人間が容易に理解・検証できる結果を得ることを意味するわけではありません。実際、たった数回の浮動小数点演算だけで、数字に強い自信を持つ人でさえ混乱してしまうのです。人間の頭脳は基本的な算術において(本来)得意ではなく、そもそも1950年代に機械に取って代わられた最初の分野でもありました。また、説明可能性は必ずしもモデルを信頼に足るものにするためのものではありません。信頼性を評価するには、バックテストやクロスバリデーションなど、より信頼できる手法が存在します。モデルやその結果についての物語を紡ぐことだけで信頼が得られるとは考えられるべきではありません。
Lokadの視点では、説明可能性の要点は元のモデルが無効となるような混乱に直面した際に、モデルの 変種 を通してサプライチェーンを運用する可能性を保持することにあります。サプライチェーンの混乱は、戦争、関税、ロックダウン、倒産、嵐、訴訟など多岐にわたります。混乱が起こると、予測モデルは微妙ではあるものの重要な点で無効となります。しかし、それはモデルがこれまでに捉えたすべてのパターンが無意味になるということを意味しません。例えば、モデルの季節性プロファイルは全く影響を受けない場合もあるのです。
そのため、_説明可能なモデル_は、サプライチェーン・サイエンティストが、混乱を適切に反映する変種を得るために、元のモデルを修正、微調整、または歪める方法を提供すべきです。当然、これらの変更はあくまで概算的なものであり、ヒューリスティックな手法となります。なぜなら、正確なデータがまだ存在しないからです。それにもかかわらず、Lokadの信条にもあるように、「概ね正しければ、完全に間違っているよりまし」という考え方が根底にあります。
説明可能なモデルがどのようなものかについての詳細は、以下のDr Cifonelliの博士論文原稿をご参照ください。
著者: Antonio Cifonelli
日付: 2023年12月
概要:
ビジネス運営の改善においてAIが果たす鍵となる役割は長い間(少なくとも2017年以降)知られてきましたが、この新技術の普及過程では、特に企業内部において導入コストなどいくつかの障壁に直面してきました。企業は、既存システムの置換に伴うコストと労力から、それらに固執する傾向があります。平均すると、サプライヤの選定から新たなソリューションの全面展開までに2.8年を要します。新しいモデルを開発する際には、期待の不一致、理解と説明の必要性、そしてパフォーマンスと信頼性の問題という、三つの基本的なポイントを考慮する必要があります。サプライチェーンデータを扱うモデルの場合、さらに五つの特有の問題があります:
- 不確実性の管理。精度が全てではありません。意思決定者は、不確実性が存在する中で行う各決定に伴うリスクを最小化する方法を求めています。正確な予測を得ることは有利ですが、かなり正確な予測を得、その限界を算出することが現実的で適切です。
- 整数および正のデータの取扱い。小売で販売されるほとんどの商品は部分単位で販売することができません。例えば、食品の缶、部品、またはTシャツなどです。この単純な販売形態が、どの手法やモデルにおいても、結果が正の整数でなければならないという制約を生み出します。
- 観測可能性。顧客の需要は直接測定することができず、販売実績のみが記録され、需要の代理として用いられます。
- 希少性と節約性。販売は不連続な量であり、ある週は好調に売れる商品も翌週には全く売れないことがあります。日別に販売を記録すると、1年がたった365(または366)ポイントに凝縮され、しかもその大部分がゼロとなります。
- ジャストインタイム最適化。予測は重要な機能ですが、意思決定を支えるプロセスのひとつの要素に過ぎません。時間は貴重な資源であり、一つの機能に全てを割り当てることはできません。そのため、意思決定プロセスおよびそれに伴う調整は、限られた時間枠内で、必要に応じて中断および再開が可能な柔軟な方法で実施される必要があります。
本論文はこの文脈に位置しており、テクノロジーとサプライチェーンのギャップを埋めることを目指すパリ発のソフトウェア企業Lokadの中心で行われた研究の成果です。博士研究はCIFRE契約の下、ANRTとの協力によりLokadが資金提供を行いました。提案された研究は、新技術とビジネスの期待との間で良好な折衷案となることを目指し、前述の様々な側面に対応しています。 我々は、実装が容易で極めて高速に実行可能な基本的手法—指数平滑法ファミリー—を用いた予測を開始しました。これらは業界で広く使用されているため、既にユーザーの信頼を獲得しています。さらに、専門知識のない聴衆にも理解しやすく、説明が容易です。より高度なAI技術を活用することで、使用中のモデルのいくつかの制約を克服することが可能です。 クロスラーニングは、利用可能なデータ数が非常に限られている場合に有用な情報を外挿するための適切な手法であることが証明されました。一般的なガウス分布の仮定は離散的な販売データには適さないため、ポアソン分布またはネガティブ・ビノミアル分布に基づくモデルの使用を提案し、対象とする現象の本質により適合させました。また、不確実性に対処するためにシミュレーションの活用も提案しました。モンテカルロシミュレーションを用いることで、複数のシナリオが生成、サンプリングされ、分布を用いてモデル化されます。この分布から、異なる適応サイズの信頼区間を導出することが可能となります。実際の企業データを用いて、我々のアプローチをDeep Auto-Regressive (DeepAR)モデル、Deep State Space (DeepSSMs)モデル、Neural Basis Expansion Analysis (N-Beats)モデルなどの最先端手法と比較しました。そして、Holt-Winter法に基づく新たなモデルを導出し、これらのモデルをLokadのワークフローに実装しました。
審査員:
審査は次のメンバーから構成される審査員の前で行われました:
- M. Massih-Reza AMINI, Université Grenoble, Alpesの教授、審査報告者。
- Mme Mireille BATTON-HUBERT, École des Mines de Saint-Étienneの教授、審査報告者。
- Mme Samia AINOUZ, INSA Rouen, Normandieの教授、審査員。
- M. Stéphane CANU, INSA-Rouen, Normandieの教授、論文指導教官。
- Mme Sylvie LE HÉGARAT-MASCLE, Paris-Saclayの教授、審査員。
- M. Joannes VERMOREL, LokadのCEO、招聘メンバー。