Lissage exponentiel probabiliste pour l'IA explicable dans le domaine de la Supply Chain
L’une des pistes de recherche de Lokad consiste à revisiter quelque chose de simple (et fondamental) et à essayer de l’améliorer (et de le simplifier). Cette approche tend à être exactement l’opposé de la plupart des articles de recherche, qui se présentent comme des versions plus complexes de travaux antérieurs. Ainsi, par défaut, nous privilégions la simplicité plutôt que la sophistication. L’un des ingénieurs R&D de Lokad, Antonio Cifonelli, a appliqué cette approche dans sa thèse de doctorat, s’attaquant au vénérable modèle de lissage exponentiel pour lui conférer de meilleures caractéristiques — à savoir, le rendre plus explicable.

L’explicabilité, en tant que qualité d’un modèle, est souvent mal comprise tant dans sa nature que dans son intention — du moins en ce qui concerne les supply chains. Disposer d’un modèle explicable ne consiste pas à obtenir des résultats pouvant être facilement compris ou validés par l’esprit humain. Cela serait fort erroné, étant donné que quelques opérations en virgule flottante suffisent déjà à déconcerter la plupart des gens, y compris ceux qui se disent à l’aise avec les chiffres. L’esprit humain n’est tout simplement pas naturellement doué pour l’arithmétique de base ; c’était, après tout, le premier domaine à être dépassé par les machines dans les années 1950. De plus, l’explicabilité n’a pas pour but de rendre le modèle digne de confiance — enfin, pas tout à fait. Il existe des instruments plus fiables (backtesting, cross-validation, etc.) pour évaluer si un modèle doit être considéré comme fiable ou non. Être capable de construire un récit autour du modèle et de ses résultats ne devrait pas être considéré comme une garantie suffisante de confiance.
Du point de vue de Lokad, l’objectif de l’explicabilité est de préserver la possibilité d’opérer la Supply Chain à l’aide d’une variante du modèle lorsqu’une perturbation remet en cause le modèle original. Les disruptions supply chain sont variées : guerres, tarifs, confinements, faillites, tempêtes, litiges, etc. Lorsqu’une perturbation survient, le modèle prédictif devient invalide de manière subtile mais significative. Toutefois, cela ne signifie pas que tous les schémas jamais capturés par le modèle cessent d’être pertinents. Par exemple, le profil de saisonnalité du modèle peut demeurer entièrement inchangé.
Ainsi, un modèle explicable devrait offrir à un Supply Chain Scientist les moyens de modifier, d’ajuster ou de déformer le modèle original afin d’obtenir une variante qui reflétera de manière adéquate la perturbation. Naturellement, ces modifications sont destinées à être des approximations — de nature heuristique — puisque des données précises ne sont pas encore disponibles. Néanmoins, comme le dit le mantra adopté par Lokad, il vaut mieux être approximativement correct que précisément faux.
Pour plus de détails sur l’apparence possible des modèles explicables, consultez le manuscrit de doctorat du Dr Cifonelli ci-dessous.
Auteur: Antonio Cifonelli
Date: Décembre 2023
Résumé:
Le rôle clé que l’IA pourrait jouer dans l’amélioration des opérations commerciales est reconnu depuis longtemps (au moins depuis 2017), mais le processus de pénétration de cette nouvelle technologie a rencontré certains obstacles au sein des entreprises, en particulier les coûts de mise en œuvre. Les entreprises restent attachées à leurs anciens systèmes en raison de l’énergie et de l’argent nécessaires pour les remplacer. En moyenne, il faut 2,8 ans entre la sélection d’un fournisseur et le déploiement complet d’une nouvelle solution. Il y a trois points fondamentaux à considérer lors du développement d’un nouveau modèle : un décalage des attentes, le besoin de compréhension et d’explication, ainsi que des problèmes de performance et de fiabilité. Dans le cas des modèles traitant des données de supply chain, il existe cinq enjeux spécifiques supplémentaires :
- Gérer l’incertitude. La précision n’est pas tout. Les décideurs recherchent un moyen de minimiser le risque associé à chacune de leurs décisions en présence d’incertitude. Obtenir une prévision exacte est avantageux ; obtenir une prévision assez précise et en calculer les limites est réaliste et approprié.
- Gérer les données entières et positives. La plupart des articles vendus au détail ne peuvent être vendus en sous-unités, comme par exemple une boîte de conserve, une pièce détachée ou un t-shirt. Cet aspect fondamental de la vente entraîne une contrainte que doit satisfaire le résultat de toute méthode ou modèle : le résultat doit être un entier positif.
- Observabilité. La demande des clients ne peut pas être mesurée directement, seules les ventes peuvent être enregistrées et utilisées comme substitut de la demande.
- Rareté et parcimonie. Les ventes sont une grandeur discontinue : un produit peut bien se vendre une semaine, puis pas du tout la suivante. En enregistrant les ventes au quotidien, une année entière se condense en seulement 365 (ou 366) points. De plus, une grande proportion d’entre eux sera nulle.
- Optimisation just-in-time. La prévision est une fonction clé, mais elle n’est qu’un élément d’une chaîne de processus soutenant la prise de décision. Le temps est une ressource précieuse qui ne peut être entièrement affectée à une seule fonction. Le processus de prise de décision et les adaptations associées doivent donc être réalisés dans un délai restreint, et de manière suffisamment flexible pour pouvoir être interrompus et redémarrés si nécessaire afin d’intégrer des événements inattendus ou des ajustements indispensables.
Cette thèse s’inscrit dans ce contexte et est le fruit des travaux réalisés au cœur de Lokad, une entreprise de logiciels basée à Paris qui vise à combler le fossé entre la technologie et la Supply Chain. La recherche doctorale a été financée par Lokad en collaboration avec l’ANRT dans le cadre d’un contrat CIFRE. Le travail proposé se veut être un bon compromis entre les nouvelles technologies et les attentes des entreprises, en abordant les divers aspects présentés ci-dessus. Nous avons commencé à prévoir en utilisant des méthodes de base — la famille du lissage exponentiel —, qui sont faciles à mettre en œuvre et extrêmement rapides à exécuter. Comme elles sont largement utilisées dans l’industrie, elles ont déjà gagné la confiance des utilisateurs. De plus, elles sont faciles à comprendre et à expliquer à un public non spécialiste. En exploitant des techniques d’IA plus avancées, certaines des limitations des modèles utilisés peuvent être surmontées. Le cross-learning s’est révélé être une approche pertinente pour extrapoler des informations utiles lorsque le nombre de données disponibles était très limité. Étant donné que l’hypothèse gaussienne courante n’est pas adaptée aux données de ventes discrètes, nous avons proposé d’utiliser un modèle associé soit à une distribution de Poisson, soit à une distribution binomiale négative, qui correspond mieux à la nature des phénomènes que nous cherchons à modéliser et à prédire. Nous avons également proposé d’utiliser la simulation pour faire face à l’incertitude. En recourant à des simulations Monte Carlo, un certain nombre de scénarios sont générés, échantillonnés et modélisés à l’aide d’une distribution. À partir de cette distribution, des intervalles de confiance de tailles différentes et adaptées peuvent être déduits. En utilisant des données réelles d’entreprise, nous avons comparé notre approche avec des méthodes de pointe telles que le modèle Deep Auto-Regressive (DeepAR), le modèle Deep State Space (DeepSSMs) et le modèle Neural Basis Expansion Analysis (N-Beats). Nous avons ainsi déduit un nouveau modèle basé sur la méthode Holt-Winter. Ces modèles ont été implémentés dans le workflow de Lokad.
Jury:
La soutenance a eu lieu devant un jury composé de :
- M. Massih-Reza AMINI, professeur à l’Université Grenoble, Alpes, Rapporteur.
- M.me Mireille BATTON-HUBERT, professeur à l’École des Mines de Saint-Étienne, Rapporteur.
- M.me Samia AINOUZ, professeur à l’INSA Rouen, Normandie, Examinatrice.
- M. Stéphane CANU, professeur à l’INSA-Rouen, Normandie, Directeur de thèse.
- M.me Sylvie LE HÉGARAT-MASCLE, professeur à Paris-Saclay, Examinatrice.
- M. Joannes VERMOREL, CEO de Lokad, Membre invité.