L’un des axes de recherche de Lokad consiste à revisiter quelque chose de simple (et fondamental) et à essayer de l’améliorer un peu (et de le rendre un peu plus simple). Cette approche tend à être exactement l’opposée de la plupart des articles de recherche, qui sont souvent des versions plus complexes de travaux antérieurs. Ainsi, par défaut, nous nous efforçons de privilégier la simplicité plutôt que la sophistication. L’un des ingénieurs R&D de Lokad, Antonio Cifonelli, a appliqué cette approche dans sa thèse de doctorat, en s’attaquant au vénérable modèle de l’exponential smoothing pour lui donner de meilleures caractéristiques - notamment en le rendant plus explicatif.

Deux figures tirées d'une thèse de doctorat sur le Probabilistic Exponential Smoothing pour une IA explicative dans le domaine de la Supply Chain.

L’explicabilité, en tant que qualité d’un modèle, est souvent mal comprise, tant dans sa nature que dans son objectif - du moins en ce qui concerne les chaînes d’approvisionnement. Avoir un modèle explicatif ne signifie pas obtenir des résultats qui peuvent être facilement compris ou validés par l’esprit humain. Ce serait très erroné, étant donné qu’une demi-douzaine d’opérations à virgule flottante suffisent déjà à confondre la plupart des gens, y compris ceux qui se considèrent à l’aise avec les chiffres. L’esprit humain n’est tout simplement pas (naturellement) doué pour les opérations arithmétiques de base ; après tout, c’est le premier domaine à avoir été dépassé par les machines dans les années 1950. De plus, l’explicabilité n’a pas pour but de rendre le modèle fiable - du moins pas complètement. Il existe des instruments plus fiables (backtesting, cross-validation, etc.) pour évaluer si un modèle doit être considéré comme fiable ou non. Être capable de raconter une histoire sur le modèle et ses résultats ne devrait pas être considéré comme une raison suffisante pour accorder sa confiance.

Du point de vue de Lokad, l’objectif de l’explicabilité est de préserver la possibilité de faire fonctionner la chaîne d’approvisionnement grâce à une variante du modèle lorsqu’elle est confrontée à une perturbation qui invalide le modèle original. Les perturbations de la chaîne d’approvisionnement sont variées : guerres, tarifs, confinements, faillites, tempêtes, litiges, etc. Lorsqu’une perturbation se produit, le modèle prédictif devient invalide de manière subtile mais importante. Cependant, cela ne signifie pas que tous les motifs jamais capturés par le modèle cessent d’être pertinents. Par exemple, le profil de saisonnalité du modèle peut rester entièrement intact.

En tant que tel, un modèle explicatif devrait fournir des moyens à un Supply Chain Scientist de modifier, ajuster ou déformer le modèle original afin d’obtenir une variante qui reflète adéquatement la perturbation. Naturellement, ces changements sont censés être des estimations approximatives - de nature heuristique - car des données précises ne sont pas encore disponibles. Néanmoins, comme le dit le mantra adopté par Lokad, il vaut mieux être approximativement correct qu’exactement faux.

Pour plus de détails sur ce à quoi pourraient ressembler les modèles explicatifs, consultez le manuscrit de thèse du Dr Cifonelli ci-dessous.

Auteur : Antonio Cifonelli

Date : décembre 2023

Résumé :

Le rôle clé que l’IA pourrait jouer dans l’amélioration des opérations commerciales est connu depuis longtemps (au moins depuis 2017), mais le processus de pénétration de cette nouvelle technologie a rencontré certains obstacles au sein des entreprises, en particulier les coûts de mise en œuvre. Les entreprises restent attachées à leurs anciens systèmes en raison de l’énergie et de l’argent nécessaires pour les remplacer. En moyenne, il faut 2,8 ans, de la sélection du fournisseur au déploiement complet d’une nouvelle solution. Il y a trois points fondamentaux à prendre en compte lors du développement d’un nouveau modèle. Le désalignement des attentes, le besoin de compréhension et d’explication, et les problèmes de performance et de fiabilité. Dans le cas des modèles traitant des données de la chaîne d’approvisionnement, il existe cinq problèmes spécifiques supplémentaires :

  • Gestion de l’incertitude. La précision n’est pas tout. Les décideurs recherchent un moyen de minimiser le risque associé à chaque décision qu’ils doivent prendre en présence d’incertitude. Obtenir une prévision exacte est avantageux ; obtenir une prévision assez précise et calculer ses limites est réaliste et approprié.
  • Gestion des données entières et positives. La plupart des articles vendus dans le commerce de détail ne peuvent pas être vendus en sous-unités, par exemple, une boîte de conserve, une pièce de rechange ou un t-shirt. Cet aspect simple de la vente entraîne une contrainte qui doit être satisfaite par le résultat de toute méthode ou modèle donné : le résultat doit être un entier positif.
  • Observabilité. La demande des clients ne peut pas être mesurée directement, seules les ventes peuvent être enregistrées et utilisées comme proxy de la demande.
  • Rareté et parcimonie. Les ventes sont une quantité discontinue : un produit peut bien se vendre une semaine, puis plus du tout la semaine suivante. En enregistrant les ventes par jour, une année entière est condensée en seulement 365 (ou 366) points. De plus, une grande proportion d’entre eux sera nulle.
  • Optimisation juste-à-temps. La prévision est une fonction clé, mais elle n’est qu’un élément d’une chaîne de processus qui soutient la prise de décision. Le temps est une ressource précieuse qui ne peut pas être entièrement consacrée à une seule fonction. Le processus de prise de décision et les adaptations associées doivent donc être effectués dans un délai limité et de manière suffisamment flexible pour pouvoir être interrompus et repris si nécessaire afin d’incorporer des événements inattendus ou des ajustements nécessaires.

Cette thèse s’inscrit dans ce contexte et est le résultat des travaux réalisés au cœur de Lokad, une entreprise de logiciels basée à Paris qui vise à combler le fossé entre la technologie et la chaîne d’approvisionnement. La recherche doctorale a été financée par Lokad en collaboration avec l’ANRT dans le cadre d’un contrat CIFRE. Le travail proposé vise à être un bon compromis entre les nouvelles technologies et les attentes des entreprises, en abordant les différents aspects présentés ci-dessus. Nous avons commencé à prévoir en utilisant des méthodes de base - la famille du lissage exponentiel - qui sont faciles à mettre en œuvre et extrêmement rapides à exécuter. Comme elles sont largement utilisées dans l’industrie, elles ont déjà gagné la confiance des utilisateurs. De plus, elles sont faciles à comprendre et à expliquer à un public non initié. En exploitant des techniques d’IA plus avancées, certaines des limitations des modèles utilisés peuvent être surmontées. L’apprentissage croisé s’est avéré être une approche pertinente. pour extrapoler des informations utiles lorsque le nombre de données disponibles était très limité. Étant donné que l’hypothèse gaussienne commune n’est pas adaptée aux données de ventes discrètes, nous avons proposé d’utiliser un modèle associé à une distribution de Poisson ou à une distribution binomiale négative, qui correspond mieux à la nature des phénomènes que nous cherchons à modéliser et à prédire. Nous avons également proposé d’utiliser la simulation pour traiter l’incertitude. En utilisant des simulations de Monte Carlo, plusieurs scénarios sont générés, échantillonnés et modélisés à l’aide d’une distribution. À partir de cette distribution, des intervalles de confiance de tailles différentes et adaptées peuvent être déduits. En utilisant des données réelles d’entreprise, nous avons comparé notre approche à des méthodes de pointe telles que le modèle Deep Auto-Regressive (DeepAR), le modèle Deep State Space (DeepSSMs) et le modèle Neural Basis Expansion Analysis (N-Beats). Nous avons déduit un nouveau modèle basé sur la méthode de Holt-Winter. Ces modèles ont été implémentés dans le flux de travail de Lokad.

Jury:

La soutenance a eu lieu devant un jury composé de :

  • M. Massih-Reza AMINI, Professeur à l’Université Grenoble Alpes, Rapporteur.
  • M.me Mireille BATTON-HUBERT, Professeur à l’École des Mines de Saint-Étienne, Rapporteur.
  • M.me Samia AINOUZ, Professeur à l’INSA Rouen Normandie, Examinateur.
  • M. Stéphane CANU, Professeur à l’INSA-Rouen Normandie, Directeur de thèse.
  • M.me Sylvie LE HÉGARAT-MASCLE, Professeur à Paris-Saclay, Examinateur.
  • M. Joannes VERMOREL, PDG de Lokad, Membre invité.

Télécharger la thèse (PDF)