Comprendre le moteur de prévisions

Comprendre le moteur de prévisions










Accueil » Ressources » Ici

Le moteur de prévisions est un composant spécifique de Lokad, responsable des principales analyses prédictives. Ce moteur est un logiciel avancé, considéré, à juste titre, comme un outil d’apprentissage automatique (« machine learning »). Il est très différent des boîtes à outils classiques de prévisions, qui sont généralement conçues pour des prévisions de séries temporelles. Dans le présent article, nous expliquons ce que fait ce moteur, en quoi il diffère des boîtes à outils classiques et les raisons pour lesquelles ces différences offrent des résultats plus satisfaisants dans le domaine logistique.

Prévisions intégrées vs prévisions périodiques

Du point de vue classique des séries temporelles l’accent est mis sur les prévisions périodiques quotidiennes, hebdomadaires ou mensuelles. Les données historiques sont alors représentées par des séries temporelles périodiques, tout comme les prévisions. Cette approche peut être appropriée dans certains domaines, les prévisions de consommation énergétique ou de circulation sur une autoroute par exemple. Nous avons cependant remarqué qu’elle donne de mauvais résultats en matière de logistique.

Les prévisions périodiques ne correspondent pas à la réalité de la gestion logistique : si les délais d'approvisionnement à prendre en compte sont de 10 jours, faut-il faire la somme des prévisions quotidiennes pour les 10 prochains jours ? Ou bien faut-il ajouter une prévision hebdomadaire à trois quotidiennes ? De manière générale, l'ajout de prévisions entre-elles est à bannir : « la prévision de la somme n’est pas égale à la somme des prévisions. » Ainsi, si les délais d'approvisionnement sont de 10 jours, l’outil de prévisions doit produire une prévision pour dans 10 jours et non pas un ensemble de prévisions intermédiaires à assembler pour obtenir la prévision voulue.

Par conséquent, le moteur de prévisions de Lokad ne produit pas de prévisions quotidiennes, hebdomadaires ou mensuelles. Il calcule directement les prévisions de la demande qui correspondent aux délais d'approvisionnement attendus. De plus, ces derniers doivent être eux-mêmes issus de prévisions probabilistes. Ce fonctionnement peut être surprenant dans un premier temps mais, dans presque tous les cas du domaine logistique, il est illusoire de croire possible l'établissement de prévisions exactes à partir d'une somme de prévisions périodiques.

Prévisions probabilistes vs prévisions moyennes

Les outils de prévisions classiques mettent l’accent sur les prévisions moyennes ou, parfois, médianes. Pourtant, en matière d’optimisation logistique, les coûts de gestion les plus importants sont engendrés par les cas limites. Lorsque la demande est plus forte que prévu, arrivent les ruptures de stock. Inversement, lorsqu’elle est plus basse que prévu, du stock mort est créé. Lorsque la demande est plus ou moins égale à ce qui était prévu, les niveaux de stock fluctuent légèrement mais, dans l’ensemble, la chaîne logistique fonctionne sans accroc. En utilisant des prévisions moyennes, ou médianes, les outils classiques souffrent de l’effet lampadaire : quelle que soit la qualité de l’analyse statistique sous-jacente, ils ne répondent pas à la bonne question.

À l’opposé, le moteur de prévisions de Lokad génère des prévisions probabilistes dans lesquelles les probabilités de chaque futur possible (1) sont estimées. Ces probabilités fournissent des informations bien plus détaillées sur le futur que les prévisions à une seule valeur comme les prévisions moyennes ou médianes. Grâce aux prévisions probabilistes, il est possible d’affiner l’évaluation des risques et opportunités logistiques. Plus précisément, il est possible, pour un niveau de demande donné, de calculer simplement le résultat financier (2) de chaque décision logistique possible — acheter une unité supplémentaire d’un SKU donné par exemple. Ainsi les priorités de toutes les décisions à venir (3) sont établies, à partir d’un résultat financier pondéré, en combinant des estimations financières aux probabilités calculées.

(1) Cependant, en pratique, pour que les calculs restent faisables, les probabilités trop faibles sont arrondies à zéro. Ainsi, seul un ensemble fini de configurations est vraiment étudié.

(2) Par exemple, imaginons que nous achetons 1 unité maintenant, que la demande future est de 5 (nous vendrons 5 unités) et que le stock est de 2 à la fin de la période. Si la marge brute est de 10 et que le coût de stockage par période et par unité invendue est de 15, alors le bénéfice net est de 5 x 10 - 2 x 15 = 20.

(3) Le processus de définition du niveau de priorité de toutes les décisions futures peut paraître affreusement complexe mais il se trouve que la technologie Lokad est conçue pour résoudre ce problème. Cette technologie est distincte du moteur de prévisions en lui-même.

Échantillons de données et particularités statistiques factices

Les professionnels qui ont déjà utilisé un outil de prévisions pourraient être tentés de tester Lokad avec des séries temporelles de quelques points, juste pour voir. De plus, on peut être intrigué par le comportement de Lokad face à des phénomènes simples, comme une tendance linéaire ou des séries temporelles parfaitement saisonnières. Contre toute attente, notre moteur de prévisions donne de piètres résultats dans ces cas-là. Malheureusement, ces mauvais résultats sont nécessaires à l’obtention de résultats satisfaisants face à des situations réelles.

L’une des spécifications principales de notre moteur de prévisions porte sur la génération de prévisions exactes sans aucun ajustement statistique. Pour cela, Lokad a réglé son moteur de prévisions à l’aide de centaines d’ensembles de données réelles sélectionnés avec soin. Des données factices, qui représentent par exemple une tendance linéaire parfaite ou des séries temporelles exactement cycliques, sont très différentes de données réelles. Par conséquent, de tels phénomènes artificiels ne sont même pas pris en compte, malgré leur apparente simplicité. D’ailleurs, quel est l’intérêt de fournir de « bons » résultats à partir de données factices si les résultats sont « mauvais » avec de « vraies » données ? Notre expérience a montré qu’un bon moteur de prévisions est très prudent dans ses choix de modèles de prévisions. L’ajout d’un modèle de régression linéaire « parfaitement ajusté » simplement dans le but de traiter des phénomènes artificiels est néfaste à terme car ce modèle peut ensuite être utilisé à mauvais escient.

De plus, pour éviter tout ajustement manuel, notre moteur de prévisions repose sur des algorithmes d’apprentissage automatique. Ainsi, le moteur a besoin d’un ensemble de données volumineux pour fonctionner. En fait, le moteur de prévisions détermine ses propres paramètres en effectuant de nombreux tests statistiques sur les données. Cependant, si l’ensemble de données est trop petit, le moteur de prévisions ne pourra s’initialiser correctement. De manière générale, au moins 1 000 points de données historiques sur plus de 100 SKU sont nécessaires pour commencer à obtenir des résultats significatifs. En pratique, même les petites entreprises de e-commerce, dont le chiffre d’affaires est inférieur à 1 million d’euros, accumulent plus de 10 000 points de données sur plus de 200 SKU. Ainsi, les besoins du moteur de prévisions en matière de données sont en fait relativement limités mais pas assez pour fonctionner correctement sur des échantillons de données factices.

Les besoins du moteur de prévisions en matière de données

Voici une liste des besoins minimaux du moteur de prévisions en matière de données :

  • articles : minimum 100, mieux 500, encore mieux 2 000+ ;
  • attributs des articles : minimum 1, mieux 3, encore mieux 5+ ;
  • commandes client passées : minimum 1000, mieux 10 000, encore mieux 50 000+ ;
  • commandes d’achat passées : minimum 50, mieux 500, encore mieux 2 000+ ;
  • profondeur de l’historique en mois : minimum 3, mieux 18, encore mieux 36+.

Les « articles » correspondent aux SKU, produits, numéros de pièce, code-barres ou tout élément sur lequel les prévisions doivent porter, selon chaque cas particulier.

Les commandes d’achat servent à prévoir les délais d'approvisionnement. Il est possible de ne pas les fournir dans un premier temps mais de mauvaises estimations des délais d'approvisionnement peuvent faire des ravages dans votre chaîne logistique. Nous recommandons donc fortement de fournir ces données dès que possible.

Les données d’entrée peuvent être enrichies avec un historique des ruptures de stock et des promotions. En réalité, le moteur de prévisions prend même en charge des scénarios plus avancés. Cette section se limite aux données indispensables.

Prévisions macros et haute-fréquence

Le moteur de prévisions de Lokad est spécifiquement conçu pour gérer les cas de logistique commerciale et industrielle. Un grand nombre de SKU et une demande irrégulière sont typiques de ces derniers. Face à ces contraintes, notre moteur de prévisions fait des prouesses mais il existe des cas qui ne conviennent pas à notre technologie.

Les prévisions macros, qui portent sur des séries temporelles fortement agrégées, généralement très lisses — une fois les cyclicités traitées — et très longues, ne font pas partie des points de forts de Lokad. De tels scénarios se rencontrent dans les prévisions de consommation énergétique, de circulation sur autoroute, de trésorerie, d’appels entrants, etc. Notre moteur est conçu pour des prévisions qui portent sur de nombreux articles, entre lesquels des corrélations peuvent être identifiées puis exploitées.

Les prévisions haute-fréquence qui portent sur des séries temporelles dont la granularité est inférieure à la journée ne sont pas non plus gérées par Lokad. Ces situations sont fréquentes dans les prévisions financières, notamment de matières premières ou boursières. Dans ce cas, la difficulté vient du fait que les particularités statistiques sont déjà exploitées — par d’autres — et ont un impact sur le futur lui-même. Ce cas est très différent du cas logistique, dans lequel les prévisions de la demande ont un impact modéré (4) sur la demande future observée.

(4) Il serait faux de dire que les prévisions de la demande n’ont aucun impact sur celle-ci. Par exemple, en prévoyant une demande plus importante sur un produit dans un magasin donné, la visibilité de ce produit augmente, ce qui stimule la demande. Mais ces phénomènes restent marginaux dans le domaine logistique.