Depuis la création de Lokad, notre objectif a été d’améliorer sans relâche notre technologie de prévision afin de fournir des formes supérieures d’optimisation de la supply chain. Il y a près d’une décennie, je soulignais déjà que le fait d’être une entreprise d’apprentissage machine est étrange : les progrès sont constants mais aussi non linéaires et erratiques. De plus, la plupart des idées reçues dans d’autres domaines sont tout simplement erronées en ce qui concerne l’apprentissage machine. Cependant, cela ne signifie pas que ces progrès sont laissés au hasard : il y a une méthode derrière tout cela.

Améliorer notre technologie de prévision commence par l’amélioration des données. Sans une préparation adéquate des données, le processus se transforme en une opération de poubelle à l’entrée, poubelle à la sortie. S’assurer que les promotions, les ruptures de stock, les délais d’approvisionnement sont correctement représentés dans un ensemble de données donné prend beaucoup de temps et d’expertise. En pratique, étant donné que les complications des données tendent à être spécifiques à un domaine, il faut toute une équipe de scientifiques de la supply chain chez Lokad pour consolider une variété d’ensembles de données représentant des secteurs aussi divers que l’aérospatiale, la mode, la grande distribution alimentaire, etc.

Ensuite, lorsque nous inventons1 une nouvelle méthode statistique, il s’avère généralement que cette méthode présente des performances supérieures sur un ensemble de données donné, et des performances inférieures sur un autre ensemble de données. Malheureusement, lorsque cela se produit, la nouvelle méthode statistique a tendance à être fragile : elle peut être quelque peu chanceuse ou victime d’un problème de surajustement. Ainsi, bien qu’il puisse être tentant de créer un cas particulier pour un client donné de Lokad, parce qu’une méthode statistique semble mieux convenir à ce client, nous n’opérons pas de cette manière. Notre décennie d’expérience nous a appris que ces résultats se révèlent invariablement fragiles et que la méthode supposément supérieure peut ne pas le rester longtemps. Si l’entreprise cliente subit des changements substantiels - qui peuvent très bien être causés par les actions mêmes de Lokad - les performances de la nouvelle méthode peuvent s’effondrer.

Ainsi, nous nous concentrons plutôt sur la découverte de méthodes statistiques qui offrent des résultats supérieurs pour une grande variété de situations, dans de nombreux secteurs quelque peu indépendants, idéalement en apportant une amélioration uniforme partout plutôt qu’un mélange d’améliorations et de régressions, même si le mélange est fortement orienté vers les améliorations. Cette méthodologie est plus difficile que de simplement concevoir des fonctionnalités2 à partir d’un ensemble de données donné, tout en recyclant sans cesse le(s) même(s) algorithme(s) d’apprentissage machine, ce que la plupart des agences de traitement des données proposeraient de nos jours.

Cette approche nous oblige à revoir les fondements même de la prévision statistique. Par exemple, la transition vers l’entropie croisée en tant que métrique supérieure pour mesurer l’exactitude des prévisions a été déterminante pour tirer le meilleur parti de l’apprentissage profond. Plus récemment, nous avons évolué vers les réseaux de densité de mélange, une approche puissante mais sous-utilisée3 pour capturer les comportements complexes de la queue dans les chaînes d’approvisionnement. Ces réseaux de densité de mélange fournissent une solution exploitable pour estimer de manière fiable la probabilité d’événements rares, ce qui est essentiel dans des industries telles que l’aérospatiale.

Notre technologie de prévision reste un travail en cours. Il reste de nombreux défis qui sont encore imparfaitement résolus. Par exemple, les cannibalisations et la réponse du marché aux changements de prix restent des défis très difficiles. Néanmoins, nous ne renonçons pas, et même après 10 ans de R&D, nous progressons toujours.


  1. Nous nous appuyons sur les travaux des géants. Les efforts de R&D de Lokad sont généralement des variations des idées obtenues auprès de la communauté élargie de l’apprentissage machine, qui ne travaille généralement pas sur des problèmes de chaîne d’approvisionnement, mais plutôt sur des problèmes courants tels que la détection de motifs, la reconnaissance vocale ou le traitement du langage naturel. ↩︎

  2. L’ingénierie des fonctionnalités est un processus qui consiste à créer manuellement une représentation de l’ensemble de données adaptée à un algorithme d’apprentissage machine donné. L’ingénierie des fonctionnalités est un moyen puissant d’atténuer les faiblesses connues des algorithmes d’apprentissage machine. ↩︎

  3. L’article original sur les réseaux de densité de mélange (MDN) de Christopher M. Bishop date de 1994. Pourtant, il a fallu près de deux décennies pour que le matériel rattrape les possibilités ouvertes par ce travail pionnier. Contrairement à l’article original, qui était appliqué à la cinématique inverse des robots, nous utilisons les MDN pour fournir des prévisions de demande probabilistes. ↩︎