Les 10 bizarreries de la prévision de la demande
La prévision statistique est un domaine très contre-intuitif. Et la plupart des hypothèses qui peuvent sembler intuitives à première vue s’avèrent tout simplement fausses. Dans cet article, nous compilons une courte liste des pires contrevenants parmi toutes les bizarreries statistiques qui constituent le cœur de métier de Lokad.
1. Les systèmes de prévision avancée NE tirent PAS de leçons de leurs erreurs
Les systèmes de prévision rafraîchissent généralement leurs prévisions quotidiennement ou hebdomadairement. Chaque fois qu’un nouveau lot de prévisions est produit, un système de prévision a l’occasion de comparer ses anciennes prévisions avec les nouvelles données acquises, et éventuellement d’en tirer des leçons. Il semblerait donc tout à fait raisonnable de s’attendre à ce qu’un système de prévision donné apprenne de ses erreurs, tout comme le ferait un expert humain. Cependant, ce n’est pas le cas. Un système de prévision avancée NE cherchera PAS à apprendre de ses erreurs. En effet, de meilleures méthodes sont disponibles, notamment le backtesting, qui offre de meilleures performances statistiques. Avec le backtesting, le système se remet en question par rapport à l’ensemble de l’historique disponible à chaque fois qu’une prévision est générée, et non seulement par rapport à la dernière augmentation de données.
2. Les facteurs statistiques les plus importants sont le bruit et le hasard
Lorsqu’on demande aux praticiens quels sont les facteurs dominants dans leur demande, beaucoup répondent : saisonnalité, cycle de vie du produit, pression du marché, croissance de l’entreprise, etc. Cependant, la plupart du temps, il y a un éléphant dans la pièce : l’éléphant étant le bruit statistique présent dans l’observation de la demande.
La plupart du temps, le défi de la prévision est abordé comme si, avec suffisamment d’efforts, les prévisions de la demande pouvaient être précises. Pourtant, ce point de vue est incorrect, car la plupart du temps, les prévisions sont irréductiblement imprécises. Accepter le hasard présent dans la demande donne généralement de meilleurs résultats commerciaux que de chercher à éliminer ce hasard.
3. Les corrections apportées par des experts rendent généralement les prévisions moins satisfaisantes
Bien qu’il semble raisonnable d’ajuster manuellement les prévisions statistiques avec des connaissances spécifiques à l’industrie, nous avons observé, à de nombreuses occasions, que cette pratique ne donne pas les résultats souhaités. Même lorsque des corrections manuelles sont effectuées par un expert dans ce domaine, elles ont tendance à dégrader la précision globale, à moins que les systèmes de prévision sous-jacents ne soient intrinsèquement médiocres. Dans ce cas seulement, les corrections manuelles peuvent aider à améliorer les résultats des prévisions.
Cela est souvent lié au fait que la perception humaine est fortement biaisée envers la perception des “patterns” (motifs). Fréquemment, cela conduit à de fausses perceptions de tendances, qui ne sont rien d’autre que des fluctuations commerciales aléatoires. Interpréter à tort le hasard comme un “pattern” tend à générer des erreurs beaucoup plus importantes que simplement ignorer le motif en premier lieu et le considérer comme un simple bruit.
4. L’erreur de prévision doit être mesurée en dollars
Une prévision plus précise ne se traduit pas nécessairement par de meilleurs résultats commerciaux. En effet, la manière classique de considérer les prévisions consiste à optimiser des métriques telles que le MAPE (erreur moyenne en pourcentage absolu) qui sont faiblement corrélées avec les principaux intérêts commerciaux. Ces métriques sont trompeuses car elles proviennent d’une réflexion plutôt illusoire selon laquelle si les prévisions étaient parfaitement précises, alors l’erreur MAPE serait nulle. Cependant, une prévision parfaitement précise n’est pas un scénario raisonnable, et l’objectif principal d’utiliser une métrique de performance est de l’aligner sur les intérêts de toute entreprise donnée. En d’autres termes, l’erreur de prévision doit être exprimée en dollars, pas en pourcentages. Les prévisions quotidiennes, hebdomadaires et mensuelles ne sont pas cohérentes.
Si des prévisions sont produites à la fois quotidiennement et hebdomadairement, il serait tout à fait raisonnable de s’attendre à ce que si les prévisions quotidiennes sont regroupées en prévisions hebdomadaires, alors les deux prévisions convergent vers les mêmes valeurs, étant donné que la même technologie et les mêmes paramètres ont été utilisés pour générer les deux ensembles de prévisions en question.
Malheureusement, cela n’est pas vrai, et les deux ensembles de prévisions divergeront ; et pour des raisons statistiques très valables également. En bref, les prévisions quotidiennes (resp. hebdomadaires) sont optimisées par rapport à une métrique exprimée au niveau quotidien (resp. hebdomadaire) ; statistiquement, comme ces deux métriques sont différentes, les sorties numériques de l’optimisation numérique n’ont tout simplement aucune raison de correspondre.
5. Les prévisions au niveau des SKU ne correspondent pas aux prévisions au niveau des catégories
Si le même système de prévision est utilisé pour prévoir la demande à la fois au niveau des SKU et au niveau des catégories, on s’attendrait à ce que les deux ensembles de prévisions soient cohérents : en additionnant toutes les prévisions associées aux SKU appartenant à une catégorie donnée, il ne serait pas déraisonnable d’imaginer aboutir au même nombre que la prévision relative à la catégorie elle-même. Cela sera le cas pour les mêmes raisons que celles exposées dans le paragraphe précédent.
Encore plus alarmant, il est en réalité très courant d’observer des situations plutôt étranges où des motifs complètement divergents existent entre les prévisions au niveau des SKU et au niveau des catégories. Par exemple, toutes les prévisions des SKU peuvent être strictement décroissantes, tandis que les prévisions au niveau des catégories augmentent régulièrement. Un autre cas typique est la saisonnalité, qui est très visible au niveau des catégories, mais à peine perceptible au niveau des SKU. Lorsqu’une situation similaire se présente, il peut être tentant de tenter de corriger les prévisions au niveau des SKU afin de les aligner sur les prévisions au niveau des catégories, mais une telle technique ne ferait qu’altérer la précision globale de la prévision.
6. Changer l’unité de mesure a de l’importance
À première vue, l’unité utilisée pour mesurer la demande ne devrait pas avoir d’impact. Si la demande est comptée en unités de stock, et si tous les points de l’historique sont multipliés par 10, on s’attendrait à ce que toutes les prévisions soient multipliées par 10 sans aucune conséquence supplémentaire. Cependant, avec une technologie telle que celle développée par Lokad, le processus de prévision ne se déroulera pas de cette manière, du moins pas exactement de cette manière.
En effet, une technologie avancée de prévision de la demande utilise de nombreux astuces avec de petits nombres. La quantité de 1 n’est pas simplement une quantité quelconque. Par exemple, nous avons observé que, en moyenne, plus de 75% des lignes des reçus des supermarchés et des hypermarchés ont une quantité égale à 1. Cela entraîne de nombreuses astuces statistiques liées aux “petits nombres”. Multiplier n’importe quel historique de demande donné par 10 ne ferait que perturber toutes les heuristiques mises en place pour tout système de prévision commerciale avancée.
7. Les meilleures prévisions de promotion sont souvent générées lorsque les promotions sont ignorées
Prévoir les promotions est difficile, vraiment difficile. Dans la vente au détail, non seulement la réponse de la demande à une promotion peut aller de rien (aucune augmentation) à une augmentation de 100 fois, mais les facteurs qui influencent les promotions sont complexes, divers et généralement mal suivis dans les systèmes informatiques. Combiner des comportements commerciaux complexes avec des données inexactes est une recette qui est susceptible de conduire à un problème de “Garbage In, Garbage Out”.
En fait, nous avons régulièrement observé que l’abandon des données promotionnelles était, au moins en tant qu’approche initiale très modeste, la manière la moins inefficace de prévoir la demande promotionnelle. Nous ne prétendons pas que cette méthode est très satisfaisante ou optimale, mais nous essayons simplement de démontrer qu’une prévision native basée sur des données historiques correctes mais incomplètes est généralement plus performante que des modèles complexes basés sur des données plus étendues mais partiellement inexactes.
8. Plus l’historique est erratique, plus la prévision est “plate”
Visuellement, si les données historiques présentent des motifs visuels forts, on s’attendrait à ce que la prévision présente des motifs visuels tout aussi forts. Cependant, lorsque les données historiques présentent des variations erratiques, cette attente n’est pas vérifiée et le contraire se produit : plus l’historique de la demande est erratique, plus les prévisions sont lisses.
Encore une fois, la cause profonde ici est que l’esprit humain est orienté vers la perception des motifs. Les fluctuations erratiques ne sont pas des motifs (au sens statistique) mais du bruit, et un système de prévision, s’il est conçu correctement, se comporte précisément comme un filtre pour ce bruit. Une fois que le bruit est éliminé, il ne reste souvent qu’une prévision “plate”.
9. Les prévisions quotidiennes, hebdomadaires et mensuelles sont généralement inutiles
Les prévisions périodiques sont partout - des actualités commerciales aux bulletins météorologiques ; et pourtant, elles ne représentent généralement pas une réponse statistique adéquate aux défis commerciaux “réels”. Le problème avec ces prévisions périodiques réside dans le fait qu’au lieu de s’attaquer directement à la décision commerciale qui dépend d’un avenir incertain, elles sont généralement utilisées de manière indirecte pour construire la décision par la suite.
Une stratégie beaucoup plus efficace consiste à considérer les décisions commerciales comme étant les prévisions. En procédant ainsi, il devient beaucoup plus facile d’aligner les prévisions sur les besoins et les priorités spécifiques de l’entreprise, par exemple en mesurant l’erreur de prévision en dollars plutôt qu’en pourcentage, comme indiqué ci-dessus.
10. La quasi-totalité de la littérature sur la prévision des stocks est peu utile
Lorsqu’on est confronté à un sujet difficile, il est raisonnable de commencer à explorer ce sujet en examinant les différents documents examinés par des pairs disponibles dans la littérature scientifique. Surtout que des milliers d’articles et de documents sont disponibles pour le lecteur, en ce qui concerne la prévision de la demande et l’optimisation des stocks.
Pourtant, nous avons constaté que la quasi-totalité des méthodes analysées dans cette littérature ne fonctionnent tout simplement pas. La justesse mathématique ne se traduit pas par la sagesse commerciale. De nombreux modèles considérés comme des “classiques intemporels” sont tout simplement dysfonctionnels. Par exemple,
- Les stocks de sécurité sont faux, car ils sont basés sur des hypothèses de distribution normale,
- Les quantités économiques de commande (EOQ) sont inexactes, car elles sont basées sur des frais fixes par commande qui sont totalement irréalistes,
- Holt-Winters, un modèle de prévision qui est assez instable numériquement et nécessite une profondeur historique trop importante pour être gérable,
- ARIMA, qui est l’archétype d’une approche mathématique, est beaucoup trop compliqué pour des résultats trop minimes,
- etc.
Les bizarreries de la prévision de la demande sont (probablement) innombrables. N’hésitez pas à partager vos propres observations dans la section des commentaires ci-dessous.