La prévision statistique est un domaine hautement contre-intuitif. Et la plupart des hypothèses qui peuvent sembler intuitives au premier abord se révèlent complètement fausses. Dans cet article, nous compilons une courte liste des pires contrevenants parmi toutes les bizarreries statistiques qui constituent le nerf de la guerre chez Lokad.

1. Les systèmes de prévision avancée n’apprennent PAS de leurs erreurs

Les systèmes de prévision actualisent généralement leurs prévisions quotidiennement ou hebdomadairement. Chaque fois qu’un nouveau lot de prévisions est produit, un système de prévision a l’opportunité de comparer ses anciennes prévisions avec les données nouvellement acquises, et éventuellement d’en tirer des enseignements. Par conséquent, il semblerait tout à fait raisonnable de s’attendre à ce qu’un système de prévision apprenne de ses erreurs, tout comme le ferait un expert humain. Cependant, ce n’est pas le cas. Un système de prévision avancée n’essaiera PAS d’apprendre de ses erreurs. En effet, de meilleures méthodes existent, à savoir backtesting, qui offrent de meilleures performances statistiques. Avec le backtesting, le système se remet en question sur l’ensemble de l’historique disponible chaque fois qu’une prévision est générée, et non seulement sur le dernier incrément de données.

2. Les facteurs statistiques les plus importants sont le bruit et l’aléa

Lorsque les praticiens sont interrogés sur les facteurs dominants de leur demande, beaucoup répondent : la saisonnalité, le cycle de vie des produits, la pression du marché, la croissance de l’entreprise, etc. Cependant, la plupart du temps, il y a un éléphant dans la pièce : l’éléphant étant le bruit statistique présent dans l’observation de la demande.

La plupart du temps, le défi de la prévision est abordé comme si, moyennant suffisamment d’efforts, les prévisions de la demande pouvaient être rendues précises. Pourtant, ce point de vue est erroné, car dans la plupart des cas, les prévisions restent irréductiblement imprécises. Accepter l’aléa présent dans la demande conduit généralement à de meilleurs résultats commerciaux que de tenter d’éliminer cet aléa.

3. Les corrections expertes rendent généralement les prévisions moins satisfaisantes

Bien qu’il semble raisonnable d’ajuster manuellement les prévisions statistiques avec des connaissances spécifiques à l’industrie, nous avons observé, à de nombreuses reprises, que cette pratique ne donne pas les résultats escomptés. Même lorsque des corrections manuelles sont effectuées par un expert dans ce domaine, elles tendent à dégrader la précision globale, à moins que les systèmes de prévision sous-jacents ne soient intrinsèquement de mauvaise qualité. Ce n’est que dans ce cas que les corrections manuelles peuvent contribuer à améliorer les résultats des prévisions.

Cela est souvent lié au fait que la perception humaine est fortement biaisée vers la détection de « motifs ». Cela conduit fréquemment à une interprétation erronée des tendances, qui ne sont rien d’autre que des fluctuations aléatoires du marché. Interpréter par erreur l’aléa comme un « motif » tend à générer des erreurs beaucoup plus importantes que de simplement ignorer le motif dès le départ et de le traiter comme un simple bruit.

4. L’erreur de prévision doit être mesurée en Dollars

Une prévision plus précise ne se traduit pas nécessairement par de meilleurs résultats commerciaux. En effet, la méthode classique pour évaluer les prévisions consiste à optimiser des indicateurs tels que le MAPE (erreur moyenne en pourcentage absolu) qui sont faiblement corrélés aux principaux intérêts commerciaux. De tels indicateurs sont trompeurs car ils reposent sur l’idée quelque peu illusoire que si les prévisions étaient parfaitement précises, l’erreur MAPE serait nulle. Cependant, une prévision parfaitement exacte n’est pas un scénario raisonnable, et l’intérêt d’utiliser un indicateur de performance est de l’aligner sur les intérêts d’une entreprise donnée. Autrement dit, l’erreur de prévision devrait être exprimée en Dollars, et non en pourcentages. Les prévisions quotidiennes, hebdomadaires et mensuelles ne sont pas cohérentes.

Si des prévisions sont produites à la fois quotidiennement et hebdomadairement, il serait tout à fait raisonnable de s’attendre à ce que, si les prévisions quotidiennes sont agrégées en prévisions hebdomadaires, alors les deux ensembles de prévisions convergent vers les mêmes valeurs, étant donné que la même technologie et les mêmes paramètres ont été utilisés pour générer les deux ensembles de prévisions en question.

Malheureusement, ce n’est pas le cas, et les deux ensembles de prévisions divergeront ; et ce, pour des raisons statistiques très solides. En bref, les prévisions quotidiennes (resp. hebdomadaires) sont optimisées en fonction d’un indicateur exprimé au niveau quotidien (resp. hebdomadaire) ; statistiquement, comme ces deux indicateurs sont différents, les résultats numériques de l’optimisation n’ont tout simplement aucune raison de correspondre.

5. Les prévisions au niveau des SKU ne correspondent pas aux prévisions au niveau des catégories

Si le même système de prévision est utilisé pour prévoir la demande à la fois au niveau SKU et au niveau des catégories, on s’attendrait à ce que les deux ensembles de prévisions soient cohérents : en additionnant toutes les prévisions associées aux SKU appartenant à une même catégorie, il ne serait pas déraisonnable d’imaginer obtenir le même chiffre que la prévision relative à la catégorie elle-même. Ce sera le cas pour les mêmes raisons évoquées dans le paragraphe précédent.

Plus alarmant encore, il est en réalité très courant d’observer des situations plutôt étranges où des schémas complètement divergents existent entre les prévisions au niveau des SKU et celles au niveau des catégories. Par exemple, toutes les prévisions des SKU pourraient être strictement à la baisse, tandis que les prévisions au niveau des catégories augmentent régulièrement. Un autre cas typique est la saisonnalité, qui est très visible au niveau des catégories, mais à peine perceptible au niveau des SKU. Lorsqu’une situation similaire se présente, il peut être tentant d’essayer de corriger les prévisions au niveau des SKU afin de les aligner sur celles des catégories, mais une telle technique ne ferait que dégrader la précision globale des prévisions.

6. Changer l’unité de mesure a son importance

À première vue, l’unité utilisée pour mesurer la demande ne devrait avoir aucun impact. Si la demande est comptabilisée en unités de stocks, et si tous les points de l’historique sont multipliés par 10, on pourrait s’attendre à ce que toutes les prévisions soient multipliées par 10 sans conséquences supplémentaires. Cependant, avec une technologie telle que celle développée par Lokad, le processus de prévision ne se déroulera pas ainsi, du moins pas exactement de cette manière.

En effet, une technologie de prévision de la demande avancée exploite de nombreuses astuces basées sur de petits nombres. La quantité 1 n’est pas n’importe quelle quantité. Par exemple, nous avons observé qu’en moyenne, les tickets de caisse des supermarchés et hypermarchés comportent plus de 75% de lignes avec une quantité égale à 1. Cela se traduit par de nombreuses astuces statistiques liées aux « petits nombres ». Multiplier un historique de demande par 10 ne ferait qu’embrouiller toutes les heuristiques en place dans un système de prévision avancé dans le commerce.

7. Les meilleures prévisions de promotion sont fréquemment générées lorsque les promotions sont ignorées

Prévoir les promotions est difficile, vraiment difficile. Dans le commerce de détail, non seulement la réaction de la demande à une promotion peut passer de rien (aucune augmentation) à une augmentation de 100x, mais les facteurs qui influencent les promotions sont complexes, divers et généralement mal suivis dans les systèmes informatiques. Combiner des comportements commerciaux complexes avec des données inexactes est une recette susceptible de conduire à un problème du type « Garbage In, Garbage Out ».

En fait, nous avons régulièrement observé que le fait d’ignorer les données promotionnelles était, du moins comme approche initiale très modeste, la manière la moins inefficace de prévoir la demande promotionnelle. Nous ne prétendons pas que cette méthode soit des plus performantes ou optimales, mais nous cherchons simplement à démontrer qu’une prévision native construite sur des données historiques correctes mais incomplètes surpasse généralement des modèles complexes construits sur des données plus étendues mais partiellement inexactes.

8. Plus l’historique est erratique, plus la prévision est « aplatie »

Visuellement, si les données historiques présentent des schémas visuels forts, on s’attendrait à ce qu’une prévision présente des schémas visuels tout aussi marqués. Cependant, dès que les données historiques montrent des variations erratiques, cette attente ne se vérifie pas, et c’est le contraire qui se produit : plus l’historique de la demande est erratique, plus les prévisions sont lissées.

Encore une fois, la cause fondamentale est que l’esprit humain est programmé pour percevoir des motifs. Les fluctuations erratiques ne sont pas des motifs (au sens statistique) mais du bruit, et un système de prévision, s’il est bien conçu, se comporte exactement comme un filtre pour ce bruit. Une fois le bruit éliminé, il ne reste souvent plus qu’une prévision « aplatie ».

9. Les prévisions quotidiennes, hebdomadaires et mensuelles sont généralement inutiles

Les prévisions périodiques sont omniprésentes - des actualités économiques aux bulletins météo ; et pourtant, elles ne représentent que rarement une réponse statistique adéquate aux défis commerciaux de la vie réelle. Le problème avec ces prévisions périodiques réside dans le fait qu’au lieu d’aborder directement la décision commerciale qui dépend d’un futur incertain, elles sont typiquement employées de manière indirecte pour construire la décision par la suite.

Une stratégie bien plus efficace consiste à considérer les décisions commerciales comme étant les prévisions. Ce faisant, il devient beaucoup plus facile d’aligner les prévisions sur des besoins et des priorités commerciales spécifiques, par exemple en mesurant l’erreur de prévision en Dollars plutôt qu’en pourcentages comme décrit ci-dessus.

10. La majeure partie de la littérature sur la prévision des stocks est de peu d’utilité

Lorsqu’on est confronté à un sujet difficile, il est raisonnable de commencer par explorer ce sujet en examinant les différents documents évalués par des pairs disponibles dans la littérature scientifique. D’autant plus que des milliers d’articles et d’ouvrages sont accessibles au lecteur, en ce qui concerne la prévision de la demande et l’optimisation de stocks.

Cependant, nous avons constaté que la quasi-totalité des méthodes analysées dans cette littérature ne fonctionnent tout simplement pas. La rigueur mathématique ne se traduit pas par une sagesse commerciale. De nombreux modèles considérés comme des classiques intemporels sont tout simplement dysfonctionnels. Par exemple,

  • Les stocks de sécurité sont erronés, puisqu’ils reposent sur des hypothèses de distribution normale,
  • EOQ (quantités économiques de commande) sont imprécis, car ils se basent sur des frais fixes par commande qui sont complètement irréalistes,
  • Holt-Winters, est un modèle de prévision qui est numériquement assez instable et requiert une profondeur historique trop importante pour être exploitable,
  • ARIMA, qui est l’archétype de l’approche mathématiquement motivée, est bien trop complexe pour des résultats trop faibles,
  • etc.

Les bizarreries dans la prévision de la demande sont (probablement) innombrables. N’hésitez pas à poster vos propres observations dans la section des commentaires ci-dessous.