Lorsqu’il s’agit d’analyse de données, les experts soulignent fréquemment (et à juste titre) l’importance d’avoir un ensemble de données propre avant de commencer toute analyse. Sinon, vous vous retrouvez avec des données de mauvaise qualité en entrée, et donc des résultats de mauvaise qualité en sortie.

Par conséquent, la plupart des outils de prévision fournissent des fonctionnalités étendues pour le nettoyage des données / la préparation des données ; et pourtant, Lokad ne propose aucune fonctionnalité explicite pour le nettoyage des données.

Avons-nous manqué quelque chose d’IMPORTANT ici ?

Nous ne le pensons pas. Il y a quelques malentendus en ce qui concerne le nettoyage des données pour les prévisions de ventes (à court terme). En effet, de nos jours, les ventes de la plupart des détaillants, grossistes et fabricants sont enregistrées dans un ERP ou un système de comptabilité. D’après notre expérience, à partir de 2010, les données transactionnelles associées aux ventes sont remarquablement propres. Si une transaction enregistrée le 1er novembre 2010 indique que le produit X a été vendu en quantité Y, alors la probabilité que cette information soit vraie est très élevée, avec une confiance supérieure à 99,9 % pour la plupart des processus de vente.

En effet, les entreprises ne peuvent pas se permettre de ne pas savoir ce qu’elles vendent. Par conséquent, d’énormes efforts ont été déployés au cours des deux dernières décennies pour s’assurer que les données de vente sont fiables dans une certaine mesure. Nous ne disons pas qu’aucune entrée de vente erronée n’entre jamais dans le système, nous disons seulement que la proportion est généralement insignifiante.

Si les données de vente sont propres, pourquoi continuons-nous à nous concentrer sur le nettoyage des données ?

Nous avons observé de nombreuses pratiques de nettoyage des données dans l’industrie, et il s’avère que les opérations désignées sous le terme de “nettoyage” sont bien plus nombreuses que la simple recherche des 0,1 % de transactions erronées. L’illustration ci-dessus donne un aperçu des opérations réelles impliquées dans une phase typique de nettoyage des données : il s’agit essentiellement de lisser les extrêmes. Par exemple, les ventes partielles pendant les pénuries sont augmentées manuellement, et les ventes promotionnelles/exceptionnelles sont plafonnées.

Inutile de dire que nous ne croyons pas en cette approche. Les données de vente réelles ne devraient pas être remplacées par des données de vente fictives. En effet, rien ne peut dire avec une confiance à 100 % combien de produits auraient été vendus s’il n’y avait pas eu de pénurie. Les ventes partielles sont les seules données tangibles dont nous disposons et qui ne reposent pas déjà sur une extrapolation statistique.

Pourtant, il y a un effet secondaire intéressant de la pratique du lissage des extrêmes : le lissage améliore la précision des méthodes de prévision naïves qui se comportent comme une moyenne mobile.

Il est tentant, si le seul outil dont vous disposez est un marteau, de traiter tout comme un clou., Abraham Maslow, 1966

Essayer d’ajuster les données de vente pour les faire correspondre au seul modèle de prévision disponible est simplement un mauvais exemple de la loi de l’instrument. Notre approche consiste à s’attaquer directement aux modèles complexes au lieu d’essayer de les contourner.