De meilleures prévisions promotionnelles dans le commerce de détail
Depuis notre grande mise à niveau Tags+Events de l’automne dernier, nous travaillons activement sur la prévision des promotions pour le commerce de détail. Nous disposons désormais de milliers d’événements promotionnels dans nos bases de données ; et l’analyse de ces événements nous a conduit à des découvertes très intéressantes.
De plus, il n’est guère surprenant que nous ayons constaté que :
- les prévisions promotionnelles réalisées manuellement par les praticiens impliquent généralement des erreurs de prévision supérieures en moyenne à 60%. Votre expérience peut varier, mais les erreurs typiques des prévisions de ventes dans le commerce de détail se situent généralement autour de 20%.
- l’inclusion des données promotionnelles via des balises et des événements réduit l’erreur de prévision moyenne d’environ 50%. Encore une fois, votre expérience peut varier en fonction de la quantité de données dont vous disposez sur vos événements promotionnels.
De manière moins intuitive, nous avons également constaté que les méthodes à base de règles et les méthodes linéaires, bien que largement vantées par certains experts et certains outils logiciels, sont très faibles face au surapprentissage, et peuvent fausser l’évaluation de l’erreur de prévision, donnant une fausse impression de performance dans la prévision des promotions.
Notez également que cette amélioration de 50% a généralement été obtenue avec une quantité d’information assez limitée, généralement pas plus de 2 ou 3 descripteurs binaires par promotion.
Même des données brutes concernant vos promotions conduisent à des améliorations significatives des prévisions, se traduisant par des économies substantielles en fonds de roulement.
Le premier pas pour améliorer vos prévisions promotionnelles consiste à rassembler des données promotionnelles précises. D’après notre expérience, cette étape est la plus difficile et la plus coûteuse. Si vous ne disposez pas de registres précis de vos promotions, il y a peu d’espoir d’obtenir des prévisions précises. Comme on dit, Garbage In, Garbage Out.
Pourtant, nous avons constaté que même un seul descripteur de promotion, une variable binaire qui indique simplement si l’article est actuellement en promotion ou non, peut conduire à une amélioration significative des prévisions. Ainsi, bien que vos registres doivent être précis, ils n’ont pas besoin d’être détaillés pour améliorer vos prévisions.
Nous vous conseillons donc de suivre précisément le calendrier de vos promotions : quand ont-elles commencé ? quand se sont-elles terminées ? Notez que pour le e-commerce, l’affichage en première page a souvent un effet comparable à celui d’une promotion de produit, il faut donc suivre l’évolution de votre page d’accueil.
Ensuite, la description de l’article importe. En effet, d’après notre expérience, même les articles les plus fréquemment en promotion n’auront pas plus d’une douzaine de promotions durant leur cycle de vie sur le marché. En moyenne, le nombre de promotions connues passées pour un article donné est ridiculement bas, allant de zéro à une promotion passée en moyenne. Par conséquent, vous ne pouvez pas espérer obtenir des résultats fiables en vous concentrant sur les promotions passées d’un produit à la fois, car, la plupart du temps, il n’y en a pas.
Vous devez donc vous concentrer sur des articles similaires à celui que vous envisagez de promouvoir. Avec Lokad, vous pouvez le faire en associant des balises à vos ventes. En général, les détaillants utilisent une hiérarchie pour organiser leur catalogue. Pensez à une hiérarchie d’articles avec des familles, sous-familles, articles, variantes, etc.
La traduction d’un catalogue hiérarchique en balises peut être réalisée assez simplement en suivant le processus illustré ci-dessous pour un revendeur de bonbons fictif :

Les balises associées à l’historique des ventes de sucettes au citron moyen seraient LOLLIPOPS, LEMON, MEDIUM
Ce processus créera généralement de 2 à 6 balises par article dans votre catalogue - en fonction de la complexité de celui-ci.
Nous avons dit que même des informations très limitées sur vos promotions pouvaient être utilisées pour améliorer immédiatement vos prévisions de ventes. Pourtant, des informations promotionnelles plus détaillées améliorent clairement la précision des prévisions.
Nous avons constaté que deux éléments sont très précieux pour améliorer la précision des prévisions :
- le mécanisme qui décrit la nature de la remise offerte à vos clients. Les mécanismes typiques sont une remise forfaitaire (ex. -20%) mais il existe de nombreux autres mécanismes tels que la livraison gratuite ou une remise pour des achats en plus grande quantité (ex : achetez-en un et recevez-en un gratuitement).
- la communication qui décrit comment vos clients sont informés de l’événement promotionnel. Typiquement, la communication inclut des opérations marketing telles que la radio, la presse écrite ou les publicités locales, mais aussi l’emballage personnalisé (le cas échéant) et la visibilité des articles promus au sein du point de vente.
Dans le cas de réseaux de distribution plus étendus, la disponibilité globale de la promotion doit également être décrite si les articles ne sont pas promus partout. Une telle situation se présente typiquement si les responsables des points de vente peuvent se retirer des opérations promotionnelles.
En discutant avec des professionnels, nous avons constaté que de nombreux détaillants s’attendent à ce qu’un ensemble de règles soit produit par Lokad ; et ces règles sont censées expliquer des promotions telles que
IF TV_ADS AND PERCENT25_DISCOUNT
THEN PROMO_SALES = 5 * REGULAR_SALES;
Fondamentalement, ces règles attendues suivent plus ou moins toujours les mêmes schémas :
- Un ensemble de conditions binaires qui définit la portée de la règle.
- Un ensemble de coefficients linéaires pour estimer l’effet de la règle.
Nous avons constaté que de nombreux outils sur le marché des logiciels sont disponibles pour vous aider à découvrir ces règles dans vos données ; ce qui, apparemment, a amené beaucoup de personnes à croire que cette approche était la seule disponible.
Pourtant, selon nos expériences, les méthodes à base de règles sont loin d’être optimales. Pire encore, ces règles sont vraiment faibles face au surapprentissage. Cette faiblesse conduit fréquemment à des situations douloureuses où il existe un écart significatif entre la précision des prévisions estimée et la précision réelle des prévisions.
Overfitting est un phénomène très subtil, et pourtant très important, dans la prévision statistique. Fondamentalement, le problème central dans la prévision est que vous voulez construire un modèle qui soit très précis par rapport aux données dont vous ne disposez pas.
En particulier, la théorie statistique indique qu’il est possible de construire des modèles qui se trouvent être très précis lorsqu’ils sont appliqués aux données historiques, et néanmoins très imprécis pour prédire l’avenir. Le problème est qu’en pratique, si vous ne réfléchissez pas attentivement au problème du surapprentissage à l’avance, la construction d’un tel modèle n’est pas une simple possibilité, mais l’issue la plus probable de votre processus.
Ainsi, vous devez vraiment optimiser votre modèle par rapport aux données dont vous ne disposez pas. Pourtant, ce problème ressemble à un paradoxe complet, car, par définition, vous ne pouvez rien mesurer si vous ne disposez pas des données correspondantes. Et nous avons constaté que de nombreux professionnels ont abandonné ce problème, car il ne semble pas envisageable à première vue.
Notre conseil est : N’ABANDONNEZ PAS
Le problème fondamental avec ces règles est qu’elles performent trop bien sur les données historiques. Chaque règle ajoutée réduit mécaniquement l’erreur de prévision que vous mesurez sur vos données historiques. Si vous ajoutez suffisamment de règles, vous vous retrouvez avec une erreur de prévision apparemment proche de zéro. Pourtant, l’erreur empirique que vous mesurez sur vos données historiques est un artefact du processus utilisé pour construire les règles en premier lieu. Une erreur de prévision nulle sur les données historiques ne se traduit pas par une erreur de prévision nulle pour les promotions futures. Bien au contraire, ces modèles tendent à très mal performer sur les futures promotions.
Bien que l’optimisation pour les données dont vous ne disposez pas soit difficile, la théorie de l’apprentissage statistique offre à la fois une compréhension théorique et des solutions pratiques à ce problème. L’idée centrale consiste à introduire la notion de minimisation du risque structurel qui équilibre l’erreur empirique.
Cela sera abordé dans un prochain article, restez à l’écoute.
(Auto-promotion sans complexe) Beaucoup de ces solutions modernes, c’est-à-dire des modèles mathématiques qui prennent soin du problème du surapprentissage, ont été implémentés par Lokad, afin que vous n’ayez pas à engager une équipe d’experts pour en bénéficier.
Commentaires des lecteurs (1)
La gestion des données de signal de demande présente les mêmes problèmes que les données en temps réel dans n’importe quelle industrie : comment accéder et intégrer de grands volumes de données, puis les combiner et les analyser en parallèle avec les informations historiques.
Business Opportunities (il y a 9 ans)