Depuis notre importante mise à niveau des Tags+Events l’automne dernier, nous travaillons activement sur les prévisions de promotion pour le secteur de la vente au détail. Nous avons maintenant des milliers d’événements promotionnels dans nos bases de données ; et l’analyse de ces événements nous a conduit à des découvertes très intéressantes.

Il n’est pas surprenant de constater que :

  • les prévisions de promotion réalisées manuellement par les praticiens impliquent généralement des erreurs de prévision supérieures à 60% en moyenne. Vos résultats peuvent varier, mais les erreurs de prévision de vente typiques dans le secteur de la vente au détail sont généralement plus proches de 20%.
  • l’inclusion des données de promotion via des tags et des événements réduit l’erreur de prévision moyenne d’environ 50%. Encore une fois, vos résultats peuvent varier en fonction de la quantité de données que vous avez sur vos événements promotionnels.

En tant que résultat moins intuitif, nous avons également constaté que les méthodes basées sur des règles et les méthodes linéaires, bien que largement annoncées par certains experts et certains outils logiciels, sont très faibles contre le surajustement, et peuvent fausser l’évaluation de l’erreur de prévision, donnant une fausse impression de performance dans les prévisions de promotion.

De plus, notez que cette amélioration de 50% a été obtenue avec généralement une quantité d’informations assez limitée, généralement pas plus de 2 ou 3 descripteurs binaires par promotion.

Même des données rudimentaires sur vos promotions conduisent à des améliorations significatives des prévisions, ce qui se traduit par des économies de fonds de roulement importantes.

La première étape pour améliorer vos prévisions de promotion consiste à rassembler des données précises sur les promotions. D’après notre expérience, cette étape est la plus difficile et la plus coûteuse. Si vous n’avez pas de dossiers précis de vos promotions, il y a peu d’espoir d’obtenir des prévisions précises. Comme on dit, “Garbage In, Garbage Out”.

Pourtant, nous avons remarqué que même un seul descripteur de promotion, une variable binaire qui indique simplement si l’article est actuellement en promotion ou non, peut conduire à une amélioration significative des prévisions. Ainsi, bien que vos enregistrements doivent être précis, ils n’ont pas besoin d’être détaillés pour améliorer vos prévisions.

Par conséquent, nous vous conseillons de suivre précisément le calendrier de vos promotions : quand a-t-elle commencé ? quand a-t-elle pris fin ? Notez que pour le commerce électronique, l’affichage en première page a souvent un effet comparable à une promotion de produit, vous devez donc suivre l’évolution de votre page d’accueil.

Ensuite, la description de l’article est importante. En effet, d’après notre expérience, même les articles les plus fréquemment promus n’auront pas plus d’une douzaine de promotions au cours de leur durée de vie sur le marché. En moyenne, la quantité de promotions passées connues pour un article donné est ridiculement faible, allant de zéro à une promotion passée en moyenne. Par conséquent, vous ne pouvez pas attendre de résultats fiables en vous concentrant sur les promotions passées d’un seul produit à la fois, car la plupart du temps il n’y en a pas.

Ainsi, vous devez plutôt vous concentrer sur les articles qui ressemblent à l’article que vous prévoyez de promouvoir. Avec Lokad, vous pouvez le faire en associant des tags à vos ventes. En général, les détaillants utilisent une hiérarchie pour organiser leur catalogue. Pensez à une hiérarchie d’articles avec des familles, des sous-familles, des articles, des variantes, etc.

Traduire un catalogue hiérarchique en tags peut être fait assez simplement en suivant le processus illustré ci-dessous pour un revendeur fictif de bonbons :

Les tags associés à l’historique des ventes des sucettes au citron de taille moyenne seraient LOLLIPOPS, LEMON, MEDIUM

Ce processus créera généralement de 2 à 6 tags par article de votre catalogue, en fonction de la complexité de celui-ci.

Nous avons dit que même des informations très limitées sur vos promotions pourraient être utilisées pour améliorer immédiatement vos prévisions de ventes. Cependant, des informations de promotion plus détaillées améliorent clairement la précision des prévisions.

Nous avons constaté que deux éléments sont très précieux pour améliorer la précision des prévisions :

  • le mécanisme qui décrit la nature de la remise offerte à vos clients. Les mécanismes typiques sont les remises fixes (ex. -20%), mais il existe de nombreux autres mécanismes tels que la livraison gratuite ou la remise pour des quantités plus importantes (ex : achetez-en un et obtenez-en un gratuitement).
  • la communication qui décrit comment vos clients sont informés de l’événement promotionnel. La communication comprend généralement des opérations marketing telles que la radio, les journaux ou les publicités locales, mais aussi l’emballage personnalisé (le cas échéant) et la visibilité des articles promus dans le point de vente.

Dans le cas de réseaux de distribution plus importants, il convient également de décrire la disponibilité globale de la promotion si les articles ne sont pas promus partout. Cette situation se produit généralement si les responsables des points de vente peuvent choisir de ne pas participer aux opérations promotionnelles.

En discutant avec des professionnels, nous avons constaté que de nombreux détaillants s’attendent à ce que Lokad produise un ensemble de règles ; et ces règles sont censées expliquer les promotions comme

SI TV_ADS ET PERCENT25_DISCOUNT 
ALORS PROMO_SALES = 5 * REGULAR_SALES;

Fondamentalement, ces règles attendues suivent toujours plus ou moins les mêmes schémas :

  • Un ensemble de conditions binaires qui définit la portée de la règle.
  • Un ensemble de coefficients linéaires pour estimer l’effet de la règle.

Nous avons constaté que de nombreux outils sur le marché du logiciel sont disponibles pour vous aider à découvrir ces règles dans vos données ; ce qui, apparemment, a conduit de nombreuses personnes à croire que cette approche était la seule disponible.

Pourtant, selon nos expériences, les méthodes basées sur des règles sont loin d’être optimales. Pire encore, ces règles sont vraiment faibles face à la surajustement. Cette faiblesse conduit fréquemment à des situations douloureuses où il existe un écart significatif entre la précision des prévisions estimée et la précision des prévisions réelle.

Le surajustement est un phénomène très subtil et pourtant très important dans la prévision statistique. Fondamentalement, le problème central de la prévision est que vous voulez construire un modèle qui est très précis contre les données que vous n’avez pas.

En particulier, la théorie statistique indique qu’il est possible de construire des modèles qui se révèlent très précis lorsqu’ils sont appliqués aux données historiques, et pourtant très imprécis pour prédire l’avenir. Le problème est que, en pratique, si vous ne réfléchissez pas attentivement au problème de surajustement à l’avance, construire un tel modèle n’est pas une simple possibilité, mais le résultat le plus probable de votre processus.

Ainsi, vous devez vraiment optimiser votre modèle contre les données que vous n’avez pas. Pourtant, ce problème ressemble à un paradoxe complet, car, par définition, vous ne pouvez rien mesurer si vous n’avez pas les données correspondantes. Et nous avons constaté que de nombreux professionnels ont abandonné cette question, car cela ne semble de toute façon pas être une réflexion réalisable.

Notre conseil est : NE RENONCEZ PAS

Le problème central avec ces règles est qu’elles fonctionnent trop bien sur les données historiques. Chaque règle que vous ajoutez réduit mécaniquement l’erreur de prévision que vous mesurez sur vos données historiques. Si vous ajoutez suffisamment de règles, vous obtenez une erreur de prévision apparente proche de zéro. Pourtant, l’erreur empirique que vous mesurez sur vos données historiques est un artefact du processus utilisé pour construire les règles en premier lieu. Une erreur de prévision nulle sur les données historiques ne se traduit pas par une erreur de prévision nulle sur les futures promotions. Au contraire, de tels modèles ont tendance à très mal se comporter sur les futures promotions.

Bien que optimiser pour les données que vous n’avez pas soit difficile, la théorie de l’apprentissage statistique offre à la fois une compréhension théorique et des solutions pratiques à ce problème. L’idée centrale consiste à introduire la notion de minimisation du risque structurel qui équilibre l’erreur empirique.

Cela sera discuté dans un prochain article, restez à l’écoute.

(Publicité éhontée) Beaucoup de ces solutions modernes, c’est-à-dire des modèles mathématiques qui sont attentifs au problème de surajustement, ont été mises en œuvre par Lokad, afin que vous n’ayez pas à embaucher une équipe d’experts pour en bénéficier.


Commentaires des lecteurs (1)

La gestion des données de signal de demande pose les mêmes problèmes que les données en temps réel dans n’importe quelle industrie : comment accéder et intégrer de grandes quantités de données, puis les combiner et les analyser avec des informations historiques. Il y a 9 ans | Opportunités d’affaires