La planification des promotions dans le retail – Défis de données

La prévision est presque toujours un exercice difficile, mais il existe un domaine dans le commerce général dont le retail est considéré comme étant d’un ordre de grandeur plus compliqué que les autres : la planification des promotions. Chez Lokad, la planification des promotions est l’un des défis fréquents que nous relevons pour nos plus grands clients, généralement par le biais de missions Big Data ad hoc.
Ce billet est le premier d’une série sur la planification des promotions. Nous allons aborder les différents défis auxquels sont confrontés les détaillants lorsqu’ils prévoient la demande promotionnelle, et donner quelques indications sur les solutions que nous proposons.
Le premier défi auquel sont confrontés les détaillants lorsqu’ils abordent les promotions est la qualité des données. Ce problème est généralement largement sous-estimé, tant par les détaillants moyens que par les grands détaillants. Pourtant, sans des données hautement qualifiées sur les promotions passées, l’ensemble de l’initiative de planification fait face à un problème de Garbage In Garbage Out.
Problèmes de qualité des données des enregistrements de promotions
La qualité des données promotionnelles est généralement médiocre – ou du moins bien inférieure à celle des données de ventes régulières. Un enregistrement promotionnel, au niveau le plus désagrégé, représente un identifiant d’article, un identifiant de magasin, une date de début (et une date de fin) ainsi que toutes les dimensions décrivant la promotion elle-même.
Ces enregistrements promotionnels présentent de nombreux problèmes:
- Des enregistrements existent, mais le magasin n’a pas entièrement mis en œuvre le plan de promotion, notamment en ce qui concerne le facing.
- Des enregistrements existent, mais la promotion n’a jamais eu lieu dans le réseau. En effet, les accords promotionnels sont généralement négociés 3 à 6 mois à l’avance avec les fournisseurs. Parfois, un accord est annulé avec un préavis de seulement quelques semaines, mais les données promotionnelles correspondantes ne sont jamais nettoyées.
- Les initiatives off the record des magasins, comme déplacer un article en surstock vers les étagères de fin d’allée, ne sont pas enregistrées. Le facing est l’un des facteurs les plus puissants qui stimulent le levier promotionnel, et ne doit pas être sous-estimé.
- Les détails des mécanismes de promotion ne sont pas enregistrés avec précision. Par exemple, la présence d’un emballage personnalisé, et la description structurée de l’emballage sont rarement conservés.
Après avoir observé des problèmes semblables dans de nombreux ensembles de données de détaillants, nous pensons que l’explication est simple : il y a peu ou pas d’impératifs opérationnels pour corriger les enregistrements promotionnels. En effet, si les données de ventes sont fausses, cela crée tellement de problèmes opérationnels et comptables que résoudre le problème devient très rapidement la priorité numéro 1.
En revanche, les enregistrements promotionnels peuvent rester incroyablement inexacts pendant des années. Tant que personne ne tente de produire un quelconque modèle de prévision basé sur ces enregistrements, leur inexactitude a un impact négatif négligeable sur les opérations des détaillants.
La solution principale à ces problèmes de qualité de données est constituée par les processus de qualité de données, et il faut valider empiriquement à quel point ces processus sont résilients face aux conditions réelles en magasin.
Cependant, même le meilleur processus ne peut pas réparer des données passées défectueuses. Comme deux années de bonnes données promotionnelles sont généralement nécessaires pour obtenir des résultats corrects, il est important d’investir tôt et massivement dans l’historisation des enregistrements promotionnels.
Problèmes structurels des données
Au-delà des problèmes liés aux enregistrements promotionnels, la planification précise des promotions souffre également de problèmes plus larges et insidieux liés à la manière dont l’information est collectée dans le commerce de détail.
La troncature de l’historique : La plupart des détaillants ne conservent pas indéfiniment leur historique des ventes. En général, les données “anciennes” sont supprimées en suivant deux règles :
- si l’enregistrement date de plus de 3 ans, alors supprimer l’enregistrement.
- si l’article n’a pas été vendu pendant 1 an, alors supprimer l’article, et supprimer tous les enregistrements de ventes associés.
Évidemment, selon le détaillant, les seuils peuvent différer, mais alors que la plupart des grands détaillants existent depuis des décennies, il est exceptionnel de trouver un historique des ventes sur 5 ans non tronqué. Ces troncatures sont généralement basées sur deux fausses hypothèses :
- stocker de vieilles données est coûteux : Stocker l’intégralité des données de ventes sur 10 ans (jusqu’au niveau des reçus) de Walmart – et votre entreprise est certainement plus petite que Walmart – peut être réalisé pour moins de 1000 USD de stockage par mois. Le stockage de données n’est pas seulement ridiculement bon marché actuellement, il l’était déjà il y a 10 ans, du point de vue des réseaux de distribution.
- les données anciennes ne servent à rien : Bien que des données datant de 10 ans ne servent certainement à aucune fin opérationnelle, d’un point de vue statistique, même des données datées de 10 ans peuvent être utiles pour affiner l’analyse de nombreux problèmes. En d’autres termes, une longue histoire offre une gamme beaucoup plus large de possibilités pour valider la performance des modèles de prévision et éviter les problèmes de surapprentissage.
Remplacer les GTIN par des codes produits internes : De nombreux détaillants conservent leur historique des ventes encodé avec des identifiants d’articles alternatifs au lieu des GTIN natifs (c’est-à-dire UPC ou EAN13 selon que l’on soit en Amérique du Nord ou en Europe). En remplaçant les GTIN par des codes d’identification ad hoc, on considère fréquemment que cela devient plus facile de suivre les substitutions de GTIN et cela aide à éviter un historique segmenté.
Cependant, les substitutions de GTIN ne sont pas toujours exactes, et les entrées incorrectes deviennent presque impossibles à retrouver. Pire encore, une fois que deux GTIN ont été fusionnés, les anciennes données sont perdues : il n’est plus possible de reconstituer les deux ensembles originaux d’enregistrements de ventes.
Il est préférable de conserver les entrées GTIN, car les GTIN représentent la réalité physique de l’information collectée par le POS (point de vente). Ensuite, les indications pour les substitutions de GTIN devraient être conservées séparément, ce qui permet de réviser les associations ultérieurement si le besoin s’en fait sentir.
Ne pas conserver l’information sur l’emballage : Dans le commerce alimentaire, de nombreux produits se déclinent en une variété de formats distincts : des portions individuelles aux portions familiales, des bouteilles individuelles aux packs, du format régulier aux formats promotionnels à +25 %, etc.
Conserver l’information sur ces formats est important car, pour de nombreux clients, un format alternatif du même produit constitue fréquemment un bon substitut lorsque l’autre format manque.
Encore une fois, bien qu’il puisse être tentant de fusionner les ventes dans une sorte de meta-GTIN où toutes les variantes de taille seraient réunies, il peut y avoir des exceptions, et toutes les tailles ne sont pas des substituts équivalents (ex : 18g de Nutella vs 5kg de Nutella). Ainsi, l’information sur l’emballage devrait être conservée, mais séparée des ventes brutes.
La qualité des données, un investissement extraordinairement rentable
La qualité des données est l’un des rares domaines où les investissements sont généralement récompensés par un rendement multiplié par dix dans le retail. De meilleures données améliorent tous les résultats en aval, des méthodes les plus naïves aux méthodes les plus avancées. En théorie, la qualité des données devrait souffrir du principe des rendements décroissants, cependant, nos propres observations indiquent qu’à l’exception de quelques étoiles montantes du le e-commerce, la plupart des détaillants sont très loin du point où investir davantage dans la qualité des données ne serait pas extrêmement rentable.
Ensuite, contrairement à la construction de modèles prédictifs avancés, la qualité des données ne requiert pas de technologies compliquées, mais beaucoup de bon sens et un fort sens de la simplicité.
Restez à l’écoute, la prochaine fois, nous discuterons des défis liés aux processus pour la planification des promotions.