Aktionsplanung im Einzelhandel – Datenherausforderungen

Die Prognose ist fast immer eine schwierige Aufgabe, aber es gibt einen Bereich im allgemeinen Waren-Einzelhandel, der als eine Größenordnung komplizierter gilt als alle anderen: Aktionsplanung. Bei Lokad ist Aktionsplanung eine der häufigsten Herausforderungen, denen wir uns bei unseren größten Kunden stellen, typischerweise durch Ad-hoc-Big-Data-Missionen.
Dieser Beitrag ist der erste einer Reihe zur Aktionsplanung. Wir werden die verschiedenen Herausforderungen behandeln, denen sich Einzelhändler bei der Prognose der Aktionsnachfrage stellen, und einige Einblicke in die von uns vorgeschlagenen Lösungen geben.
Die erste Herausforderung, der sich Einzelhändler bei der Bewältigung von Aktionen stellen müssen, ist die Datenqualität. Dieses Problem wird üblicherweise sowohl von mittelgroßen als auch von großen Einzelhändlern stark unterschätzt. Doch ohne hochqualifizierte Daten über vergangene Aktionen steht die gesamte Planungsinitiative vor einem Garbage In Garbage Out-Problem.
Datenqualitätsprobleme bei Aktionsdatensätzen
Die Qualität der Aktionsdaten ist typischerweise schlecht – oder zumindest viel schlechter als die Qualität der normalen Verkaufsdaten. Ein Aktionsdatensatz, auf der feinsten Detailebene, repräsentiert eine Artikelkennung, eine Filialkennung, ein Startdatum (ein Enddatum) sowie alle Dimensionen, die die Aktion selbst beschreiben.
Diese Aktionsdatensätze weisen zahlreiche Probleme auf:
- Datensätze existieren, aber die Filiale hat den Aktionsplan nicht vollständig umgesetzt, insbesondere in Bezug auf die Warenpräsentation.
- Datensätze existieren, aber die Aktion hat im gesamten Netzwerk nie stattgefunden. In der Tat werden Aktionsdeals in der Regel 3 bis 6 Monate im Voraus mit den Lieferanten verhandelt. Manchmal wird ein Deal mit nur wenigen Wochen Vorlaufzeit abgesagt, aber die entsprechenden Aktionsdaten werden nie bereinigt.
- Inoffizielle Initiativen von Filialen, wie etwa das Verschieben eines überbevorrateten Artikels in die Endgänge, werden nicht erfasst. Die Warenpräsentation ist einer der stärksten Faktoren für den Aktionsumsatz und sollte nicht unterschätzt werden.
- Details der Aktionsmechanismen werden nicht genau erfasst. Zum Beispiel werden die Existenz einer Sonderverpackung und die strukturierte Beschreibung der Verpackung selten beibehalten.
Nachdem wir ähnliche Probleme in den Datensätzen vieler Einzelhändler beobachtet haben, sind wir der Meinung, dass die Erklärung einfach ist: es gibt kaum oder keine betriebliche Notwendigkeit, Aktionsdatensätze zu korrigieren. Tatsächlich, wenn die Verkaufsdaten fehlerhaft sind, entstehen so viele operative und buchhalterische Probleme, dass die Behebung des Problems sehr schnell zur obersten Priorität wird.
Im Gegensatz dazu können Aktionsdatensätze jahrelang völlig ungenau bleiben. Solange niemand versucht, irgendein Prognosemodell auf der Grundlage dieser Datensätze zu erstellen, haben ungenaue Aufzeichnungen nur vernachlässigbare negative Auswirkungen auf die Abläufe im Einzelhandel.
Die primäre Lösung für diese Datenqualitätsprobleme sind Datenqualitätsprozesse, und es gilt empirisch zu überprüfen, wie resilient diese Prozesse unter den realen Bedingungen der Filialen sind.
Allerdings kann der beste Prozess defekte historische Daten nicht beheben. Da in der Regel 2 Jahre gute Aktionsdaten erforderlich sind, um ansprechende Ergebnisse zu erzielen, ist es wichtig, frühzeitig und konsequent in die Historisierung von Aktionsdatensätzen zu investieren.
Strukturelle Datenprobleme
Neben Problemen mit Aktionsdatensätzen leidet auch die präzise Planung von Aktionen unter breiteren und heimtückischeren Problemen, die mit der Art und Weise zusammenhängen, wie Informationen im Einzelhandel erfasst werden.
Verkürzung der Historie: Die meisten Einzelhändler bewahren ihre Verkaufshistorie nicht unbegrenzt auf. Üblicherweise werden „alte“ Daten nach zwei Regeln gelöscht:
- wenn der Datensatz älter als 3 Jahre ist, wird er gelöscht.
- wenn der Artikel seit 1 Jahr nicht verkauft wurde, wird der Artikel gelöscht und alle zugehörigen Verkaufsdatensätze werden entfernt.
Offensichtlich können sich die Schwellenwerte je nach Einzelhändler unterscheiden, aber während die meisten großen Einzelhändler seit Jahrzehnten existieren, ist es außergewöhnlich, eine ungekürzte Verkaufshistorie von 5 Jahren zu finden. Diese Kürzungen beruhen in der Regel auf zwei falschen Annahmen:
- Alte Daten zu speichern ist teuer: Die Speicherung der gesamten 10-Jahres-Verkaufshistorie (bis hinunter zur Quittungsebene) von Walmart – und Ihr Unternehmen ist sicherlich kleiner als Walmart – kann für weniger als 1000 USD pro Monat realisiert werden. Datenspeicherung ist nicht nur heutzutage unglaublich günstig, sie war vor 10 Jahren für Einzelhandelsnetzwerke bereits unglaublich günstig.
- Alte Daten erfüllen keinen Zweck: Auch wenn 10 Jahre alte Daten sicherlich keinen operativen Zwecken dienen, können sie aus statistischer Sicht nützlich sein, um die Analyse bei vielen Problemen zu verfeinern. Kurz gesagt, eine lange Historie bietet einen viel breiteren Spielraum, um die Leistung von Prognosemodellen zu validieren und Overfitting-Probleme zu vermeiden.
Ersetzen von GTINs durch unternehmensinterne Produktcodes: Viele Einzelhändler bewahren ihre Verkaufshistorie mit alternativen Artikelkennungen anstelle der nativen GTINs (auch als UPC oder EAN13 bekannt, je nachdem, ob man in Nordamerika oder Europa ist) auf. Durch den Ersatz der GTIN durch ad-hoc Identifikationscodes wird häufig angenommen, dass es einfacher wird, GTIN-Substitutionen nachzuverfolgen und segmentierte Historien zu vermeiden.
GTIN-Substitutionen sind jedoch nicht immer genau, und falsche Einträge sind nahezu unmöglich nachzuvollziehen. Schlimmer noch, sobald zwei GTINs verschmolzen wurden, gehen die früheren Daten verloren: Es ist nicht mehr möglich, die beiden ursprünglichen Mengen von Verkaufsdatensätzen zu rekonstruieren.
Stattdessen ist es weitaus besser, die GTIN-Einträge beizubehalten, da GTINs die physische Realität der vom POS (Point of Sales) erfassten Informationen darstellen. Die Hinweise auf GTIN-Substitutionen sollten dann getrennt gespeichert werden, um es später zu ermöglichen, die Zuordnungen bei Bedarf zu überarbeiten.
Nichtbeibehaltung der Verpackungsinformationen: Im Lebensmitteleinzelhandel werden viele Produkte in einer Vielzahl unterschiedlicher Formate angeboten: von Ein-Portionen bis zu Familienportionen, von Einzelflaschen bis zu Packungen, vom Standardformat bis zu +25% Aktionsformaten usw.
Die Beibehaltung der Informationen über diese Formate ist wichtig, da für viele Kunden ein alternatives Format desselben Produkts häufig einen guten Ersatz darstellt, wenn das andere Format fehlt.
Wiederum, obwohl es verlockend sein mag, die Verkäufe in eine Art Meta-GTIN zu verschmelzen, in der alle Größenvarianten zusammengeführt wurden, kann es Ausnahmen geben, und nicht alle Größen sind gleichwertige Substitute (z.B.: 18g Nutella vs 5kg Nutella). Daher sollten die Verpackungsinformationen beibehalten, aber von den Rohverkaufsdaten getrennt werden.
Datenqualität, eine äußerst rentable Investition
Datenqualität ist eines der wenigen Bereiche, in denen Investitionen im Einzelhandel typischerweise zehnfach belohnt werden. Bessere Daten verbessern alle nachgelagerten Ergebnisse, von den einfachsten bis zu den fortgeschrittensten Methoden. Theoretisch sollte die Datenqualität dem Prinzip der abnehmenden Erträge unterliegen, jedoch zeigen unsere eigenen Beobachtungen, dass – abgesehen von einigen aufstrebenden Stars des Online-Handels – die meisten Einzelhändler noch weit davon entfernt sind, dass weitere Investitionen in die Datenqualität nicht äußerst profitabel wären.
Anders als der Aufbau fortschrittlicher prädiktiver Modelle erfordert die Datenqualität keine komplizierten Technologien, sondern viel gesunden Menschenverstand und ein starkes Gefühl für Einfachheit.
Bleiben Sie dran, beim nächsten Mal werden wir Prozessherausforderungen in der Aktionsplanung besprechen.