Bessere Promotion-Prognosen im Einzelhandel
Seit unserem großen Tags+Events Upgrade im letzten Herbst arbeiten wir sehr intensiv an der promotion Prognose für den Einzelhandel. Wir verfügen mittlerweile über Tausende von Werbeereignissen in unseren Datenbanken; und die Analyse dieser Ereignisse hat uns zu sehr interessanten Erkenntnissen geführt.
Es ist auch kaum überraschend, dass wir festgestellt haben, dass:
- wenn Promotion-Prognosen von Praktikern manuell durchgeführt werden, liegen die Prognosefehler im Durchschnitt meist über 60%. Das Ergebnis kann variieren, aber typische Absatzprognosefehler im Einzelhandel liegen in der Regel näher bei 20%.
- die Einbeziehung von Promotionsdaten über Tags und Events reduziert den durchschnittlichen Prognosefehler um etwa 50%. Auch hier kann das Ergebnis variieren, abhängig von der Menge der Daten, die Sie zu Ihren Promotionen haben.
Als ein weniger intuitives Ergebnis haben wir auch festgestellt, dass regelbasierte Methoden und lineare Methoden, obwohl sie von einigen Experten und Software-Tools weithin beworben werden, sehr anfällig für Overfitting sind und die Bewertung des Prognosefehlers verzerren können, was zu einem falschen Eindruck der Leistungsfähigkeit in der Promotion-Prognose führt.
Beachten Sie auch, dass diese 50%-Verbesserung in der Regel mit einer ziemlich begrenzten Menge an Informationen erzielt wurde, üblicherweise nicht mehr als 2 oder 3 binäre Deskriptoren pro Promotion.
Sogar einfache Daten zu Ihren Promotionen führen zu signifikanten Verbesserungen der Prognosen, was in erheblichen Einsparungen beim Betriebskapital resultiert.
Der erste Schritt zur Verbesserung Ihrer Promotion-Prognosen besteht darin, präzise Promotionsdaten zu erfassen. Nach unserer Erfahrung ist dieser Schritt der schwierigste und kostspieligste. Wenn Sie keine genauen Aufzeichnungen über Ihre Promotionen haben, besteht kaum Hoffnung, präzise Prognosen zu erhalten. Wie man so sagt, Garbage In, Garbage Out.
Dennoch haben wir festgestellt, dass selbst ein einziger Promotion-Deskriptor, eine binäre Variable, die lediglich angibt, ob der Artikel aktuell promotet wird oder nicht, zu einer signifikanten Verbesserung der Prognosen führen kann. Somit müssen Ihre Aufzeichnungen zwar präzise sein, aber sie müssen nicht detailliert sein, um Ihre Prognosen zu verbessern.
Daher raten wir Ihnen, den Zeitpunkt Ihrer Promotionen genau zu verfolgen: wann hat sie begonnen? wann hat sie geendet? Beachten Sie, dass im eCommerce die Darstellung auf der Startseite oft einen Effekt hat, der mit einer Produktpromotion vergleichbar ist, weshalb Sie die Entwicklung Ihrer Startseite im Auge behalten sollten.
Weiterhin zählt die Artikelbeschreibung. Tatsächlich werden nach unserer Erfahrung selbst die am häufigsten promoteten Artikel in ihrer Marktlaufzeit nicht mehr als ein Dutzend Promotionen erhalten. Im Durchschnitt ist die Anzahl der bisher bekannten Promotionen für einen bestimmten Artikel lächerlich gering, und zwar im Schnitt zwischen null und einer Promotion. Folglich können Sie keine verlässlichen Ergebnisse erwarten, wenn Sie sich jeweils nur auf die vergangenen Promotionen eines einzelnen Produkts konzentrieren, da es in den meisten Fällen schlichtweg keine gibt.
Stattdessen müssen Sie sich auf Artikel konzentrieren, die dem Artikel ähneln, den Sie zu promoten planen. Mit Lokad können Sie dies tun, indem Sie Ihren Verkäufen Tags zuordnen. In der Regel nutzen Einzelhändler eine Hierarchie, um ihren Katalog zu organisieren. Denken Sie an eine Artikelliste mit Familien, Unterfamilien, Artikeln, Varianten usw.
Die Übersetzung eines hierarchischen Katalogs in Tags kann recht einfach erfolgen, indem Sie dem folgenden, am Beispiel eines fiktiven Süßigkeitenhändlers illustrierten Prozess folgen:

Die mit der Verkaufshistorie von medium Lemon Lollipops assoziierten Tags wären LOLLIPOPS, LEMON, MEDIUM
Dieser Prozess wird typischerweise 2 bis 6 Tags pro Artikel in Ihrem Katalog erzeugen – abhängig von der Komplexität Ihres Katalogs.
Wir haben gesagt, dass selbst sehr begrenzte Informationen über Ihre Promotionen sofort zur Verbesserung Ihrer Absatzprognosen genutzt werden könnten. Dennoch verbessert detailliertere Promotionsinformation eindeutig die Prognosegenauigkeit.
Wir haben festgestellt, dass zwei Punkte zur Verbesserung der Prognosegenauigkeit sehr wertvoll sind:
- der Mechanismus, der die Art des Rabatts beschreibt, der Ihren Kunden angeboten wird. Typische Mechanismen sind Pauschalrabatt (z.B. -20%) aber es gibt viele andere Mechanismen wie kostenloser Versand oder Mengenrabatt (z.B.: Kaufe eins und erhalte eins gratis).
- die Kommunikation, die beschreibt, wie Ihre Kunden über das Promotionereignis informiert werden. In der Regel umfasst die Kommunikation Marketingmaßnahmen wie Radio, Zeitungen oder lokale Anzeigen, aber auch individuelle Verpackungen (falls vorhanden) und die Sichtbarkeit der promoteten Artikel im Verkaufsraum.
Bei größeren Vertriebsnetzen sollte auch die generelle Verfügbarkeit der Promotion beschrieben werden, falls Artikel nicht überall beworben werden. Eine solche Situation tritt typischerweise auf, wenn Filialleiter sich von Promotionsaktivitäten abmelden können.
Im Gespräch mit Fachleuten haben wir festgestellt, dass viele Einzelhändler damit rechnen, dass Lokad ein Regelwerk erstellt; und von diesen Regeln wird erwartet, dass sie Promotionen wie folgt erklären:
IF TV_ADS AND PERCENT25_DISCOUNT
THEN PROMO_SALES = 5 * REGULAR_SALES;
Grundsätzlich folgen diese erwarteten Regeln mehr oder weniger denselben Mustern:
- Eine Reihe binärer Bedingungen, die den Geltungsbereich der Regel definieren.
- Eine Reihe linearer Koeffizienten zur Abschätzung des Effekts der Regel.
Wir haben festgestellt, dass viele Tools auf dem Softwaremarkt verfügbar sind, die Ihnen dabei helfen, diese Regeln in Ihren Daten zu entdecken; was scheinbar viele dazu veranlasst hat, zu glauben, dass dieser Ansatz der einzige verfügbare sei.
Doch unseren Experimenten zufolge sind regelbasierte Methoden weit davon entfernt, optimal zu sein. Schlimmer noch, diese Regeln sind wirklich anfällig für Overfitting. Diese Schwäche führt häufig zu schmerzhaften Situationen, in denen eine signifikante Diskrepanz zwischen der geschätzten Prognosegenauigkeit und der tatsächlichen Prognosegenauigkeit besteht.
Overfitting ist ein sehr subtiles und dennoch sehr wichtiges Phänomen in der statistischen Prognose. Grundsätzlich besteht das zentrale Problem bei der Prognose darin, ein Modell zu entwickeln, das sehr genau ist gegenüber den Daten, die Sie nicht haben.
Insbesondere weist die statistische Theorie darauf hin, dass es möglich ist, Modelle zu entwickeln, die sich bei Anwendung auf historische Daten als sehr genau erweisen und dennoch bei der Vorhersage der Zukunft sehr ungenau sind. Das Problem besteht darin, dass, wenn Sie das Overfitting-Problem nicht im Vorfeld sorgfältig berücksichtigen, der Bau eines solchen Modells nicht nur eine bloße Möglichkeit, sondern das wahrscheinlichste Ergebnis Ihres Prozesses ist.
Daher müssen Sie Ihr Modell wirklich an den Daten optimieren, die Sie nicht haben. Dennoch erscheint dieses Problem wie ein völliges Paradoxon, denn per Definition können Sie nichts messen, wenn Sie die entsprechenden Daten nicht besitzen. Und wir haben festgestellt, dass viele Fachleute dieses Problem aufgegeben haben, weil es ohnehin nicht als lösbare Überlegung erscheint.
Unser Rat lautet: NIE AUFGEBEN
Das Kernproblem dieser Regeln besteht darin, dass sie auf historischen Daten zu gut funktionieren. Jede Regel, die Sie hinzufügen, reduziert mechanisch den Prognosefehler, den Sie an Ihren historischen Daten messen. Wenn Sie genügend Regeln hinzufügen, endet man mit einem scheinbar nahezu null Prognosefehler. Dennoch ist der empirisch gemessene Fehler an Ihren historischen Daten ein Artefakt des Prozesses, der zur Erstellung der Regeln geführt hat. Ein null Prognosefehler bei historischen Daten übersetzt sich keineswegs in einen null Prognosefehler bei zukünftigen Promotionen. Im Gegenteil, solche Modelle neigen dazu, bei zukünftigen Promotionen sehr schlecht abzuschneiden.
Obwohl es schwierig ist, für die Daten zu optimieren, die Sie nicht haben, bietet die Theorie des statistischen Lernens sowohl ein theoretisches Verständnis als auch praktische Lösungen für dieses Problem. Die zentrale Idee besteht darin, das Konzept der strukturellen Risikominimierung einzuführen, welches den empirischen Fehler ausgleicht.
Dies wird in einem späteren Beitrag behandelt, bleiben Sie dran.
(Schamloser Hinweis) Viele dieser modernen Lösungen, d.h. mathematische Modelle, die das Overfitting-Problem berücksichtigen, wurden von Lokad implementiert, sodass Sie kein Expertenteam einstellen müssen, um von ihnen zu profitieren.
Leserkommentare (1)
Der Umgang mit Nachfragesignal-Daten stellt die gleichen Probleme dar, die Echtzeitdaten in jeder Branche verursachen: wie man auf große Datenmengen zugreift, sie integriert und sie zusammen mit historischen Informationen kombiniert und analysiert.
Business Opportunities (vor 9 Jahren)