Quantilregression
Die Quantilregression ist eine Art von Regression (d.h. Prognose), die absichtlich eine Verzerrung im Ergebnis einführt. Anstatt den Mittelwert der vorherzusagenden Variablen zu ermitteln, sucht eine Quantilregression den Median und beliebige andere Quantile (manchmal Perzentile genannt). Quantile sind besonders nützlich für die Bestandsverwaltung, da sie eine direkte Methode zur Berechnung des Reorder point darstellen.
Das Konzept der Quantilregression ist ein relativ fortgeschrittenes statistisches Thema; das Ziel dieses Artikels ist es nicht, sich einer strengen Betrachtung dieses Themas zu widmen, sondern vielmehr eine (relativ) intuitive Einführung für Praktiker im Einzelhandel oder in der Fertigung zu bieten.
Visuelle Darstellung von Quantilen

Das obige Diagramm veranschaulicht 3 unterschiedliche Prognosen:
- in Rot, eine 75%-Quantil-Prognose.
- in Schwarz, eine Mittelwert-Prognose.
- in Grün, eine 25%-Quantil-Prognose.
Optisch verhalten sich Quantile ganz ähnlich wie Konfidenzintervalle. In der Praxis wird das Quantil jedoch nur für einen einzigen Zielprozentsatz benötigt.
Quantile (oder Perzentile) der zukünftigen Nachfrage
Die klassische und intuitivste Prognose ist die Mittelwert-Prognose: Die jeweiligen Gewichte des Über- und Unterprognostizierens sollten gleich sein, andernfalls ist die Prognose verzerrt (genauer gesagt gegen den Mittelwert verzerrt).
Eine erste Verfeinerung dieser Sichtweise ist die Medianprognose: Die jeweilige Häufigkeit von Über- und Unterprognosen sollte gleich sein, andernfalls ist die Prognose gegen den Median verzerrt.
An dieser Stelle haben wir den Begriff der unvoreingenommenen Prognosen bereits von gleichen Gewichten auf gleiche Chancen verlagert. Diese Verschiebung ist subtil, kann jedoch in einigen Situationen einen großen numerischen Einfluss haben.
Veranschaulichung: Durchschnittliches vs. mittleres Haushaltseinkommen in den USA
Das Haushaltseinkommen verdeutlicht den tiefgreifenden Unterschied zwischen Mittelwert und Median.
Diese Diskrepanz wird durch die vergleichsweise hohen Einkommen des reichsten US-Haushalts im Vergleich zum Rest der Bevölkerung erklärt. Eine solche Abweichung zwischen Mittelwert und Median findet man in allen Verteilungen, die nicht symmetrisch sind, typischerweise in allen Verteilungen, die keiner Normalverteilung folgen.
Verallgemeinerung des Medians
Der Median stellt den Schwellenwert dar, an dem die Verteilung in 50/50 aufgeteilt wird. Es ist jedoch möglich, andere Häufigkeitsverhältnisse zu betrachten. Zum Beispiel können wir 80/20 oder 90/10 oder beliebige andere Verhältnisse in Betracht ziehen, bei denen die Summe 100% beträgt.
Quantile stellen eine Verallgemeinerung des Medians auf einen beliebigen Prozentsatz dar. Für τ, einen Wert zwischen 0 und 1, repräsentiert die Quantilregression Q(τ) den Schwellenwert, bei dem die Wahrscheinlichkeit, einen Wert unterhalb dieses Schwellenwerts zu beobachten, genau τ beträgt.
Quantilprognosen
Sowohl klassische als auch Quantilprognosen verwenden eine Zeitreihe als Eingabe. Die Zeitreihen stellen die zugrunde liegenden Daten dar. Zusätzlich zu den Daten erfordert eine klassische Mittelwert-Zeitreihenprognose zwei zusätzliche strukturelle Einstellungen:
- die Periode, wie Tag, Woche oder Monat.
- den Horizont, eine ganze Zahl, die die Anzahl der zu prognostizierenden Perioden darstellt.
Implizit wird die Zeitreihe entsprechend der Periode aggregiert, und der Horizont wird so gewählt, dass er praktisch nützlich ist, typischerweise größer als die Lieferzeit.
Mittelwert-Prognosen profitieren von einer sehr praktischen Eigenschaft: Es ist mathematisch korrekt, die Prognosen zu summieren. Zum Beispiel, wenn y1, y2, y3 und y4 die Prognose für 4 Wochen darstellen, dann können wir, falls wir die erwartete Nachfrage nur für die nächsten zwei Wochen benötigen, y1+y2 summieren.
Jedoch ist das Addieren von Quantilprognosen mathematisch inkorrekt, oder genauer gesagt, die Summe der Quantile ergibt nicht das Quantil der Summe (Summe der Segmente).
Da Quantilprognosen nicht summiert werden können, müssen Quantil-Zeitreihenprognosen das Konzept der Periodenaggregation überdenken. Tatsächlich ist die Erstellung von pro Periode Quantilprognosen sinnlos, da diese elementaren Prognosen nicht kombiniert werden können, um korrekte Quantile über Segmente zu erzeugen.
Dementsprechend besitzt die Quantil-Zeitreihenprognose eine eigene Struktur:
- τ das anvisierte Quantil, ein Prozentsatz.
- λ der Horizont, der eine Dauer (typischerweise in Tagen) ausdrückt.
Zum Beispiel, wenn die Zeitreihe die Verkäufe eines Produkts A darstellt und wir die Einstellungen τ=0.90 und λ=14 days haben, dann wird die Quantilprognose (τ, λ) den Nachfragewert zurückgeben, der genau eine 90%ige Wahrscheinlichkeit hat, größer zu sein als die über 14 Tage beobachtete Gesamtnachfrage (bzw. eine 10%ige Wahrscheinlichkeit, niedriger zu sein als die Nachfrage über die gleichen 14 Tage).
Im Gegensatz zu klassischen Prognosen liefern Quantilprognosen genau einen einzigen Wert pro Zeitreihe, unabhängig vom Horizont. In gewissem Maße sind Quantilprognosen periode-agnostischer als ihre klassischen Gegenstücke.
Lokads Fallstrick
Auf den ersten Blick wirken Quantilprognosen etwas komplizierter als die klassischen. Dennoch neigen Praktiker in vielen realen Situationen dazu, zunächst Mittelwert-Prognosen zu erstellen, um diese anschließend sofort als Quantilprognosen zu extrapolieren, typischerweise in der Annahme, dass die Prognosen einer Normalverteilung folgen. Dieser Extrapolationsschritt stellt jedoch häufig das schwächste Glied des Prozesses dar und kann das Endergebnis erheblich verschlechtern. Die Prognosetechnologie sollte sich an die praktischen Anforderungen anpassen, d.h. native Quantilprognosen liefern und nicht umgekehrt.
Weiterführende Literatur
- Reorder point, wie Quantile bei der Bestandsverwaltung angewendet werden.
- Pinball loss function, wie die Genauigkeit einer Quantilprognose gemessen wird.
- Roger Koenker, Kevin F. Hallock, (2001) Quantilregression, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Nichtparametrische Quantilschätzung, Journal of Machine Learning Research 7 1231–1264