Quantilregression

Von Joannès Vermorel, Februar 2012

Die Quantilregression ist eine Art von Regression (d.h. Prognose), die absichtlich eine Verzerrung im Ergebnis einführt. Anstatt den Mittelwert der vorherzusagenden Variablen zu ermitteln, sucht eine Quantilregression den Median und beliebige andere Quantile (manchmal Perzentile genannt). Quantile sind besonders nützlich für die Bestandsverwaltung, da sie eine direkte Methode zur Berechnung des Reorder point darstellen.

Regression ist hier ein Synonym für Prognose. “Regression” betont den mathematischen Ansatz, während “Prognose” die praktische Anwendung des Ergebnisses hervorhebt.

Das Konzept der Quantilregression ist ein relativ fortgeschrittenes statistisches Thema; das Ziel dieses Artikels ist es nicht, sich einer strengen Betrachtung dieses Themas zu widmen, sondern vielmehr eine (relativ) intuitive Einführung für Praktiker im Einzelhandel oder in der Fertigung zu bieten.

Visuelle Darstellung von Quantilen

Die untere und obere Quantil-Zeitreihe nebeneinander mit der Mittelwert-Prognose-Zeitreihe.

Das obige Diagramm veranschaulicht 3 unterschiedliche Prognosen:

in Rot, eine 75%-Quantil-Prognose.
in Schwarz, eine Mittelwert-Prognose.
in Grün, eine 25%-Quantil-Prognose.

Optisch verhalten sich Quantile ganz ähnlich wie Konfidenzintervalle. In der Praxis wird das Quantil jedoch nur für einen einzigen Zielprozentsatz benötigt.

Quantile (oder Perzentile) der zukünftigen Nachfrage

Die klassische und intuitivste Prognose ist die Mittelwert-Prognose: Die jeweiligen Gewichte des Über- und Unterprognostizierens sollten gleich sein, andernfalls ist die Prognose verzerrt (genauer gesagt gegen den Mittelwert verzerrt).

Obwohl es wünschenswert ist, eine unvoreingenommene Prognose zu besitzen, sagt das nichts über die Genauigkeit der Prognose aus. Insbesondere kann eine Prognose sowohl unvoreingenommen als auch stark ungenau sein. Die Verzerrung bezieht sich lediglich auf die Neigung des Prognosemodells, die Zukunft zu überschätzen oder zu unterschätzen.

Eine erste Verfeinerung dieser Sichtweise ist die Medianprognose: Die jeweilige Häufigkeit von Über- und Unterprognosen sollte gleich sein, andernfalls ist die Prognose gegen den Median verzerrt.

An dieser Stelle haben wir den Begriff der unvoreingenommenen Prognosen bereits von gleichen Gewichten auf gleiche Chancen verlagert. Diese Verschiebung ist subtil, kann jedoch in einigen Situationen einen großen numerischen Einfluss haben.

Veranschaulichung: Durchschnittliches vs. mittleres Haushaltseinkommen in den USA

Das Haushaltseinkommen verdeutlicht den tiefgreifenden Unterschied zwischen Mittelwert und Median.

Laut dem US Census Bureau betrug im Jahr 2004 das mittlere Haushaltseinkommen $44,389, während im selben Jahr das durchschnittliche Einkommen $60,528 betrug, was fast 40% höher als der Median ist.

Diese Diskrepanz wird durch die vergleichsweise hohen Einkommen des reichsten US-Haushalts im Vergleich zum Rest der Bevölkerung erklärt. Eine solche Abweichung zwischen Mittelwert und Median findet man in allen Verteilungen, die nicht symmetrisch sind, typischerweise in allen Verteilungen, die keiner Normalverteilung folgen.

Verallgemeinerung des Medians

Der Median stellt den Schwellenwert dar, an dem die Verteilung in 50/50 aufgeteilt wird. Es ist jedoch möglich, andere Häufigkeitsverhältnisse zu betrachten. Zum Beispiel können wir 80/20 oder 90/10 oder beliebige andere Verhältnisse in Betracht ziehen, bei denen die Summe 100% beträgt.

Quantile stellen eine Verallgemeinerung des Medians auf einen beliebigen Prozentsatz dar. Für τ, einen Wert zwischen 0 und 1, repräsentiert die Quantilregression Q(τ) den Schwellenwert, bei dem die Wahrscheinlichkeit, einen Wert unterhalb dieses Schwellenwerts zu beobachten, genau τ beträgt.

Quantilprognosen

Sowohl klassische als auch Quantilprognosen verwenden eine Zeitreihe als Eingabe. Die Zeitreihen stellen die zugrunde liegenden Daten dar. Zusätzlich zu den Daten erfordert eine klassische Mittelwert-Zeitreihenprognose zwei zusätzliche strukturelle Einstellungen:

die Periode, wie Tag, Woche oder Monat.
den Horizont, eine ganze Zahl, die die Anzahl der zu prognostizierenden Perioden darstellt.

Implizit wird die Zeitreihe entsprechend der Periode aggregiert, und der Horizont wird so gewählt, dass er praktisch nützlich ist, typischerweise größer als die Lieferzeit.

Mittelwert-Prognosen profitieren von einer sehr praktischen Eigenschaft: Es ist mathematisch korrekt, die Prognosen zu summieren. Zum Beispiel, wenn y1, y2, y3 und y4 die Prognose für 4 Wochen darstellen, dann können wir, falls wir die erwartete Nachfrage nur für die nächsten zwei Wochen benötigen, y1+y2 summieren.

Jedoch ist das Addieren von Quantilprognosen mathematisch inkorrekt, oder genauer gesagt, die Summe der Quantile ergibt nicht das Quantil der Summe (Summe der Segmente).

Wir wollen veranschaulichen, warum Quantile nicht summiert werden können. Nehmen wir an, wir hätten einen Glücksspieler, der jede Woche einen $1-Einsatz in einen Spielautomaten steckt. Angenommen, die Gewinnchance beträgt 1% für einen Gewinn von $50 und sonst null. Wenn wir das 99%-Quantil der erwarteten Belohnung betrachten, erhalten wir jede Woche einen Gewinn von $50. Betrachtet man jedoch das 99%-Quantil über zwei Wochen, so bleibt der erwartete Gewinn bei $50. In der Tat beträgt die Wahrscheinlichkeit, zweimal zu gewinnen, nur 0,01% (1% mal 1%), weshalb das 99%-Quantil unverändert bleibt. Die Summe der beiden 99%-wöchentlichen Quantile würde $100 ergeben, aber in Wirklichkeit benötigt es 16 Wochen, um einen Gewinn von $100 im 99%-Quantil anzusammeln (der Beweis für dieses numerische Ergebnis wird nicht erbracht, da er über den Rahmen dieses Artikels hinausgeht).

Da Quantilprognosen nicht summiert werden können, müssen Quantil-Zeitreihenprognosen das Konzept der Periodenaggregation überdenken. Tatsächlich ist die Erstellung von pro Periode Quantilprognosen sinnlos, da diese elementaren Prognosen nicht kombiniert werden können, um korrekte Quantile über Segmente zu erzeugen.

Dementsprechend besitzt die Quantil-Zeitreihenprognose eine eigene Struktur:

τ das anvisierte Quantil, ein Prozentsatz.
λ der Horizont, der eine Dauer (typischerweise in Tagen) ausdrückt.

Zum Beispiel, wenn die Zeitreihe die Verkäufe eines Produkts A darstellt und wir die Einstellungen τ=0.90 und λ=14 days haben, dann wird die Quantilprognose (τ, λ) den Nachfragewert zurückgeben, der genau eine 90%ige Wahrscheinlichkeit hat, größer zu sein als die über 14 Tage beobachtete Gesamtnachfrage (bzw. eine 10%ige Wahrscheinlichkeit, niedriger zu sein als die Nachfrage über die gleichen 14 Tage).

Im Gegensatz zu klassischen Prognosen liefern Quantilprognosen genau einen einzigen Wert pro Zeitreihe, unabhängig vom Horizont. In gewissem Maße sind Quantilprognosen periode-agnostischer als ihre klassischen Gegenstücke.

Lokads Fallstrick

Auf den ersten Blick wirken Quantilprognosen etwas komplizierter als die klassischen. Dennoch neigen Praktiker in vielen realen Situationen dazu, zunächst Mittelwert-Prognosen zu erstellen, um diese anschließend sofort als Quantilprognosen zu extrapolieren, typischerweise in der Annahme, dass die Prognosen einer Normalverteilung folgen. Dieser Extrapolationsschritt stellt jedoch häufig das schwächste Glied des Prozesses dar und kann das Endergebnis erheblich verschlechtern. Die Prognosetechnologie sollte sich an die praktischen Anforderungen anpassen, d.h. native Quantilprognosen liefern und nicht umgekehrt.

Weiterführende Literatur

Reorder point, wie Quantile bei der Bestandsverwaltung angewendet werden.
Pinball loss function, wie die Genauigkeit einer Quantilprognose gemessen wird.
Roger Koenker, Kevin F. Hallock, (2001) Quantilregression, Journal of Economic Perspectives, 15 (4), 143–156
Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Nichtparametrische Quantilschätzung, Journal of Machine Learning Research 7 1231–1264