Instabilität und Überkreuzung der Quantile - Software zur Bestandsoptimierung

Eigenarten der Quantil-Prognosen


Startseite » Ressourcen » Hier

Quantil-Prognosen sind für die Lagerbestandoptimierung von unschätzbarem Wert. Jedoch kann das numerische Verhalten eines kleinen Prozentsatzes der von Lokad berechneten Quantilwerte überraschend vorkommen. Auf dieser Seite möchten wir Ihnen einen Einblick über die zugrunde liegenden Vorgänge bieten, die diese überraschenden Werte hervorbringen und Ihnen verdeutlichen, wie man mit diesen Werten am besten umgeht.

((Die meisten Kuriositäten treten in der Technologie Lokads für Quantil-Prognosen vor, die als Quantiltabellen die dritte Generation unserer Prognosetechnologie darstellt. Vor allem die Überkreuzung und Instabilität der Quantilen werden durch Quantiltabellen vollkommen aus dem Weg geräumt. Lesen Sie auch wie man eine Einkaufsprioritätenliste mit Quantiltabellen erstellt.)))


Eine Auswahl aus einer Modellbibliothek

Unser Prognose-Engine wurde als eine Bibliothek der konkurrierenden Prognosemodelle für die Bereitstellung der präzisesten Prognosen erstellt, die sich gegenseitig ergänzen. Den allgemeinen Aufbau erläutern wir auf unserer Seite Prognose-Engine. Der Wettbewerbsprozess zur Auswahl des präzisesten Modells (1) nennt sich Auswahlverfahren. Dieses Auswahlverfahren stützt sich auf ein umfassendes Backtesting-Verfahren, bei dem jedes einzelne Modell mit trunkierten Datensätzen getestet wird.

Diese Architektur ist leistungsstark, da:
  • die Prognosegenauigkeit mit Mono-Modell-Ansätzen erhöht werden kann.
  • nur wenige, im Voraus getroffene Annahmen über die Art der Nachfrage gemacht werden.
  • sie gegen Überanpassung (Overfitting) und sonstige systematische Abweichungen widerstandsfähig ist.

Dennoch kann dieses Verfahren zu kontraproduktiven Verhaltensweisen führen.

Instabilität der Quantile

Bei der Auswahl der Prognosemodelle ist darauf zu achten, dass die präzisesten Modelle im Regelfall ein sehr ähnliches Verhalten aufweisen. Somit kann es gut sein, dass ein Modell, das am 1.Tag als zweitbestes abschneidet, am 2. Tag das am besten geeignete Modell ist. In der Praxis bleibt die daraus resultierende Veränderung in den Prognosenwerten meist unbemerkt.

In Ausnahmenfällen kan es jedoch vorkommen, dass das beste und das zweitbeste Modell sich sehr unterschiedlich verhalten. Beispielsweise kann es sein, dass sich Modell A ausgezeichnet dazu eignet die Saisonbedingtheit zu erfassen, jedoch schlecht bei der Nutzung von Trends abschneidet, während Modell B Trends sehr gut erkennt, jedoch keine guten Ergebnisse bei der Erfassung der Saisonbedingtheit aufweist. In solchen Situationen spricht man von einer nahezu identischen Genauigkeit der Modelle A und B in der Gesamtbeurteilung. Betrachtet man jedoch bestimmte Zeitpunkte, kann man einen eindeutigen Unterschied in den Prognosen erkennen.

Obwohl diese Situationen selten eintreten, kann dieses Phänomen in der Praxis mit fast jedem umfangreichen Datensatz beobachtet werden. Tatsache ist, dass jeder Datensatz mit mehr als 100 Positionen wahrscheinlich eine derartige Situation für mindestens einen der Artikel auslösen wird. Die Wahrscheinlichkeit, dass dies eintritt, nimmt zu, wenn die historische Nachfrage sprunghaft oder gering ist.

Diese Situation findet hinter den Kulissen Lokads statt. Die meiste Zeit bekommt man davon nichts mit. Dennoch können Sie auf eine derartige Situation stoßen, wenn Sie zwei Durchläufe in Lokadmit ähnlichen, jedoch leicht unterschiedlichen Datensätzen starten. Gehen wir beispielsweise davon aus, dass Sie am Montag Prognosen auf Basis des Datensatzes A erstellt haben, der alle Ihre Umsätze bis einschließlich Sonntag beinhaltet. Am Mittwoch führen Sie (aus irgendeinem Grund, vielleicht, weil Sie vergessen haben neue Artikel hinzuzufügen) die Prognosen erneut auf Basis des Datensatzes B durch, der alle Umsätze bis einschließlich Dienstag enthält. Aus Ihrer Sicht sind sich die Datensätze sehr ähnlich, mit einem Unterscheid von 2 Tagen und Sie gehen davon aus, dass die Prognosen genau gleich ausfallen werden. Dennoch bemerken Sie Unterschiede, die manchmal sogar gravierend sein können. Dies ist ein hervorragendes Beispiel für Instabilität der Quantile bezeichnet: Im Auswahlverfahren haben die hinzugefügten Daten der 2 Tage die Balance zwischen einem mathematischen Modell zu einem anderen umgekippt – und das mit sehr ähnlichen Ergebnissen hinsichtlich der allgemeinen Leistung. Die allgemeine Genauigkeit hat sich zwar etwas verbessert, aber einzeln betrachtet sind die Prognosen eventuell nicht gleich organisiert, was zu kurios wirkenden Ergebnissen führen kann.

Überkreuzung der Quantile

Ähnlich verhält es sich bei folgender Annahme: Wird der Service-Level erhöht, geht man gleichzeitig von einer Steigerung des Reorder-Points aus. Tatsächlich trifft dies überwiegend zu, wenn man mit Lokad experimentiert. Tritt jedoch eine ähnliche Situation wie oben beschrieben ein: Zwei Durchläufe werden mit ähnlichen Datensätzen, jedoch mit leicht abweichenden Service-Leveln (z. B. 97 % und 98 %) in Lokad ausgeführt, können Sie beim Vergleichen der Ergebnisse sehen, dass der höhere Service-Level bei einigen Artikeln einen niedrigeren Reorder-Point auslöst. Dem Benutzer kommt dieses Muster falsch vor.

Dieses Problem ist tatsächlich kein Neues und ist bereits seit Jahrzehnten in der Statistik als Überkreuzung der Quantile (Quantile Crossing) bekannt.

Eine Überkreuzung der Quantile tritt erneut aufgrund unseres Auswahlverfahrens in Lokad auf. Beide unserer Quantil-Prognosemodelle sind konstant: Eine Steigerung des Tau-Faktors (Service-Level) erhöht tatsächlich den Quantilwert (Reorder-Point). Wird im Auswahlverfahren jedoch ein anderes Modell mit einer leicht höheren Genauigkeit ausgewählt, das sich jedoch etwas anders verhält, entsteht ein leichter Unebenheit in der Serie der Quantilwerte als die der Anfänglichen und wir können eine Überkreuzung der Quantile beobachten. Bitte denken Sie daran, dass die allgemeine Genauigkeit der Prognosen dadurch nicht beeinträchtigt wird. In solchen Fällen wird das geeigneteste Modell für den von Ihnen beabsichtigten Service-Level ausgewählt.

Wir möchten Sie erneut darauf hinweisen, dass diese Situation in der Praxis sehr selten vorkommt, dennoch bei umfangreichen Datensätzen bemerkbar ist. Wir möchten an dieser Stelle hervorheben, dass hohe Service-Level zu häufigeren Überkreuzungen der Quantile führen, da die Prognosewerte weniger stabil sind. Tatsächlich ist es schwieriger die Top 1 % bei Extremnachfrage (99% Service-Level) zu beurteilen, als die Top 10 % bei Extremnachfrage (90% Service-Level). Es liegt eine starke Hebelwirkung vor, so dass die Bandbreite der mathematischen Modelle zur Erstellung von Umfragen bei einem Service-Level von 98% in der Regel nicht dieselben sind, wie diejenigen, die für einen Service-Level von 96 oder 97% genutzt werden.

Kollaps von Quantilen

Das Problem des Kollapses von Quantilen ist eine extremere Variante der Überkreuzung von Quantilen. Werden die Service Levels stets zu extremen Werten erhöht, beginnen ab einem gewissen Punkt nicht nur manche sondern alle Quantil-Prognosen zu schrumpfen. So kann man durch die Erhöhung des Service-Levels vorgeschlagene Bestandsmengen erhalten, die praktisch einheitlich niedriger als die vorherigen sind. Dieses äußerst nicht intuitive Verhalten nennen wir den Kollaps von Quantilen.

Möchte man den Kollaps von Quantilen beobachten, müssen unvernünftigen Service-Levels angewandt werden. Daher empfehlen wir Ihnen, falls Sie in eine Situation, wie die Beschriebene, geraten, unsere Seite über die Auswahl des richtigen Service-Levels genauer durchzulesen, da die Richtlinien helfen, diese Probleme zu beheben.

Der Kollaps der Quantilen tritt aufgrund bekannter Schwächen unserer Prognosetechnologie auf. Einfacher ausgedrückt, reduzieren extreme Service-Levels, wie etwa 99%, oder gar 97% bei mangelnden Daten die Fähigkeit unseres Prognose-Engines, gute Prognosemodelle von noch besseren zu unterscheiden. Bei solch hohen Service-Level-Werten, überschätzen alle Prognosemodelle den Bedarf maßlos und zwar absichtlich. Daher tendiert die Auswahl des Modells zum „durchschnittlichen“ Verhalten unter unseren Prognosemodellen, wodurch die Möglichkeit eines Kollapses besteht, bei dem die prognostizierten Mengen fallen, während der Service-Level steigt.

Obwohl der Kollaps der Quantillen aus einer rein theoretischen Perspektive äußerst interessant ist, kommt es in der Praxis nur dazu, wenn Service-Level deutlich nachhaltige Bestände im Betrieb überschreiten. Natürlich ist es das Hauptziel Lokads, bessere Prognosen zu erstellen, doch wir konzentrieren uns auf Szenarien, die tatsächlich für Unternehmen relevant sind. Daher wird nur zweitrangig an der Linderung des Kollapses von Quantilen gearbeitet.

Umgang mit diesen numerischen Kuriositäten

Sowohl die Instabilität als auch die Überkreuzung der Quantile bringen eine Art der Unvollkommenheit zum Ausdruck, die typisch für auf Statistiken basierenden Prognosetechnologien sind. Es ist jedoch wichtig zu erkennen, dass schnelle Abhilfen für solche Unvollkommenheiten tatsächlich nur zu einer Verschlechterung der Situation führen.

Es ist möglich eine Konsistenz zu erzwingen, in dem der Prognosewert überschrieben wird, um das Eintreten einer Veränderung größer als X% zu verhindern. Es ist zudem möglich den Prognosewert zu überschreiben, so dass dieser ausschließlich mit Anstieg des Service-Levels steigt.

In beiden Fällen begünstigen wir jedoch einen der Prognosewerte – und das ohne eine statistische Grundlage. Wenn eine einzelne Prognose oder mehrere Prognosen in Betracht gezogen werden, kann der daraus resultierende Wert konsistenter erscheinen. Insgesamt führt dies jedoch nicht zu einer höheren Genauigkeit und das Unternehmen erhält keinen finanziellen Vorteil, wenn es sich auf diesen Wert verlässt.

Aus diesem Grund empfehlen wir die Quantilwerte zu nutzen, wie sie berechnet werden. Versuchen Sie nicht einen Bericht manuell zu korrigieren, indem Sie einen Wert aus einem anderen Bericht hinzufügen, der augenscheinlich mehr Sinn macht. Normalerweise ist es unmöglich zu wissen, welcher der beiden Werte der „beste“ ist. Vertrauen Sie auf die allgemeine Kohärenz des einzelnen Berichts.

Schlussendlich kann man bei Nachverfolgung dieser numerischen Kuriositäten tatsächlich einen sichtbaren Vorteil erkennen. Sichtbar ist jedoch nicht gleichbedeutend mit wichtig. Aus der Sicht von Lokad gibt es diverse andere Verbesserungen für unsere Technologie, die zu wesentlich bedeutsameren Verbesserungen führen würden. Für den Händler gilt: Durch größere Anstrengungen zur Erstellung präziser Durchlaufzeiten und geeigneterer Ziel-Service-Level können größere Vorteile als durch das Nachverfolgen des Unter-Prozentsatzes der zusätzlichen Genauigkeit erzielt werden, die durch eine Abschwächung der Instabilität und Überkreuzung der Quantile erzielt werden könnte.

Lokad Prognosetechnologie wird ständig weiterentwickelt. Unser Ziel ist es, die besten auf dem Markt erhältlichen Prognosen bereitzustellen und wir werden uns auch weiterhin mit diesen seltenen numerischen Kuriositäten, die oben erklärt wurden, befassen.

(1) Das tatsächliche Auswahlverfahren wird hier vereinfacht ausgedrückt. Die Prognose-Engine wendet eine komplexe Kombination der Siegermodelle an. Aus Gründen der Verständlichkeit ist es jedoch einfacher das Auswahlverfahren so zu beschreiben, als würde ein einzelnes „Siegermodell“ ausgewählt werden.