Zeig mir das Geld: Reflexionen zur ISF 2024
“Um dein Spiel zu verbessern, musst du zuerst das Endspiel studieren; denn während die Endspiele für sich genommen studiert und gemeistert werden können, müssen Mittelspiel und Eröffnung in Beziehung zum Endspiel betrachtet werden.” Quelle: Capablanças letzte Schachvorlesungen (1966), S. 23
Vor einigen Wochen habe ich an einem Panel beim 44. International Symposium on Forecasting in Dijon, Frankreich, teilgenommen. Das Thema des Panels war Bedarfsplanung und die Rolle des Urteilsvermögens in der neuen Welt von AI/ML.
Als Botschafter von Lokad kannst du dir vorstellen, welche Perspektive ich hatte:
-
Prognosen und Entscheidungsfindung sollten vollständig automatisiert werden;
-
Die Qualität der Prognose sollte aus der Perspektive besserer Entscheidungen bewertet werden;
-
Menschliches Urteilsvermögen sollte genutzt werden, um die Automatisierung zu verbessern (nicht Prognosen oder Entscheidungen anzupassen).
Merkwürdigerweise rief meine Position zur Automatisierung nicht so viel Widerspruch hervor, wie man vielleicht erwarten könnte. Der Vorsitzende (Lokads Leiter der Kommunikation, Conor Doherty) und die anderen Panelteilnehmer (Sven Crone von iqast und Nicolas Vandeput von SupChains) stimmten fast einstimmig darin überein, dass dies die Zukunft der Prognose sei. Der einzige Streitpunkt war wie schnell wir diesen Zustand erreichen könnten (Hinweis: Ich glaube, wir sind bereits dort).
Was jedoch genügend Unstimmigkeiten – und vielleicht sogar Verwirrung – hervorrief, war mein Argument, dass Prognosegenauigkeit keineswegs so wichtig ist wie bessere Entscheidungen zu treffen. Dieser Widerspruch betraf nicht nur die anderen Panelteilnehmer, sondern auch die Zuhörerschaft. Ich denke, es gibt zwei Hauptgründe dafür:
-
Als ich auf der Bühne sprach, hatte ich kein visuelles Hilfsmittel, um diesen Punkt zu untermauern. Es gibt einige bewegliche Elemente in der Erklärung, sodass ein Bild den Zuhörern definitiv beim Verständnis geholfen hätte.
-
Die Vorstellung, dass Prognosegenauigkeit weniger wichtig als Entscheidungen ist, widerspricht der Ausbildung, Schulung und Erfahrung der meisten Fachleute.
Bis zum Ende dieses Essays hoffe ich, beide oben genannten Punkte behandelt zu haben. Zum ersten Punkt habe ich eine kurze, aber systematische Erklärung und ein intuitives Bild eingefügt. Zum zweiten Punkt kann ich den Leser nur bitten, in den nächsten 5 bis 10 Minuten einen offenen Geist zu bewahren und diese Worte so zu betrachten, als hätte er keinerlei Vorkenntnisse in der supply chain-Prognose.
Leitfragen
Meiner Meinung nach gibt es fünf grundlegende Fragen, die beantwortet werden müssen, um meine Position zu verdeutlichen. In diesem Abschnitt werde ich mein Bestes tun, um zu jeder eine (eher) kurze Antwort zu geben – das „Fleisch und die Kartoffeln“, sozusagen. Seid versichert, dass Lokad eine Fülle zusätzlicher Ressourcen bereithält, um die technischen Details zu erklären, auf die ich am Ende des Essays verlinken werde.
Q1: Was bedeutet es, dass eine Prognose „Mehrwert schafft“?
Ich beginne sofort mit einem Beispiel. Nehmen wir an, es gibt einen Standardmechanismus, um Entscheidungen in einem Unternehmen zu treffen (z. B. automatisierte statistische Prognose + automatisierte Inventarpolitik).
Damit eine modifizierte Prognose Mehrwert schafft, muss sie eine Standardentscheidung (erstellt mithilfe des Standardprozesses des Unternehmens) so verändern, dass die finanziellen Erträge des Unternehmens direkt und positiv beeinflusst werden (d. h. in Dollar, Pfund oder Euro an Erträgen).
Wenn eine Prognose zwar genauer ist (hinsichtlich der tatsächlichen Nachfrage), aber nicht zu einer anderen und besseren Entscheidung führt, hat sie keinen Mehrwert geschaffen.
Viele Unternehmen verwenden immer noch Zeitreihen Prognosemodelle, während Lokad probabilistische Vorhersagen bevorzugt, um risikoadjustierte Entscheidungen zu treffen. Dabei gilt für beide Prognoseparadigmen der gleiche Standard: Damit jede Art von Prognose Mehrwert schafft, muss sie eine Standardentscheidung so verändern, dass die finanziellen Erträge eines Unternehmens direkt und positiv beeinflusst werden.
Zum Beispiel könnte eine neue („veränderte“) Entscheidung direkt einen zukünftigen Fehlbestand beseitigen, den die Standardentscheidung zur Folge gehabt hätte.
„Direkt“ ist hier von entscheidender Bedeutung. Vereinfacht gesagt schafft die Prognose nur dann Mehrwert, wenn man auf die genaue Entscheidungsänderung hinweisen kann, die zu zusätzlichen finanziellen Erträgen geführt oder finanzielle Verluste verhindert hat (im Vergleich zur Standardentscheidung).
Denke in Kausalitäten, nicht in Korrelationen.
Q2: Führt eine genauere Prognose immer zu Mehrwert?
Technisch gesehen nein. Eine genauere Prognose schafft allein an sich nicht notwendigerweise „Mehrwert“. Das liegt daran, dass – wie bereits erwähnt – etwas (in diesem Fall eine Prognose) erst dann Mehrwert schafft, wenn es die finanziellen Erträge eines Unternehmens durch eine bessere Entscheidung direkt und positiv beeinflusst.
Im Gegensatz zu Prognosen unterliegen supply chain-Entscheidungen Durchführbarkeitsbeschränkungen (z. B. Mindestbestellmengen, Losmultiplikatoren, Chargengrößen etc.) und finanziellen Anreizen (z. B. Mengenrabatten, Zahlungsbedingungen etc.). Es kann deutlich mehr Prognosen geben als durchführbare Entscheidungen.
Das bedeutet, dass supply chain-Entscheidungen gelegentlich (und sehr oft) unempfindlich gegenüber Änderungen in der Prognosegenauigkeit sein können. Dies gilt sowohl für Zeitreihen- als auch für probabilistische Vorhersagen.
Der Grund für diese Unempfindlichkeit liegt in den Beschränkungen der Entscheidungsfindung (z. B. MOQs). Es ist durchaus möglich, dass eine genauere Prognose (z. B. um 10 % genauer) zur exakt gleichen Entscheidung führt wie eine weniger genaue. Das untenstehende Diagramm veranschaulicht diesen Punkt.
Im obigen Beispiel nehmen wir an, dass die Konsensusprognose von 55 Einheiten genauer war als die automatisierte Prognose von 50 Einheiten. Aus finanzieller Sicht führte die erhöhte Genauigkeit nicht zu einer anderen Entscheidung (aufgrund der Mindestbestellmenge). Somit schuf die genauere Prognose keinen Mehrwert.
Tatsächlich gibt es ein starkes Argument dafür, dass die genauere Konsensusprognose zu negativem Mehrwert geführt hat. Denn die zusätzlichen Überprüfungsschritte (gemäß einem standardisierten Forecast Value Added-Prozess) verursachen Kosten (zusätzliche Zeit und Mühe) für das Unternehmen, ohne zu einer besseren Entscheidung zu führen. Aus rein finanzieller Sicht waren diese manuellen Überprüfungsschritte nettonegativ.
Betrachten wir auch einen Fall, in dem keine Mindestbestellmengen-Beschränkung besteht.
Stellen Sie sich das gleiche Szenario vor, jedoch mit einem Losmultiplikator anstelle einer Mindestbestellmenge. Die durchführbaren Entscheidungen erfolgen in Schritten von 50 Einheiten (z. B. 50 Einheiten in einer Schachtel oder auf einer Palette). In dieser Situation müssten wir entweder 50 oder 100 Einheiten kaufen (1 oder 2 Schachteln/Paletten).
In Wirklichkeit könnte es weniger profitabel sein, 100 Einheiten zu kaufen (um den Vorschlag der Konsensusprognose von 55 Einheiten abzudecken), als 50 Einheiten zu bestellen (was etwas weniger ist als die „genauere“ Prognose vorschlägt). Man könnte versuchen, die verbleibende Nachfrage mit Auftragsrückständen zu decken oder einfach Verkäufe zu verlieren (z. B. beim Verkauf von leicht verderblichen Waren wie frischen Lebensmitteln).
Aus ökonomischer Perspektive könnte die beste finanzielle Entscheidung darin bestehen, der „genaueren“ Prognose nicht zu folgen. In diesem Szenario führen sowohl die automatisierte (50 Einheiten Nachfrage) als auch die Konsensusprognose (55 Einheiten Nachfrage) zur gleichen Entscheidung (Bestellung von 50 Einheiten). Somit führte die „genauere“ Prognose nicht zu einem erhöhten finanziellen Mehrwert.
Zugegeben, nicht alle Situationen unterliegen den gleichen strengen Beschränkungen, jedoch ist die supply chain voller solcher Szenarien. Natürlich räume ich ein, dass unterschiedliche Prognosen zu verschiedenen Entscheidungen führen können, aber die Frage des Mehrwerts bleibt offen. Stets sollten wir bedenken, ob der erwartete zusätzliche Ertrag durch den Kauf zusätzlicher Einheiten größer ist als der Mehraufwand, der zur Verbesserung der Prognosegenauigkeit erforderlich ist.
Vielleicht lohnt sich die zusätzliche Genauigkeit in einigen Situationen. Dennoch scheint es, als würden Prognostiker und supply chain-Praktiker reflexartig davon ausgehen, dass dies absolut der Fall ist, obwohl es offensichtliche Szenarien gibt, in denen dies nicht zutrifft.
Falls Ihnen ein Szenario eingefallen ist, das nicht perfekt zu den hier beschriebenen Beispielen passt, ist das in Ordnung. Denken Sie daran, dass es heute darum geht, einen allgemeinen Punkt zu demonstrieren (nämlich, dass es Situationen gibt, in denen zusätzliche Prognosegenauigkeit nicht erstrebenswert ist) – und nicht darum, jedes mögliche supply chain-Entscheidungsszenario im Detail zu analysieren.
Q3: Wie können wir sicherstellen, dass der erzielte Mehrwert die Kosten menschlicher Eingriffe rechtfertigt?
Ein zentrales Element der Podiumsdiskussion in Dijon war der (nicht) vorhandene Mehrwert menschlicher Eingriffe (oder „Human Overrides“) im Prognoseprozess. Um es mit den Worten der Gegenseite zu sagen: „Wir müssen Menschen im Prozess haben, um zu korrigieren, wenn die automatisierte Prognose etwas verfehlt hat.“
Dies ist für mich eine sehr interessante Perspektive, da sie davon ausgeht, dass menschliche Overrides Mehrwert schaffen – andernfalls, warum sollte das überhaupt jemand tun?
In diesem Abschnitt lasse ich die Diskussion außen vor, ob Menschen eine automatisierte Prognose (hinsichtlich der Genauigkeit) gelegentlich oder sogar häufig übertreffen können. Tatsächlich bin ich bereit anzuerkennen, dass ein Mensch bei einer einzelnen SKU genauso gut oder vielleicht sogar besser als eine automatisierte Prognose agieren kann.
Hinweis: Ich glaube nicht, dass dies zutrifft, wenn man Prognosen für Zehntausende von SKUs für Hunderte von Filialen an jedem einzelnen Tag in einer großen supply chain berücksichtigt1. In diesem Szenario übertrifft eine automatisierte Prognose ganze Teams unglaublich erfahrener Prognostiker und anderer Fachexperten deutlich, einfach weil die überwiegende Mehrheit der SKUs aufgrund von Zeitmangel nicht manuell geprüft werden kann.
Ich räume ein, dass menschliches Urteilsvermögen manchmal der automatisierten Prognose gleichkommen oder diese sogar übertreffen kann – und zwar aus zwei Gründen:
-
Meiner Meinung nach macht es den Essay interessanter, und;
-
Die Stärke meines Arguments beruht nicht auf einer Diskussion über „Genauigkeit“.
Meine Position ist, wie Sie wahrscheinlich schon vermuten können, dass menschliche Eingriffe nur dann „Mehrwert schaffen“, wenn sie…finanziellen Mehrwert hinzufügen – ein Mehrwert, der länger anhält als ein einzelner reorder Zyklus. Dies ist völlig unabhängig von jeglichen Genauigkeitsvorteilen.
Dieser Mehrwert kann dahingehend verstanden werden, dass er „direkt bessere Entscheidungen hervorbringt, als ursprünglich getroffen wurden – wobei die zusätzlichen Gewinne aus der besseren Entscheidung berücksichtigt und die Kosten des Eingriffs abgezogen werden“.
Einfach ausgedrückt sind judikative Eingriffe (menschliche Overrides) kostspielig, weshalb ein Unternehmen einen signifikanten Return on Investment erwarten sollte. Daher ist mein Argument, dass Prognosegenauigkeit ein willkürliches Maß (bei isolierter Betrachtung ohne Entscheidungen) darstellt und Unternehmen sich auf Maßnahmen konzentrieren sollten, die die finanziellen Erträge steigern.
Ein menschlicher Override mag zwar die Prognosegenauigkeit erhöhen (nochmals, ich räume dies der Diskussion halber ein), führt jedoch nicht zwangsläufig zu einem höheren finanziellen Ertrag. Dies sollte wirklich kein radikaler Vorschlag sein – so wie jemand in einem Raum der Größte und in einem anderen der Kleinste sein kann.
Bitte beachten Sie, dass es nicht meine Aufgabe ist, den Beweis zu erbringen, dass eine erhöhte Genauigkeit nicht zu höheren Gewinnen führt. Definitionsgemäß sind es diejenigen, die behaupten, dass erhöhte Genauigkeit allein an sich profitabel sei, die konkrete, direkte und unwiderlegbare Beweise für diese Behauptung vorlegen müssen.
Nochmals – dies sollte keine radikale oder konträre Position darstellen. Meiner Meinung nach sollte es die Standardhaltung eines jeden sein, der „skin in the game“ hat.
Bedenken Sie, dass für menschliche Overrides, um profitabel zu sein, die Gesamtheit aller Eingriffe in Betracht gezogen werden muss. Das heißt, man muss den finanziellen Mehrwert aller „Treffer“ abwägen und alle finanziellen Verluste, die durch die „Fehlgriffe“ entstehen, subtrahieren.
Dieses Experiment müsste zudem im großen Maßstab durchgeführt werden – für ein riesiges Filialnetz (bei B2B für Unternehmenskunden) und über den gesamten SKU-Katalog hinweg, jeden Tag, über einen beträchtlichen Zeitraum.
“Wie lange sollte dieses Experiment laufen, Alexey?” Dazu bin ich ambivalent. Sagen wir ein Jahr, aber ich bin sehr offen für Diskussionen zu diesem Punkt. Es hängt von vielen Faktoren ab, unter anderem von der Anzahl der Entscheidungszyklen in einem Jahr sowie natürlich von den Durchlaufzeiten.
Das alles wirft jedoch die Frage auf, wie hoch der akzeptable Fehlerschwellenwert für menschliche Overrides ist.
- Wenn die Treffer die Fehlgriffe nur leicht überwiegen, ist das akzeptabel?
- Wie steht es um die Kosten der menschlichen Overrides selbst?
- Wie sollen wir diese direkten und indirekten Kosten in die Kalkulation einbeziehen?
Übrigens sind dies keine trivialen Fragen. Es sind die Art von Fragen, die ein Erstsemesterstudent in jedem Einführungskurs in einem MINT-Fach (oder einem verwandten Fachgebiet) stellen würde.
Bis jemand endgültigen Beweis dafür liefert, dass menschliche Overrides, wenn sie im großen Maßstab eingesetzt werden, finanziell lohnenswert sind, ist die ökonomisch intelligenteste Haltung, davon auszugehen, dass dies nicht der Fall ist – und weiterhin auf automatisierte Prognosen und automatisierte Entscheidungsfindung zu setzen.
Q4: Wie bestimmen wir, wann eine genauere Prognose die aktuelle Prognose für Entscheidungsfindungszwecke ersetzen sollte?
Kurz gesagt, der einfachste Weg, dies festzustellen, besteht darin, die folgende Frage zu stellen: Führt die neue Prognose zu besseren Entscheidungen? Die Bewertungsmetrik in diesem Fall sollte der finanzielle Return on Investment (ROI) sein.
Um etwas granulärer zu werden, sollte der Ersatz basierend auf dem gesamten vergleichenden Nutzen (z. B. ROI, Anwendbarkeit, Wartungsfreundlichkeit, etc.) des neuen Modells vorgenommen werden – und nicht nur basierend auf dem aktuellen Genauigkeitsgewinn. ROI ist das, was das Unternehmen in Richtung Erfolg lenkt. Anwendbarkeit, wie ich im Folgenden demonstrieren werde, ist mit Blick auf den ROI konzipiert. Bedenke: Genauigkeit ist, wenn sie isoliert betrachtet wird, ein willkürlicher KPI.
Zum Beispiel, stellen Sie sich vor, wir hätten zwei Modelle: eines, das explizit mit Fehlbestandsgeschichte umgehen kann und ein anderes, das Fehlbestände ignoriert (mithilfe einiger Datenvorverarbeitungs-Tricks). Es könnte sein, dass Fehlbestände nicht allzu oft aufgetreten sind und beide Modelle aus der Perspektive der Entscheidungsfindung nahezu gleich gut abschneiden. Dennoch wäre es klüger, das Modell zu bevorzugen, das mit Fehlbeständen umgehen kann. Denn falls Fehlbestände häufiger auftreten, wird dieses Modell zuverlässiger sein.
Dies demonstriert einen weiteren Aspekt von Lokads Philosophie: Korrektheit by Design. Das bedeutet, dass wir auf der Design-Ebene ein Modell entwickeln wollen, das proaktiv sowohl wahrscheinliche als auch unwahrscheinliche Ereignisse berücksichtigt – und in der Lage ist, darauf zu reagieren. Dies ist von größter Bedeutung, denn die größten finanziellen Strafen liegen oft an den Extremen – also an den unwahrscheinlichen Ereignissen.
Q5: Wie wechseln wir in der Produktion von einem Vorhersagemodell zu einem anderen?
Es ist wichtig, daran zu erinnern, dass Vorhersagen nur ein Teil des gesamten Entscheidungsprozesses sind. Dementsprechend kann das Aktualisieren einzelner Komponenten kleinere oder größere Auswirkungen auf die Gesamtleistung des Systems haben. Der Übergang von einem alten zu einem neuen Modell könnte problematisch sein, selbst wenn das neue Modell letztendlich bessere Entscheidungen hervorbringt (und somit zu mehr Gewinnen führt).
Denn theoretisch verbesserte Entscheidungen könnten in der Realität auf bisher unbekannte Einschränkungen stoßen, wenn sie zu schnell umgesetzt werden.
Zum Beispiel könnte ein neues Vorhersagemodell dazu beitragen, deutlich verbesserte POs zu generieren, aber der Platz, der zur Lagerung des zusätzlichen Inventars erforderlich ist, existiert möglicherweise noch nicht oder die Lieferanten können ihre supply chain nicht sofort an die gestiegene Nachfrage anpassen. Eine übereilte Umsetzung der POs, getrieben von der Suche nach sofortigen Gewinnen, könnte an anderer Stelle zu Verlusten führen, etwa indem das Inventar beschädigt wird oder schneller verdirbt aufgrund mangelnder Lagerkapazitäten (oder Begrenzungen der Arbeitskraft).
In einem solchen Szenario könnte es ratsam sein, schrittweise zwischen den Modellen zu wechseln. In der Praxis könnte dies bedeuten, ein paar etwas größere aufeinanderfolgende POs zu platzieren, um die Bestände allmählich zu korrigieren, anstatt sofort einen einzigen enormen Auftrag zu erteilen.
Personen mit praktischer Erfahrung im Umgang mit dem Peitscheneffekt in supply chains (einschließlich DDMRP Befürwortern) sollten sofort einsehen, warum dies eine kluge Taktik ist.
Abschließender Gedanke
Wenn Sie so weit gelesen haben, schätze ich Ihre Aufmerksamkeit. Falls Sie zwischendurch nicht zugestimmt haben, weiß ich Ihre Aufmerksamkeit umso mehr zu schätzen.
Für diejenigen, die nicht zustimmen, erlauben Sie mir einen letzten Versuch: Wert bedeutet mehr Geld, und mehr Geld resultiert aus besseren Entscheidungen. Meiner Ansicht nach kann nichts gute (oder bessere) Entscheidungen ersetzen. Nicht eine genauere Vorhersage. Nicht ein effizienterer S&OP Prozess.
Falls wir immer noch uneinig sind, ist das in Ordnung, aber zumindest wissen wir, wo wir stehen.
Danke fürs Lesen.
Bevor Sie gehen
Hier sind noch einige weitere Ressourcen, die Sie nützlich finden könnten (insbesondere, wenn Sie nicht mit mir übereingestimmt haben):
-
Bezüglich der Art und Weise, wie Lokad tatsächlich alle Unsicherheitsquellen prognostiziert (z. B. Nachfrage, Lieferzeiten, Rücklaufquoten, etc.), sehen Sie sich unsere Video-Vorlesungen zu wahrscheinlichkeitsvorhersagen und lieferzeit-prognose an.
-
Bezüglich der Art und Weise, wie Lokad tatsächlich risikoadjustierte Entscheidungen trifft, konsultieren Sie unser lehrreiches Tutorial zu purchasing optimization und die Video-Vorlesung zu retail stock allocation.
-
Bezüglich der Art und Weise, wie Lokad die Nachfrage gestaltet und Preisstrategien optimiert, sehen Sie sich unsere Video-Vorlesung zu pricing optimization an.
Anmerkungen
-
Die größten supply chains beinhalten noch größere Zahlen – Zehntausende von Geschäften in über hundert Ländern mit mehreren hundert Vertriebszentren. Die Kataloge solcher Giganten enthalten oft Hunderttausende (wenn nicht Millionen) verschiedener Produkte. ↩︎