Zeig mir das Geld: Reflexionen zur ISF 2024
“Um dein Spiel zu verbessern, musst du das Endspiel studieren, bevor du irgendetwas anderes tust; denn während das Endspiel für sich allein studiert und gemeistert werden kann, müssen das Mittelspiel und die Eröffnung im Zusammenhang mit dem Endspiel studiert werden.” Quelle: Capablanca’s Last Chess lectures (1966), S. 23
Vor einigen Wochen habe ich bei einer Podiumsdiskussion auf dem 44. Internationalen Symposium für Forecasting in Dijon, Frankreich, gesprochen. Das Thema der Diskussion war Demand Planning und die Rolle des Urteilsvermögens im Neuen Zeitalter von AI/ML.
Als Botschafter von Lokad kannst du dir vorstellen, wie meine Perspektive war:
-
Prognosen und Entscheidungsfindung sollten vollständig automatisiert werden;
-
Die Qualität von Prognosen sollte aus der Perspektive von besseren Entscheidungen bewertet werden;
-
Menschliches Urteilsvermögen sollte genutzt werden, um die Automatisierung zu verbessern (nicht Prognosen oder Entscheidungen anpassen).

Seltsamerweise rief meine Position zur Automatisierung nicht so viel Widerspruch hervor, wie man vielleicht denken könnte. Der Vorsitzende (Lokads Head of Communication, Conor Doherty) und die anderen Podiumsteilnehmer (Sven Crone von iqast und Nicolas Vandeput von SupChains) waren nahezu einstimmig der Meinung, dass dies die Zukunft des Forecastings ist. Der einzige Streitpunkt war, wie schnell wir diesen Zustand erreichen könnten (Anmerkung: Ich glaube, dass wir bereits dort sind).
Was jedoch für erheblichen Widerspruch und vielleicht sogar Verwirrung sorgte, war mein Argument, dass Prognosegenauigkeit nicht annähernd so wichtig ist wie bessere Entscheidungen treffen. Dieser Widerspruch betraf nicht nur die anderen Podiumsteilnehmer, sondern auch das Publikum. Ich denke, es gibt zwei Hauptgründe dafür:
-
Als ich auf der Bühne sprach, hatte ich keine visuelle Unterstützung, um diesen Punkt zu verdeutlichen. Es gibt einige bewegliche Teile in der Erklärung, sodass eine visuelle Darstellung den Zuhörern definitiv beim Verständnis geholfen hätte.
-
Die Annahme, dass Prognosegenauigkeit weniger wichtig ist als Entscheidungen, widerspricht der Ausbildung, Schulung und Erfahrung der meisten Fachleute.
Am Ende dieses Essays hoffe ich, beide oben genannten Punkte angesprochen zu haben. Bezüglich des ersten Punktes habe ich eine kurze, aber systematische Erklärung sowie eine intuitive Grafik eingefügt. Was den zweiten Punkt betrifft, kann ich den Leser nur bitten, in den nächsten 5 bis 10 Minuten einen offenen Geist zu bewahren und diese Worte so zu betrachten, als hätte man keinerlei vorherige Ausbildung im Bereich supply chain Forecasting.
Leitfragen
Meiner Meinung nach gibt es fünf grundlegende Fragen, die beantwortet werden müssen, um meine Position zu verdeutlichen. In diesem Abschnitt werde ich mein Bestes tun, um zu jeder eine relativ kurze Antwort zu geben – das Wesentliche, sozusagen. Seien Sie versichert, dass Lokad über eine Fülle zusätzlicher Ressourcen verfügt, um die technischen Details zu erläutern, auf die ich am Ende des Essays verweisen werde.
Q1: Was bedeutet es, dass eine Prognose „Mehrwert generiert“?
Ich beginne sofort mit einem Beispiel. Nehmen wir an, es gäbe einen Standardmechanismus für die Entscheidungsfindung in einem Unternehmen (z. B. automatisierte statistische Prognose + automatisierte Lagerbestandsrichtlinie).
Damit eine modifizierte Prognose Mehrwert generiert, muss sie eine Standardentscheidung (erstellt mit dem Standardprozess des Unternehmens) in einer Weise verändern, die die finanziellen Erträge des Unternehmens direkt und positiv beeinflusst (d. h. in Dollar, Pfund oder Euro Rendite).
Wenn eine Prognose genauer ist (hinsichtlich der Vorhersage der tatsächlichen Nachfrage), aber nicht zu einer veränderten und besseren Entscheidung führt, hat sie keinen Mehrwert generiert.
Viele Unternehmen verwenden noch Zeitreihen Prognosemodelle, während Lokad probabilistische Vorhersagen bevorzugt, um risikoangepasste Entscheidungen zu unterstützen. Allerdings gilt derselbe Standard für beide Prognoseparadigmen. Damit irgendein Prognosetyp Mehrwert generiert, muss er eine Standardentscheidung in einer Weise abändern, die die finanziellen Erträge eines Unternehmens direkt und positiv beeinflusst.
Beispielsweise könnte eine neue („veränderte“) Entscheidung einen zukünftigen Fehlbestand direkt ausschließen, der durch die Standardentscheidung entstanden wäre.
“Direkt” ist hier ausschlaggebend. Einfach ausgedrückt, fügt die Prognose nur dann Mehrwert hinzu, wenn man die genaue Entscheidungsänderung benennen kann, die zu den zusätzlichen finanziellen Erträgen geführt oder finanzielle Verluste im Vergleich zur Standardentscheidung verhindert hat.
Denke in Kausalzusammenhängen, nicht in Korrelationen.
Q2: Führt eine genauere Prognose immer zu Mehrwert?
Technisch gesehen, nein. Eine genauere Prognose an sich führt nicht zwangsläufig zu „Mehrwert“. Das liegt daran, dass – wie zuvor erwähnt – etwas (in diesem Fall eine Prognose) nur dann Mehrwert generiert, wenn es die finanziellen Erträge eines Unternehmens durch eine bessere Entscheidung direkt und positiv beeinflusst.
Im Gegensatz zu Prognosen unterliegen supply chain Entscheidungen Machbarkeitsbeschränkungen (z. B. Mindestbestellmengen, Losmultiplikatoren, Chargengrößen etc.) und finanziellen Anreizen (z. B. Mengenrabatte, Zahlungsbedingungen etc.). Es kann viel mehr Prognosen geben als umsetzbare Entscheidungen.
Das bedeutet, dass supply chain Entscheidungen gelegentlich (und sehr häufig) unempfindlich gegenüber Änderungen der Prognosegenauigkeit sein können. Dies gilt sowohl für Zeitreihen- als auch für probabilistische Prognosen.
Der Grund für diese Unempfindlichkeit liegt in den Beschränkungen der Entscheidungsfindung (z. B. Mindestbestellmengen). Es ist durchaus möglich, dass eine genauere Prognose (z. B. 10 % genauer) zur exakt gleichen Entscheidung führt wie eine weniger genaue. Das folgende Diagramm veranschaulicht diesen Punkt.

Im obigen Beispiel nehmen wir an, dass die Konsensprognose von 55 Einheiten genauer war als die automatisierte Prognose von 50 Einheiten. Aus finanzieller Sicht führte die höhere Genauigkeit nicht zu einer anderen Entscheidung (aufgrund der Mindestbestellmenge). Folglich generierte die genauere Prognose keinen Mehrwert.
Tatsächlich gibt es ein starkes Argument, dass die genauere Konsensprognose zu negativem Mehrwert geführt hat. Dies liegt daran, dass die zusätzlichen Überprüfungsschritte (laut einem standardisierten Forecast Value Added-Prozess) das Unternehmen Geld gekostet haben (zusätzliche Zeit und Aufwand), aber nicht zu einer besseren Entscheidung führten. Aus rein finanzieller Sicht waren diese manuellen Überprüfungsschritte ein Nettoverlust.
Betrachten wir auch einen Fall, in dem es keine Mindestbestellmengen-Beschränkung gibt.
Stellen Sie sich das gleiche Szenario vor, jedoch mit einem Losmultiplikator anstelle einer Mindestbestellmenge. Die umsetzbaren Entscheidungen erfolgen in Schritten von 50 Einheiten (z. B. 50 Einheiten in einer Box oder auf einer Palette). In diesem Fall müssten entweder 50 oder 100 Einheiten gekauft werden (1 oder 2 Boxen bzw. Paletten).

In der Realität könnte es weniger profitabel sein, 100 Einheiten zu kaufen (was der Konsensprognose von 55 Einheiten entspricht) als 50 Einheiten zu erwerben (etwas weniger als die „genauere“ Prognose vorschlägt). Man könnte versuchen, die verbleibende Nachfrage mit Rückständen zu decken oder einfach Verkäufe zu verlieren (z. B. beim Verkauf von verderblichen Waren wie frischen Lebensmitteln).
Aus wirtschaftlicher Sicht könnte die beste finanzielle Entscheidung darin bestehen, der „genaueren“ Prognose nicht zu folgen. In diesem Szenario führen sowohl die automatisierte Prognose (50 Einheiten Nachfrage) als auch die Konsensprognose (55 Einheiten Nachfrage) zur gleichen Entscheidung (50 Einheiten bestellen). Somit führte die „genauere“ Prognose nicht zu einem höheren finanziellen Mehrwert.
Zugegeben, nicht alle Situationen unterliegen den gleichen strengen Beschränkungen, jedoch ist die supply chain von derartigen Szenarien durchzogen. Natürlich räume ich ein, dass unterschiedliche Prognosen zu unterschiedlichen Entscheidungen führen können, aber die Frage des Mehrwerts bleibt offen. Es sollte stets geprüft werden, ob der erwartete zusätzliche Ertrag aus dem Kauf zusätzlicher Einheiten die zusätzlich aufgewendeten Ressourcen zur Verbesserung der Prognosegenauigkeit übersteigt.
Vielleicht lohnt sich die zusätzliche Genauigkeit in einigen Situationen. Allerdings scheinen Prognostiker und supply chain Praktiker reflexartig davon auszugehen, dass sie absolut von Vorteil ist, obwohl es offensichtliche Fälle gibt, in denen dies nicht der Fall ist.

Falls Sie an ein Szenario gedacht haben, das nicht exakt den hier beschriebenen Beispielen entspricht, ist das in Ordnung. Denken Sie daran, dass es heute darum geht, einen allgemeinen Punkt zu demonstrieren (nämlich, dass es Situationen gibt, in denen eine zusätzliche Prognosegenauigkeit nicht lohnenswert ist), und nicht darum, jede mögliche supply chain Entscheidungsfindungssituation im Detail zu analysieren.
Q3: Wie können wir sicherstellen, dass der erzielte Mehrwert die Kosten menschlicher Eingriffe rechtfertigt?
Ein zentrales Element der Podiumsdiskussion in Dijon war der (nicht vorhandene) Mehrwert von beurteilenden Eingriffen (oder „human overrides“) im Prognoseprozess. Um es sinngemäß auszudrücken: „Wir müssen Menschen im Prozess haben, die korrigieren, wenn die automatisierte Prognose etwas übersehen hat.“
Diese Perspektive erscheint mir sehr interessant, da sie impliziert, dass menschliche Eingriffe Mehrwert generieren – andernfalls, warum sollte das überhaupt jemand tun?
Für diesen Abschnitt werde ich die Diskussion darüber außer Acht lassen, ob Menschen (gelegentlich oder sogar häufig) eine automatisierte Prognose (hinsichtlich der Genauigkeit) übertreffen können. Tatsächlich bin ich bereit einzugestehen, dass ein Mensch bei einer einzelnen SKU in puncto Genauigkeit genauso gut oder vielleicht sogar besser abschneiden kann als eine automatisierte Prognose.
Hinweis: Ich glaube nicht, dass dies zutrifft, wenn man die Prognose von zehntausenden von SKUs für Hunderte von Geschäften betrachtet, jeden einzelnen Tag, wie es in einer umfangreichen supply chain der Fall ist1. Im letztgenannten Szenario übertrifft eine automatisierte Prognose ganze Teams von unglaublich erfahrenen Prognostikern und anderen Fachexperten erheblich, einfach weil der Großteil der SKUs aufgrund von Zeitmangel nicht manuell überprüft werden kann.
Ich räume diesen Einwand ein, dass menschliches Urteilsvermögen manchmal mit automatisierten Prognosen mithalten oder sie sogar übertreffen kann, aus zwei Gründen:
-
Meiner Meinung nach macht es den Essay interessanter, und;
-
Die Stärke meines Arguments beruht nicht auf einer Diskussion über „Genauigkeit“.
Meine Position ist, wie Sie sich jetzt wahrscheinlich denken können, dass menschliche Eingriffe nur dann „Mehrwert generieren“, wenn sie… finanziellen Mehrwert hinzufügen – Mehrwert, der länger anhält als ein einzelner reorder Zyklus. Dies ist völlig unabhängig von jeglichen Genauigkeitsvorteilen.
Dieser Mehrwert kann so verstanden werden, dass er „direkt bessere Entscheidungen hervorbringt, als ursprünglich getroffen wurden – wobei die zusätzlichen Gewinne aus der besseren Entscheidung berücksichtigt und die Kosten des Eingriffs abgezogen werden“.
Einfach ausgedrückt, sind beurteilende Eingriffe (human overrides) kostspielig, weshalb ein Unternehmen eine signifikante Kapitalrendite erwarten sollte. Daher ist es mein Argument, dass Prognosegenauigkeit ein beliebiges Maß ist (wenn sie isoliert von Entscheidungen bewertet wird) und sich Unternehmen auf Maßnahmen konzentrieren sollten, die die finanziellen Erträge steigern.
Menschliche Eingriffe mögen zwar die Prognosegenauigkeit erhöhen (noch einmal, diesen Einwand mache ich nur zur Diskussion), jedoch steigern sie nicht zwangsläufig den finanziellen Ertrag. Dies sollte wirklich keine radikale These sein, so wie jemand gleichzeitig die größte Person in einem Raum und die kleinste in einem anderen sein kann.
Bitte beachten Sie, dass es nicht an mir liegt, den Nachweis zu erbringen, dass eine erhöhte Genauigkeit nicht zu höheren Gewinnen führt. Es ist per Definition die Verantwortung derjenigen, die behaupten, dass erhöhte Genauigkeit an sich profitabel sei, einige konkrete, direkte und unwiderlegbare Beweise für diese Behauptung zu liefern.
Nebenbei bemerkt, sollte dies keine radikale oder konträre Position sein. Meiner Meinung nach sollte es die Standardposition eines jeden sein, der „mit am Geschehen beteiligt ist“.
Bedenken Sie, dass, um menschliche Eingriffe profitabel zu machen, die Gesamtheit der Eingriffe berücksichtigt werden muss. Das heißt, man muss den durch alle “Treffer” erzeugten finanziellen Wert abwägen und alle durch die “Fehlschläge” verursachten finanziellen Verluste abziehen.
Dieses Experiment müsste auch in großem Maßstab durchgeführt werden, und zwar für ein riesiges Netzwerk von Geschäften (im Falle von B2B für Unternehmenskunden) und über ihr gesamtes SKU-Katalog, jeden Tag, über einen beträchtlichen Zeitraum.
“Wie lange sollte dieses Experiment laufen, Alexey?” Dazu bin ich zwiegespalten. Sagen wir ein Jahr, aber ich bin für Diskussionen zu diesem Punkt sehr offen. Es hängt von vielen Faktoren ab, einschließlich der Anzahl der Entscheidungszyklen in einem Jahr sowie selbstverständlich von den Durchlaufzeiten.
Davon abgesehen wirft diese gesamte Diskussion die Frage auf, was die akzeptable Fehlerquote für menschliche Eingriffe ist.
- Wenn die Treffer die Fehlschläge leicht überwiegen, ist das akzeptabel?
- Was ist mit den Kosten der menschlichen Eingriffe selbst?
- Wie sollen wir diese direkten und indirekten Kosten in die Kalkulation einbeziehen?
Diese Fragen sind übrigens nicht trivial. Es sind die Arten von Fragen, die ein Erstsemester in einem Einführungskurs in einem MINT-Bereich (oder einem verwandten Bereich) stellen würde.
Bis jemand definitiven Beweis dafür erbringt, dass menschliche Eingriffe, in großem Maßstab eingesetzt, finanziell lohnenswert sind, ist die wirtschaftlich intelligenteste Position, davon auszugehen, dass dies nicht der Fall ist, und weiterhin auf automatisierte Prognosen und automatisierte Entscheidungsfindung zu setzen.
Q4: Wie bestimmen wir, wann eine genauere Prognose die aktuelle Prognose für Entscheidungszwecke ersetzen sollte?
Kurz gesagt, der einfachste Weg, dies zu erkennen, besteht darin, folgende Frage zu stellen: Führt die neue Prognose zu besseren Entscheidungen? Das Bewertungskriterium in diesem Fall sollte die finanzielle Kapitalrendite (ROI) sein.
Um etwas detaillierter vorzugehen, sollte der Austausch auf der Grundlage des gesamten vergleichenden Nutzens des neuen Modells erfolgen (z. B. ROI, Anwendbarkeit, Wartungsfreundlichkeit, etc.), und nicht nur auf der Basis des aktuellen Genauigkeitsgewinns. ROI ist das, was das Unternehmen in Richtung Erfolg lenkt. Anwendbarkeit, wie ich im Folgenden demonstrieren werde, ist mit Blick auf den ROI konzipiert. Denken Sie daran: Genauigkeit ist, wenn sie isoliert betrachtet wird, ein willkürlicher KPI.
Zum Beispiel, stellen Sie sich vor, wir hätten zwei Modelle: eines, das explizit mit der Historie von Lagerfehlbeständen umgehen kann und ein anderes, das Lagerfehlbestände ignoriert (mittels einiger Datenvorverarbeitungstricks). Es könnte der Fall sein, dass Lagerfehlbestände nicht allzu häufig auftraten und beide Modelle aus Entscheidungsperspektive nahezu gleich gut abschnitten. Dennoch wäre es klüger, das Modell zu bevorzugen, das mit Lagerfehlbeständen umgehen kann. Das liegt daran, dass, wenn Lagerfehlbestände häufiger auftreten, dieses Modell zuverlässiger sein wird.
Dies demonstriert einen weiteren Aspekt der Philosophie von Lokad: Korrektheit durch Design. Das bedeutet, dass wir auf Design-Ebene ein Modell entwickeln wollen, das proaktiv sowohl wahrscheinliche als auch unwahrscheinliche Ereignisse berücksichtigt – und in der Lage ist, darauf zu reagieren. Dies ist von größter Bedeutung, da die größten finanziellen Strafen oft an den Extremfällen liegen – also an den unwahrscheinlichen Ereignissen.
Q5: Wie wechseln wir in der Produktion von einem Vorhersagemodell zu einem anderen?
Es ist wichtig, sich daran zu erinnern, dass Prognosen nur ein Teil des gesamten Entscheidungsmotors sind. Daher kann die Aktualisierung einiger Teile nur geringe oder erhebliche Auswirkungen auf die Gesamtleistung des Motors haben. Der Übergang von einem alten zu einem neuen Modell kann problematisch sein, selbst wenn das neue Modell letztlich bessere Entscheidungen hervorbringt (und somit mehr Profit generiert).
Das liegt daran, dass die theoretisch verbesserten Entscheidungen in der Realität auf bisher unbekannte Einschränkungen stoßen können, wenn sie zu schnell implementiert werden.
Zum Beispiel könnte ein neues Vorhersagemodell dabei helfen, deutlich verbesserte Bestellaufträge zu generieren, jedoch existiert möglicherweise noch nicht der erforderliche Platz, um den zusätzlichen Lagerbestand zu lagern, oder die Lieferanten können ihre supply chain nicht sofort an die gestiegene Nachfrage anpassen. Ein übereilter Abschluss der Bestellaufträge in der Hoffnung auf sofortige Gewinne kann andernorts zu Verlusten führen, etwa wenn der Lagerbestand beschädigt wird oder schneller verdirbt, weil es an adäquatem Lagerplatz (oder an Kapazitätsgrenzen der Arbeitskräfte) fehlt.
In einem solchen Szenario könnte es ratsam sein, den Übergang zwischen den Modellen schrittweise zu vollziehen. In der Praxis könnte dies bedeuten, einige etwas größere aufeinanderfolgende Bestellaufträge zu vergeben, um die Lagerbestände allmählich zu korrigieren, anstatt sofort einen einzigen gewaltigen Auftrag auszulösen.
Personen mit praktischer Erfahrung im Umgang mit dem Peitscheneffekt in supply chains (einschließlich Befürworter von DDMRP) sollten sofort erkennen, warum dies eine kluge Taktik ist.
Abschließender Gedanke
Wenn Sie so weit gelesen haben, schätze ich Ihre Aufmerksamkeit. Falls Sie unterwegs widersprochen haben, weiß ich Ihre Aufmerksamkeit umso mehr zu schätzen.
Für diejenigen, die anderer Meinung sind, gestatten Sie mir einen letzten Seitensprung: Wert bedeutet mehr Geld, und mehr Geld resultiert aus besseren Entscheidungen. Soweit es mich betrifft, kann nichts gute (oder bessere) Entscheidungen ersetzen. Nicht eine genauere Prognose. Nicht ein effizienterer S&OP Prozess.
Wenn wir immer noch unterschiedlicher Meinung sind, in Ordnung, aber zumindest wissen wir, wo wir beide stehen.
Danke fürs Lesen.
Bevor Sie gehen
Hier sind noch ein paar weitere Ressourcen, die Sie nützlich finden könnten (besonders, wenn Sie mir widersprochen haben):
-
Bezüglich der Art und Weise, wie Lokad tatsächlich alle Unsicherheitsquellen prognostiziert (z. B. Nachfrage, Lieferzeiten, Rücklaufquoten, etc.), siehe unsere Video-Vorlesungen zu wahrscheinlichkeitsvorhersagen und Lieferzeitprognosen.
-
Bezüglich der Art und Weise, wie Lokad tatsächlich risikoadjustierte Entscheidungen trifft, konsultieren Sie unser Lehrtutorial zur Einkaufsoptimierung und die Video-Vorlesung zur Einzelhandels-Bestandsallokation.
-
Bezüglich der Art und Weise, wie Lokad die Nachfrage steuert und Preisstrategien optimiert, sehen Sie sich unsere Video-Vorlesung zur Preisoptimierung an.
Anmerkungen
-
Die größten supply chains umfassen noch größere Zahlen – zehntausende Geschäfte in über hundert Ländern mit mehreren hundert Distributionszentren. Die Kataloge solcher Giganten enthalten oft Hunderttausende (wenn nicht Millionen) unterschiedlicher Produkte. ↩︎