00:00:07 Einführung in das Thema maschinelles Lernen in der Supply Chain-Branche.
00:00:46 Einführung des Gastes Alexander Backus, der der Leiter für Daten und Analytik bei IKEA ist.
00:02:20 Erklärung des Konzepts der selbsterfüllenden Prophezeiung.
00:03:03 Diskussion darüber, wie eine selbsterfüllende Prophezeiung die Supply Chain beeinflusst, wie z.B. Geschäftsziele und der Einfluss von Nachfrage und Angebot.
00:07:14 Erklärung, wie Feedback-Loops in der Supply Chain die Welt komplexer machen und wie ein Überschuss eines bestimmten Produkts den Verkauf beeinflussen kann.
00:08:53 Diskussion über Feedback-Loops in Supply Chains und den Einfluss menschlichen Verhaltens auf sie.
00:10:41 Verwendung von Verkaufsdaten bei der Nachfrageprognose und potenzielle Folgen bei Verwendung eines naiven Ansatzes.
00:13:08 Null-Prognoseproblem in maschinellen Lernsystemen und der Peitscheneffekt.
00:15:17 Erklärung der Bestandsverknappungstendenz und Techniken, um damit umzugehen.
00:17:22 Diskussion über die Häufigkeit von Bestandsverknappungen und die Wirksamkeit der Methode zur Bewältigung der Bestandsverknappungstendenz.
00:18:15 Erklärung, wie die Wahrnehmung des Kunden eines Produkts die Nachfrage beeinflussen kann und wie sich der Lagerbestand auf den Verkauf auswirkt.
00:20:17 Erklärung von Verlustmaskierung und ihrem Zweck.
00:20:26 Erklärung, wie das Modell durch den Zugriff auf Lagerbestände verstehen kann, wie sich Schwankungen des Lagerbestands auf den Verkauf auswirken.
00:22:14 Diskussion über die Grenzen der Verwendung eines maschinellen Lernmodells für kausale Inferenz und die Auswirkungen von Störfaktoren.
00:25:54 Erklärung, wie probabilistische Prognosen dazu beitragen können, den Einfluss von Null-Prognosen zu reduzieren, indem sie die “Unschärfe” der verfügbaren Informationen berücksichtigen.
00:27:04 Erklärung der Vorteile der Verwendung eines probabilistischen Prognosemodells.
00:28:44 Vorteile der Verwendung eines probabilistischen Prognosemodells gegenüber einer Punktprognose.
00:30:42 Feedback-Loops und wie sie die Prognose beeinflussen.
00:34:35 Wie Preise die Prognose beeinflussen können.
00:36:32 Erklärung von teilweiser Beobachtbarkeit und ihrer Herausforderung bei der Erstellung eines Modells für das Supply Chain Management.
00:37:04 Vergleich mit dem Konzept des Bandit-Feedbacks und seiner bekannten Anwendung in E-Commerce-Empfehlungssystemen.
00:37:17 Diskussion über die Grenzen des überwachten Lernens bei der Vorhersage der Auswirkungen von Entscheidungen im Supply Chain Management.
00:38:01 Erklärung des auf Richtlinien basierenden Verstärkungslernalgorithmus.
00:41:06 Diskussion über die Herausforderungen bei der Anwendung des Verstärkungslernalgorithmus auf das Supply Chain Management in der realen Welt und die Lösung, mit dem Offline-Lernen aus historischen Daten zu beginnen.
00:44:55 Diskussion darüber, wie Gewohnheiten und vergangene Praktiken Preisbewegungen in einem Unternehmen beeinflussen.
00:46:41 Erklärung von Ausbeutung und Exploration im Verstärkungslernen.
00:50:57 Die Notwendigkeit, Feedback-Loops in der Prognose als Paradigmenwechsel anzuerkennen.
00:52:45 Die technischen und kulturellen Herausforderungen bei der Integration von KI in Geschäftsprozesse.
00:53:57 Diskussion der Herausforderungen bei der Modellierung und Entscheidungsfindung in der Supply Chain-Branche.
00:54:55 Anerkennung der Existenz von Feedback-Loops im Supply Chain-Prozess.
00:55:06 Übergang zu einem entscheidungsbasierten Ansatz anstelle eines prognosebasierten Ansatzes.
00:57:27 Der Trend in der Supply Chain-Branche, insbesondere bei großen E-Commerce-Unternehmen.
01:01:03 Welche Qualitäten werden gesucht, wenn neue Mitarbeiter für die Bearbeitung von Supply Chain-Herausforderungen bei IKEA eingestellt werden?

Zusammenfassung

In einem von Nicole Zint moderierten Interview diskutieren Joannes Vermorel, Gründer von Lokad, und Alexander Backus, Leiter Data and Analytics bei IKEA, die Anwendung von Machine Learning und KI in der Supply Chain-Branche. Das Interview hebt die Auswirkungen von sich selbst erfüllenden Prophezeiungen und Feedback-Loops auf das Supply Chain Management hervor und betont die Herausforderungen bei der Nutzung von Machine Learning-Modellen bei der Prognose. Das Interview untersucht auch Ansätze zur Vermeidung des Null-Prognose-Problems, wie z.B. die Verwendung von probabilistischer Prognose, und die Bedeutung der Anerkennung von Unsicherheit bei der Supply Chain-Prognose. Die Panelteilnehmer betonen die Notwendigkeit, Unsicherheit anzunehmen, sich einem entscheidungsbasierten Modell zuzuwenden und Änderungen schrittweise in die Verbesserung des Supply Chain-Managements einzubeziehen.

Erweiterte Zusammenfassung

In diesem Interview moderiert Nicole Zint eine Diskussion zwischen Joannes Vermorel, Gründer von Lokad, und Alexander Backus, Leiter Data and Analytics bei IKEA, über die Anwendung von Machine Learning und KI in der Supply Chain-Branche. Sie diskutieren das Konzept der sich selbst erfüllenden Prophezeiung und ihre potenzielle Auswirkung auf Supply Chains, die Rolle von Feedback-Loops und die Herausforderungen bei der Nutzung von Machine Learning-Modellen bei der Prognose.

Eine sich selbst erfüllende Prophezeiung ist eine Vorhersage, die direkt oder indirekt dazu führt, dass sie selbst wahr wird, aufgrund des Feedbacks zwischen Glauben und Verhalten. Im Supply Chain Management können Prognosen Auswirkungen auf Entscheidungsprozesse haben und letztendlich die Zukunft verändern. Vermorel weist darauf hin, dass sich selbst erfüllende Prophezeiungen an sich weder gut noch schlecht sind; sie machen die Situation einfach komplexer.

Feedback-Loops sind in Supply Chains weit verbreitet, da Menschen auf Prognosen reagieren, die wiederum zukünftige Vorhersagen beeinflussen können. Vermorel hebt hervor, wie sich diese Schleifen auf verschiedene Arten manifestieren können, z.B. durch Anpassung von Preisen oder Produktplatzierungen basierend auf Bestandsniveaus. Er merkt auch an, dass Wettbewerber ihre Strategien in Reaktion auf die Prognosen eines Unternehmens ändern können, was zusätzliche Feedback-Loops schafft.

Backus erklärt, dass Verkaufsdaten eine wichtige Eingabe für Machine Learning-Modelle bei der Prognose sind, aber Verkäufe nicht dasselbe sind wie Nachfrage. Verkaufsdaten können durch Angebot und andere Faktoren beeinflusst werden, während die Nachfrage eine nicht beobachtete Größe ist, die abgeleitet werden muss. Er betont die Bedeutung der Unterscheidung zwischen den beiden und ihrer Wechselwirkung im Prognoseprozess.

Machine-Learning-Modelle können bei der Prognose von Supply Chains problematisch sein, wenn sie nicht darauf ausgelegt sind, Feedback-Loops und sich selbst erfüllende Prophezeiungen zu berücksichtigen. Backus erwähnt den “Peitscheneffekt”, bei dem kleine Abweichungen in der Supply Chain vom System verstärkt werden können. Dies kann zu schädlichen Auswirkungen führen, wie zum Beispiel zu steigenden Verkäufen oder ungenauen Vorhersagen. Er stellt den Unterschied zwischen der Vorhersage des Wetters, das nicht vom menschlichen Verhalten beeinflusst wird, und der Vorhersage von Geschäftsergebnissen, die diesen komplexen Feedback-Loops unterliegen, heraus.

Um den Herausforderungen durch Feedback-Loops und sich selbst erfüllende Prophezeiungen entgegenzuwirken, schlägt Vermorel vor, dass Unternehmen die Komplexität von Supply-Chain-Systemen anerkennen und erkennen sollten, dass Punktprognosen möglicherweise nicht ausreichen. Stattdessen sollten sie versuchen, die potenziellen Auswirkungen ihrer Prognosen auf menschliches Verhalten und Entscheidungsprozesse zu verstehen und vorherzusehen.

Zusammenfassend untersucht das Interview die Feinheiten der Verwendung von Machine Learning und KI im Supply Chain Management und betont die Bedeutung des Verständnisses von sich selbst erfüllenden Prophezeiungen und Feedback-Loops, um die Prognosegenauigkeit und Entscheidungsfindung zu verbessern.

Das Null-Prognose-Problem tritt auf, wenn ein System aufgrund eines wahrgenommenen Rückgangs der Nachfrage weniger Bestände bestellt, was zu einem weiteren Rückgang der Nachfrage führt und zu einem kontinuierlichen Rückgang der Bestellungen führt. Um dieses Problem zu vermeiden, schlägt Vermorel vor, den Fehlbestand-Bias zu entfernen, indem die Metrik im Prognosemodell geändert wird. Ein Ansatz besteht darin, die Messungen an Tagen mit Fehlbeständen auf Null zu setzen. Diese Methode funktioniert gut, wenn Fehlbestände relativ selten sind, ist aber in Branchen mit hoher Fehlbestandsrate weniger effektiv.

Ein anderer Ansatz besteht darin, dem Machine-Learning-Modell Zugriff auf historische und zukünftige Bestandsdaten zu geben, damit es den Effekt von Bestandsschwankungen auf zukünftige Verkäufe oder Nachfrage lernen kann. Diese Methode erfordert die Berücksichtigung aller Entscheidungen und Faktoren, die die Nachfrage beeinflussen, wie z.B. Promotions, Preisgestaltung, Kapazität, Lager-Einschränkungen und Marktkräfte, im Prognosemodell.

Backus warnt jedoch davor, ein Standard-Machine-Learning-Modell ohne alle erforderlichen Informationen zu verwenden, da dies zu Fehlern führen kann, wie z.B. der Verwechslung von Ursache und Wirkung von Bestandsveränderungen und Nachfrageschwankungen. Um diese Probleme zu vermeiden, schlägt er vor, probabilistische Prognosen zu verwenden, die die Unschärfe der verfügbaren Informationen anerkennen und nicht auf eine absolute Sicherheit in der Nachfrage von Null konvergieren.

Probabilistische Prognosen verteilen Wahrscheinlichkeiten auf viele Werte, was es schwieriger macht, auf eine absolute Sicherheit in der Nullnachfrage zu konvergieren. Dieser Ansatz vermeidet das Einfrieren des Lagerbestands bei Null, indem er nicht-null Wahrscheinlichkeiten für zukünftige Nachfrage schätzt. Er berücksichtigt auch die Asymmetrie zwischen der Bedienung eines Kunden und der Aufbewahrung von zusätzlichem Bestand für einen weiteren Tag und bevorzugt höhere Service-Level.

Trotz ihrer Vorteile ist die probabilistische Prognose keine perfekte Lösung. Sie kann die zukünftige Nachfrage immer noch unterschätzen, wenn es zu wiederholten Fehlbeständen kommt. Sie bietet jedoch eine robustere Methode zur Bestandsverwaltung und vermeidet das Null-Prognose-Problem.

Zusammenfassend können die Verwendung von Machine-Learning-Techniken und probabilistische Prognosen dazu beitragen, dass Supply-Chain-Experten die Nachfrage besser vorhersagen und die Bestandskontrolle verbessern können. Indem sie verschiedene Faktoren berücksichtigen, die die Nachfrage beeinflussen, und die Unsicherheiten in den verfügbaren Daten berücksichtigen, können Unternehmen fundiertere Entscheidungen treffen und ihre Lieferkettenleistung verbessern.

Joannes Vermorel betonte die Bedeutung der Anerkennung von Unsicherheit bei der Prognose von Supply Chains, da eine perfekte Modellierung zukünftiger Ereignisse unrealistisch ist. Er diskutierte das Konzept der probabilistischen Prognose, die die inhärente Unsicherheit von Supply-Chain-Ereignissen widerspiegelt und sich von Punktprognosen unterscheidet. Probabilistische Prognosen, erklärte er, beinhalten Wahrscheinlichkeitsverteilungen, die die Zukunft sehr unterschiedlich aussehen lassen. Er ging auch auf Feedback-Loops als zusätzliche Dimension ein, um Prognosen durch ihre Dynamik und Bedingtheit auf zukünftiges Verhalten zu bereichern.

Alexander Backus stimmte Vermorels Aussagen zu und erläuterte, wie die Einbeziehung früherer Entscheidungen, wie z.B. der Preisgestaltung, Probleme bei der Prognose lösen kann. Er führte das Konzept der partiellen Beobachtbarkeit ein, bei dem nur die Auswirkungen einer Entscheidung beobachtet werden, ohne den kontrafaktischen Zustand zu kennen. Um die Auswirkungen von Entscheidungen besser vorhersagen zu können, schlug Backus vor, maschinelles Lernen so umzustrukturieren, dass optimale Entscheidungen anstelle von Vorhersagen über die Zukunft ausgegeben werden. Dieser Ansatz wird als verstärkendes Lernen bezeichnet.

Das Gespräch dreht sich um die Herausforderungen der Prognose und Entscheidungsfindung im Supply-Chain-Management aufgrund von Feedback-Loops, begrenzten Daten und nicht zufälligen Entscheidungen. Sie betonen die Notwendigkeit, diese Feedback-Loops anzunehmen und sich auf ein Modell zu konzentrieren, das Entscheidungen anstelle von Prognosen ausgibt. Der Trend bei technologieorientierten Unternehmen wie Amazon und Alibaba geht dahin, sich von der Idee einer perfekten Prognose zu verabschieden und sich auf die Entscheidungsfindung zu konzentrieren. Trotz bestehender Herausforderungen sind sich die Diskussionsteilnehmer einig, dass die Branche daran arbeiten sollte, diese Veränderungen schrittweise in das Supply-Chain-Management zu integrieren, um es zu verbessern.

Vermorel betont die Bedeutung der Akzeptanz von Unsicherheit und der unvermeidbaren Komplexität von Supply Chains, die aus Menschen, Maschinen und Prozessen bestehen. Er plädiert dafür, annähernd richtig zu sein, anstatt genau falsch. Backus betont die Notwendigkeit von erstklassigem Data-Science-Talent, um Herausforderungen in großen Unternehmen wie IKEA anzugehen, und betont das Potenzial für globale Auswirkungen und die Bedeutung der Infragestellung des Status quo.

Vollständiges Transkript

Nicole Zint: Herzlich willkommen, Alexander Backus, bei uns in unserem Büro. Alexander ist ein Experte auf diesem Gebiet und leitet das Data- und Analytics-Team bei IKEA. Wie immer möchten wir unsere Gäste bitten, sich kurz vorzustellen. Alexander, wenn Sie möchten, haben Sie das Wort.

Alexander Backus: Vielen Dank, Nicole. Vielen Dank, dass ich hier sein darf. Es ist großartig, hier in Paris bei Ihnen zu sein. Mein Name ist Alexander Backus und ich leite das Data-Analytics-Team im Bereich Bestands- und Logistikplanung bei IKEA Inka Group Digital. Ich leite eine Gruppe von Data Scientists, Data Engineers und Data Analysts, die in interdisziplinären Produktteams arbeiten, um die Planung der Bestands- und Logistikoperationen zu optimieren. Ich habe einen Hintergrund in Data Science und habe als Berater für große Unternehmen wie KLM Airlines, Heineken, Vodafone Ziggo und ING Bank gearbeitet. Nachdem ich einen PGD in Kognitiver Neurowissenschaft absolviert habe, denke ich, dass die Arbeit als Data Scientist in der Supply Chain ein wirklich spannendes Feld ist, weil es viele günstige Bedingungen für Data Science bietet. Es gibt viele Daten, es gibt Auswirkungen auf die Entscheidungsfindung in der realen Welt, also etwas Greifbares, und man beeinflusst nicht nur das Ergebnis, sondern trägt auch dazu bei, eine nachhaltigere Welt zu schaffen, indem man Verschwendung in der Supply Chain reduziert. So bin ich hier gelandet.

Nicole Zint: Bevor wir uns mit diesen Themen befassen, erklären wir zunächst das Konzept, über das wir sprechen werden. Fangen wir einfach an: Was ist eine sich selbst erfüllende Prophezeiung?

Alexander Backus: Die Idee ist, dass die Prognose, die Sie zur Optimierung Ihres Geschäftsprozesses erstellen, tatsächlich einen bestimmten Entscheidungsprozess beeinflusst. Es wird eine Entscheidung aufgrund Ihrer Prognose getroffen, zumindest ist das das Ziel. Wenn das passiert, bedeutet das, dass Ihre Prognose selbst die Zukunft verändert und auch die Daten verändert, die zur Prognose für das nächste Mal verwendet werden. Das kann bestimmte Herausforderungen mit sich bringen. Im Wesentlichen ist eine sich selbst erfüllende Prophezeiung eine Vorhersage, die eintritt, weil sie vorhergesagt wurde. Sie beeinflussen also die Zukunft, weil Sie dachten, dass sie auf eine bestimmte Weise sein würde. Sie beeinflussen nicht nur die Zukunft, sondern schaffen auch eine Realität, in der die Prognose zur Wahrheit wird, und das kann auf verschiedene Arten geschehen. Wenn Sie zum Beispiel eine Prognose für Ihr Unternehmen oder Ihre Verkäufe haben, kann dies zum Ziel für Ihr Unternehmen werden.

Nicole Zint: Also treffen Marketingexperten bestimmte Entscheidungen, sie sagen: “Okay, wir sollten dieses Ziel erreichen, weil wir im Moment etwas niedrig sind, also müssen wir ein bisschen mehr verkaufen und ein paar Werbeaktionen machen.” Tatsächlich ist die Prognose, die Sie gemacht haben, zum Ziel geworden, das zu Entscheidungen auf dem Weg geführt hat, die sich auf das Endergebnis der Verkäufe in diesem Beispiel auswirken. Und das kann auf viele Arten geschehen. Ein weiteres Beispiel ist, wenn Sie eine bestimmte Prognose haben, die dazu führt, dass Sie eine bestimmte Lieferkapazität oder Kommissionierungskapazität in Ihren Lagern sichern, und das hat Auswirkungen auf die Durchlaufzeit. Wenn ein Kunde Ihre E-Commerce-Website besucht und sieht, dass die Durchlaufzeit sehr hoch oder sehr niedrig ist, kann das die Nachfrage der Kunden tatsächlich beeinflussen.

Alexander Backus: Genau, die Nachfrage beeinflusst Ihr Angebot und das Angebot beeinflusst die Nachfrage. Es geht in beide Richtungen, und das ist tatsächlich dieser Effekt, auf den du hindeutest, Joannes. Wenn es um Prognosen geht, die zu Geschäftszielen werden, wie siehst du, dass sich das auf das Unternehmen selbst auswirkt? Welche Nachteile gibt es, wenn die Prognose etwas ist, was die Menschen erreichen wollen, anstatt sich tatsächlich die Leistung ihrer Lieferkette anzusehen?

Joannes Vermorel: Es gibt keine Nachteile an sich. Es geht vielmehr darum, dass dies die Art und Weise ist, wie die Lieferkette funktioniert. Feedbackschleifen sind überall vorhanden. Wir haben es im Wesentlichen mit menschlichen Angelegenheiten zu tun, bei denen es die Praktiker überrascht, dass in vielen Ingenieurschulen und sogar in vielen Unternehmen Prognosen wie die Bewegung von Planeten behandelt werden, etwas, bei dem Sie einen sehr klaren Rahmen haben, in dem Sie vergangene Beobachtungen haben und eine Aussage über die zukünftige Position des Planeten machen können. Aber Sie als Prognostiker haben keinerlei Einfluss auf diese beobachteten Elemente, wie die Planeten.

Nicole Zint: Du meinst also, dass eine sich selbst erfüllende Prophezeiung nicht unbedingt gut oder schlecht ist, sondern einfach ist?

Joannes Vermorel: Ja, genau. Man kann nicht behaupten, dass es keine Auswirkungen hat, aber es macht die Situation sicherlich komplexer und komplizierter, eigentlich beides. Und wo es ein wenig verwirrend wird, ist, dass viele Unternehmen Schwierigkeiten haben, sich mit etwas abzufinden, das keine Punktprognose oder Punktprognose ist. Angenommen, Sie haben eine Zukunft; das ist es. Und es ist im Wesentlichen etwas, das völlig symmetrisch zur Vergangenheit ist. Sie haben Ihre vergangenen Beobachtungen und möchten die Zukunft haben, die genauso sauber und ordentlich ist wie die Vergangenheit, im Wesentlichen mehr vom Gleichen.

Nicole Zint: Ja, mehr vom Gleichen, aber auch wirklich die gleiche Natur. Sie haben also eine vollkommen klare Vorstellung von der Vergangenheit und eine vollkommen klare Vorstellung von der Zukunft. Und übrigens, im Fall der Bewegung von Planeten können Sie, solange Sie nicht Millionen von Jahren vorausschauen, eine vollkommen perfekte Vorstellung von der Position dieser Planeten in einem Jahrhundert haben.

Joannes Vermorel: Jetzt wird es interessant, denn in der Lieferkette gibt es Feedbackschleifen überall. Immer wenn Sie sich durch den Kauf einer großen Menge an ein Produkt binden, schaffen Sie tatsächlich Erwartungen, und die Menschen haben das Gefühl, dass sie das Produkt verkaufen müssen, und sie werden alles tun, damit das Unternehmen nicht mit massiven Überbeständen zurückbleibt, die sie nicht abverkaufen konnten. Sie organisieren sich so, dass dieser massive Vorrat in massive Verkäufe umgewandelt wird, oder zumindest versuchen sie es. Sie passen den Preis entsprechend an, wie viel sie auf Lager haben, oder manchmal auch Dinge, die noch banaler sind. Wenn es Geschäfte gibt, wenn Sie

Nicole Zint: In eine etwas andere Richtung, um eine größere Unterscheidung zu treffen, sehen Sie diese Feedbackschleifen, sie sind überall und sie sind nicht schlecht. Sie sind einfach vorhanden, und der Hauptgrund dafür ist wiederum, dass wir Menschen in der Mitte haben, die aufgrund dieser Verbesserungen über die Zukunft nachdenken und handeln können. Immer wenn Menschen in der Schleife sind, immer wenn Sie eine Aussage über die Zukunft machen, werden die Menschen entsprechend auf diese Aussagen reagieren. Lieferketten sind sehr komplex, daher können diese Reaktionen viele Formen annehmen. Aber alle Lieferketten haben gemeinsam, dass sie viele Menschen haben, und manchmal nimmt die Rückkopplungsschleife auch die Form der Ankündigung einer Knappheit von etwas an. Dann stürzen sich die Menschen darauf, dieses Etwas zu kaufen, und so kann es aufgrund eines psychologischen Effekts zu einer künstlich herbeigeführten Knappheit kommen.

Joannes Vermorel: Genau. Und die Idee, dass wenn Sie eine Knappheit ankündigen, höchstwahrscheinlich eine Knappheit verursachen werden, ist nichts Neues. Es ist relativ vorhersehbar, aber dennoch ist es schwierig, all diese Hinweise vorherzusehen, denn plötzlich müssen Sie perfekt sein. Ja, und plötzlich müssen Sie in gewisser Weise die Psyche der Menschen modellieren, die sich in der Mitte der Lieferkette befinden.

Nicole Zint: Joannes, du erwähnst immer wieder diese Feedbackschleifen. Alexander, darf ich dich fragen, welche tatsächlichen Daten in diese Systeme zurückgespeist werden, damit unsere Zuschauer es verstehen? An welchem Punkt in der Lieferkette geben wir die Daten zurück?

Alexander Backus: Gute Frage. Ich denke, eine sehr wichtige Quelle für jede Art von Prognose sind Ihre Verkaufsdaten, und dies sind auch die Schlüsseldaten, die von den Effekten betroffen sind, über die wir gerade gesprochen haben. Wenn wir zu dem zurückkehren, was Joannes erklärt hat, ist der naive Ansatz zur Nachfrageprognose oder allgemein zur Geschäftsprognose, dass Sie ein überwachtes maschinelles Lernmodell nehmen und es als grundlegendes Regressionsproblem behandeln. Sie sagen also: “Okay, ich werde diese Menge basierend auf historischen Daten mit einem überwachten Lernalgorithmus vorhersagen.” Und wenn Sie dieses Modell nehmen, das darauf trainiert ist, zukünftige Verkäufe vorherzusagen, und nun über die Beispiele der Feedbackschleifen nachdenken, die wir diskutiert haben, können Sie hier schädliche oder degenerative Fälle haben. Wenn Ihr Modell also eine geringe Nachfrage oder geringe Verkäufe vorhersagt, seien wir sehr vorsichtig, die beiden nicht zu verwechseln, aber lassen Sie uns für einen Moment ignorieren, dass Verkäufe nicht gleichbedeutend mit Nachfrage sind.

Und so geraten Sie in eine Situation, in der Sie geringe Verkäufe vorhersagen, also auch eine geringe Kapazitätsplanung durchführen, und daher auch weniger verkaufen, und dann werden Sie immer weiter absteigen, bis Sie auf null kommen. Das Modell wird also lernen, dass die Nachfrage sinkt, aber sie sinkt. Und es kann auch umgekehrt passieren. Es kann sich auch in diesem Sinne nach oben drehen.

Joannes Vermorel: Ja, es gibt diese schädlichen Effekte, wenn Sie ein maschinelles Lernmodell verwenden, um aus der Vergangenheit zu lernen und die Zukunft auf diese naivere Weise vorherzusagen, die völlig schiefgehen kann.

Nicole Zint: Es klingt ein bisschen wie der Peitscheneffekt, bei dem ein Fehler in einer Lieferkette oder eine Abweichung von der Norm vom System verstärkt wird. Und Sie haben auch erwähnt, dass Verkäufe nicht unbedingt Nachfrage sind, denn Sie können 50 Einheiten Ihres Bestands verkaufen, aber wenn die Nachfrage 100 war, wird nur registriert, dass Ihre Verkäufe 50 betragen. Diese Unterscheidung hängt tatsächlich mit dem Kern dieses Problems zusammen.

Alexander Backus: Ja, die Nachfrage selbst ist natürlich eine nicht beobachtete Größe. Sie können sie nicht messen, also müssen Sie sie ableiten. Und Verkaufsdaten kommen dem am nächsten, aber das ist definitiv nicht das Ganze.

Nicole Zint: Also diskutieren wir die Idee, dass erstellte Prognosen die Nachfrage und den Verkauf beeinflussen können und so eine Rückkopplungsschleife erzeugen. Manche haben den Unterschied zwischen der Vorhersage des Wetters und der Vorhersage des Geschäfts beschrieben, wobei die Vorhersage des Wetters keinen Einfluss darauf hat, während die Vorhersage des Geschäfts tatsächlich Auswirkungen haben kann. Alexander, könnten Sie näher auf diese Rückkopplungsschleife eingehen und wie vermeiden wir das von Ihnen erwähnte Nullprognose-Problem?

Alexander Backus: Sicher. Wenn ein maschinelles Lernmodell aus seinen eigenen Ausgabedaten lernt, kann es Abweichungen von der Norm verstärken. Zum Beispiel, wenn die Nachfrage aus irgendeinem Grund etwas sinkt, kann das Modell dem System sagen, weniger zu bestellen. Als Ergebnis sinkt die Nachfrage noch weiter, weil weniger bestellt wird, und das Modell schlägt dann vor, noch weniger zu bestellen, was zu einem Nullprognose-Problem führt. Dieses Problem tritt besonders häufig bei der Zeitreihen-Prognose auf. Joannes, wie vermeiden wir dieses Problem bei maschinellen Lernsystemen?

Joannes Vermorel: Die Nullprognose ist etwas, das Sie erhalten, wenn Sie den Lagerbestandsverzerrungseffekt nicht entfernen, der ziemlich stark sein kann. Wenn Ihnen der Lagerbestand ausgeht, beobachten Sie null Verkäufe, aber das bedeutet nicht, dass es keine Nachfrage gibt. Bei Lokad haben wir mindestens drei Techniken im Einsatz, um mit der Lagerbestandsverzerrung umzugehen. Ein Ansatz besteht darin, die Metrik zu ändern, gegen die Sie Ihr Prognosemodell optimieren. Anstatt die Metrik gleichmäßig über die Zeit anzuwenden, setzen Sie die Messungen an Tagen mit Lagerbeständen auf null. Das ist ein grober Ansatz, aber er kann funktionieren.

Nicole Zint: Welche Metrik wird normalerweise zuerst verwendet, die Sie vorschlagen, zu ändern?

Joannes Vermorel: Es gibt Tausende von Metriken, aber die einfachsten sind L1, L2 oder sogar MAPE. Die Frage ist, ob Sie die Metrik gleichmäßig über die Zeit anwenden. Die Antwort ist in der Regel nein, Sie möchten sie nicht gleichmäßig anwenden. Sie möchten Ihre Messungen an Tagen mit Lagerbeständen auf null setzen.

Nicole Zint: Also bedeutet “auf null setzen”, den Beitrag eines Tages zu entfernen, an dem ein Lagerbestand vorhanden war?

Joannes Vermorel: Ja, Sie entfernen den Beitrag eines Tages, wenn Sie wissen, dass Ihr Signal stark verzerrt ist. Es funktioniert gut, dieses Signal auszuschneiden, aber es ist ein ziemlich grober Ansatz.

Nicole Zint: Nicht, wenn Ihre Lagerbestände sehr häufig ausfallen. Für viele Unternehmen sind Lagerbestände statistisch relativ selten. Sie haben einen Servicegrad von 95% oder mehr, daher funktioniert diese Methode gut, wenn Lagerbestände etwas Außergewöhnliches sind, so etwas wie eine natürliche Katastrophe, die ziemlich selten auftritt.

Joannes Vermorel: Nein, ich meine einfach so etwas wie einen allgemeinen Warenladen, wissen Sie, Ihren Supermarkt. Sie haben jeden Tag einen Servicegrad von 95% oder mehr, das ist in Ordnung. Wo es nicht funktionieren würde, wäre zum Beispiel ein Geschäft für Luxusgüter. In diesem Fall hätte ein Geschäft für Luxusgüter, um Ihnen eine Vorstellung zu geben, typischerweise 500 Artikel aus einem Katalog von 5.000. Also haben Sie per Definition die meiste Zeit einen Lagerbestand von über 90%. In diesem Fall ergibt es nicht viel Sinn. Sie sehen also, es hängt wirklich von der Branche ab. Es gibt Branchen wie zum Beispiel Lebensmittel, in denen Sie sehr hohe Servicegrade erwarten. Ihr Sortiment ist auf Dinge ausgerichtet, die Sie haben sollen. Wenn Ihr Supermarkt zum Beispiel normalerweise ein Paket mit Sodaflaschen verkauft, sollten Sie mit Zuversicht in den Laden gehen können und sicher sein, dass Sie diese Einheiten finden werden. Manchmal werden Sie es nicht finden, aber solche Ereignisse werden selten sein. Also nochmal, es hängt von den Branchen ab, die Sie betrachten.

Nicole Zint: Okay, und im Grunde genommen kann der Verkauf ein falsches Signal über die Nachfrage senden, wie Sie erklärt haben. Wenn es keinen Verkauf gibt, kann schnell fälschlicherweise angenommen werden, dass dies null Nachfrage bedeutet, aber in Wirklichkeit könnte es daran liegen, dass Sie diesen Lagerbestand nicht haben. Tatsächlich gibt es eine sehr hohe Nachfrage danach. Und das Gegenteil ist auch wahr. Wenn Sie einen Lagerbestand für ein anderes Produkt haben, das ein guter Ersatz sein könnte, können Sie sehen, dass die Verkäufe für einen Artikel steigen, während es nur die Tatsache widerspiegelt, dass Ihnen der Lagerbestand von etwas ausgeht, das ein lockerer Ersatz ist. Nichtsdestotrotz könnte die Wahrnehmung des Kunden sein, dass es ein schlechter Service ist.

Joannes Vermorel: Ja, denn Kunden sind vielleicht immer noch bereit, den Ersatz zu akzeptieren, aber sie könnten trotzdem der Meinung sein, dass es eine minderwertige Option ist. Also, was interessant ist, ist, dass Sie den Agenten, die Kunden, und das, was sie denken, berücksichtigen müssen, und versuchen, Ihre Modellierung der Nachfrage anzupassen, um die Art des grundlegenden Denkens zu erfassen, das in Ihre Kundenbasis einfließen wird.

Nicole Zint: Wie vermeiden wir dieses Problem der Nullprognose, damit null Verkäufe nicht als null Nachfrage angenommen werden?

Alexander Backus: Jiran hat gerade erwähnt, dass man dieses Signal einfach nicht berücksichtigen sollte, um diese Tage zu vermeiden. In technischer Hinsicht nennt man das Verlustmaskierung.

Joannes Vermorel: Ja, Sie entfernen im Grunde genommen den Beitrag dieses Datenpunkts. Eine andere einfache Technik besteht darin, dem Modell Zugriff auf die historischen Lagerbestände und vielleicht einige zukünftige Prognosen davon zu geben, damit Sie verstehen können, wie diese Verkäufe von den Lagerbeständen beeinflusst werden.

Alexander Backus: Das Modell kann dann lernen, welchen Einfluss bestimmte Schwankungen der Lagerbestände auf zukünftige Verkäufe oder Nachfrage haben, wenn Sie es modellieren. Im Wesentlichen den Einfluss der Entscheidungen.

Joannes Vermorel: Ja, das ist es, worauf alle hinauswollen, wo Sie alle Entscheidungen, die auf Ihren früheren Prognosen basieren, nehmen und sie als Eingabe für Ihr Prognosemodell verwenden.

Nicole Zint: Wenn Sie es trainieren, sind das nicht nur Lagerentscheidungen, die sich auf die Lagerbestände auswirken, sondern es können auch Marketingentscheidungen sein, wie zum Beispiel ein von der Geschäftsleitung festgelegtes Ziel. Sie sagen: “Hey, so viel wollen wir verkaufen.” Das ist an sich schon eine Entscheidung, weil wir all diese Marktkräfte haben.

Alexander Backus: Ja, Marktkräfte. Sie nehmen all das als Eingabe in die Prognose auf, wie zum Beispiel Werbeaktionen, Preisdaten und Kapazitätsdaten. Die Kapazität kann auch die Nachfrage beeinflussen. Wenn die Vorlaufzeiten in die Höhe schießen, suchen die Leute nach Alternativen. Im Wesentlichen dienen alle Einschränkungen im Unternehmen, in den Lagern und alles, was die Nachfrage beeinflussen kann, als Eingangssignale für Ihr Modell. Dann kann das Modell aus der Geschichte lernen, welchen Einfluss diese Signale auf die Nachfrage haben und es entsprechend korrigieren.

Dies ist sozusagen Schritt zwei in Ihrem Modellieren, denn hier gibt es viele Dinge, auf die Sie achten müssen. Ein interessanter Nebenschritt besteht darin, dass Geschäftsanwender Ihr Modell verwenden möchten, um das zu tun, was in technischer Hinsicht als kausale Inferenz bezeichnet wird. Sie möchten Dinge wie “Was passiert, wenn wir diese Werbeaktion machen oder die Lagerbestände reduzieren? Was passiert mit der Nachfrage?” Es ist so etwas wie eine Simulation.

Damit dies funktioniert, müssen Sie beim Modellieren viel mehr Sorgfalt walten lassen. Wenn Sie es so machen, wie ich es erklärt habe, kann Ihr Modell leicht Effekte lernen, wie zum Beispiel wenn der Lagerbestand niedrig ist, die Nachfrage hoch ist, nur weil eine Marketingkampagne, die die eigentliche Ursache ist, den Lagerbestand senkte und die Nachfrage steigen ließ. Das verwirrt das Konzept. Das nennt man einen Störfaktor oder eine umgekehrte Kausalität. Ein Standard-Maschinenlernmodell, dem nicht alle benötigten Informationen gegeben werden, wird diesen Fehler machen.

Ein klassisches Beispiel ist, wenn Sie versuchen vorherzusagen, ob es heißes Wetter wird. Sie können das anhand der Anzahl der verkauften Eiscremes vorhersagen. Nun, das ist natürlich ein typisches Beispiel für umgekehrte Kausalität. Aber vielleicht haben sie ihren Preis gesenkt oder einen Lagerbestand gehabt, und das war der eigentliche Grund. Es gibt viele Möglichkeiten.

Aber Sie müssen vorsichtig sein. Dies ist eine Möglichkeit, Ihrem Modell mehr Informationen über die getroffenen Entscheidungen zu geben und sicherzustellen, dass es lernt, wie sie zusammenhängen. Dies wird jedoch für das Modell selbst ziemlich herausfordernd sein, diese Beziehungen zu lernen, insbesondere wenn es viele Schritte dazwischen gibt, für die Sie keine Daten haben. Wenn Sie eine Prognose abgeben, ist es nicht eins zu eins, dass jemand im Unternehmen das nimmt und Entscheidungen darauf basiert trifft. Es wird Informationen hinzugefügt, Änderungen von Planern im Unternehmen vorgenommen, und dann sind Sie in gewisser Weise blind dafür. Es wird wieder problematisch und komplex.

Bevor wir uns damit befassen, wie wir diese neuen Herausforderungen angehen, die durch die Schaffung eines…

Nicole Zint: Maschinelles Lernen ist ein intelligenteres Modell, das Entscheidungen trifft und lernt. Alexander, wie wirkt sich jede Entscheidung auf das Unternehmen aus, und wie können wir sie vergleichen, um herauszufinden, welche Entscheidungen wir treffen sollten? Wir wollen nicht nur prognostizieren, sondern auch die Zwischenschritte verstehen. Aber bevor wir uns damit befassen, Joannes, haben wir etwas früher dieses Null-Prognosemodell erwähnt, das ein wichtiger Begriff in diesem maschinellen Lernmodell ist. Was ist der Unterschied in den Prognoseansätzen, die wir bei Lokad verfolgen? Helfen probabilistische Prognosen dabei, das Problem der Null-Prognose zu lösen und diese Abweichungen von der Norm zu verstärken, wie wir besprochen haben? Wie ändert sich das durch probabilistische Prognosen?

Joannes Vermorel: Probabilistische Prognosen sind in dieser Hinsicht sehr interessant und allgemeiner für die Rückkopplungsschleife. Es gibt zwei völlig unterschiedliche Gründe dafür. Der erste ist die Idee, dass wir eine Art Unschärfe einführen, damit wir zumindest annähernd richtig liegen, im Gegensatz zu genau falsch.

Wenn es um Situationen mit Null-Prognosen geht, zum Beispiel, passiert es, dass wenn Sie probabilistische Prognosen haben, Sie anerkennen, dass die Qualität der Informationen, die Sie haben, tendenziell ziemlich unscharf ist. Sie haben keine perfekte Vorstellung davon, was passiert, und deshalb wird es numerisch gesehen viel schwieriger sein, zu einer absoluten Gewissheit zu konvergieren, dass die Nachfrage wirklich null ist. Es ist also nicht so, dass das probabilistische Prognosemodell so viel besser ist, es wird sich einfach ausbreiten und auf dieser Null-Position nicht feststecken bleiben. Es berücksichtigt alle Wahrscheinlichkeiten über viele Werte hinweg, und wenn Sie die Tatsache hinzufügen, dass Sie in der Regel starke Asymmetrien zwischen der Möglichkeit haben, eine Einheit zu bedienen oder nur eine zusätzliche Einheit einen weiteren Tag lang auf Lager zu halten, sind Sie in vielen Situationen sehr dafür, eine zusätzliche Einheit für einen Tag aufzubewahren, anstatt das Risiko einzugehen, dass der Bestand ausgeht. Der Kompromiss ist sehr stark auf höhere Servicelevel ausgerichtet.

Was Sie also aus probabilistischen Prognosen erhalten, ist eine Situation, in der Sie Wahrscheinlichkeiten haben, die sich verteilen. Sie haben nicht Ihre Prognose, die Ihre numerische Aussage über die Zukunft ist, die schnell in einen degenerierten Zustand zusammenbricht, der besagt, dass die zukünftige Nachfrage null sein wird. Es wird Probleme geben, also wenn Sie wiederholte Bestandsausfälle haben, ist probabilistische Prognose keine Magie. Sie werden höchstwahrscheinlich die tatsächliche zukünftige Nachfrage unterschätzen. Sie werden jedoch höchstwahrscheinlich vermeiden, dass der Bestand bei null einfriert, einfach weil Sie immer noch schätzen, dass es eine nicht-null Wahrscheinlichkeit für eine oder zwei oder drei Einheiten Nachfrage gibt. Das ist das erste Argument; es vermeidet eine Verstärkung in eine Richtung.

Alexander Backus: Ja, es ist auch wichtig zu bedenken, dass, insbesondere wenn wir Rückkopplungsschleifen haben, Situationen sehr schwer vollständig kontrollierbar sind. Es ist besser, etwas zu haben, das sich nicht in eine Richtung verstärkt, wie Joannes erwähnt hat.

Nicole Zint: Geben Sie vor, alles vollständig zu beherrschen. Nochmals, es geht nicht um die Bewegung von Planeten, von der wir sprechen. Phänomene, bei denen eine Ungenauigkeit von 30-60 Prozent nichts ist, wissen Sie, ist nichts allzu Überraschendes.

Joannes Vermorel: Also sprechen wir von einem Grad an Ungenauigkeit in der Art von numerischer Aussage, die wir über die Zukunft machen, der sehr hoch ist. Probabilistische Prognosen geben zumindest etwas wieder, das diese enorme Umgebungsunsicherheit widerspiegelt, die wir haben. Nochmals, wir versuchen, Menschen zu modellieren, wissen Sie, Menschen, die reagieren können. Es ist sehr, sehr schwierig und das erste, was man anerkennen muss, ist, dass man nicht die Kontrolle hat. Ich meine, diese Menschen - diese Kunden, diese Lieferanten, diese Wettbewerber - sie sind klug, sie spielen ihre eigenen Spiele, wissen Sie, sie tun eine Menge Dinge. Es wäre, würde ich sagen, ein bisschen Überheblichkeit zu behaupten, dass man perfekt modellieren kann, was auch immer passieren wird. Das wäre die Grundlage des Science-Fiction-Romans von Asimov, in dem man eine perfekte statistische Modellierung der Zukunft großer Zivilisationen haben kann. Es ist extrem schwierig und höchstwahrscheinlich unrealistisch.

Joannes Vermorel: Probabilistische Prognosen sind auch aus einem völlig anderen Grund von großem Interesse. Der zweite Grund ist, dass es im Gegensatz zur Punktprognose, bei der zwischen Vergangenheit und Zukunft eine vollständige Symmetrie besteht - bei der Punktprognose haben Sie im Wesentlichen eine Messung pro Tag pro SKU, das könnten zum Beispiel Ihre Verkäufe oder Ihre Nachfrage sein - und wenn Sie in die Zukunft projizieren, haben Sie eine Messung pro Tag pro SKU. Die Prognose ist also sehr symmetrisch zu Ihrer vergangenen Beobachtung. Wenn Sie jedoch in den Bereich der probabilistischen Prognose gehen, schauen Sie plötzlich auf eine Wahrscheinlichkeitsverteilung oder eine Reihe von Wahrscheinlichkeitsverteilungen. Und so haben Sie diese sehr starke Asymmetrie zwischen Vergangenheit und Zukunft. Plötzlich ist die Zukunft völlig anders als die Vergangenheit. In der Vergangenheit haben Sie Beobachtungen, sie sind einzigartig, es gibt keine Unsicherheit oder wenn doch, dann ist es nur die Unsicherheit der Messung selbst. Ich meine, es könnte einen Schreibfehler in Ihren Verkaufsaufzeichnungen geben, aber in Bezug auf die Größenordnung ist dies sehr, sehr gering. Dies kann in der Supply Chain fast immer als keine Unsicherheit im Vergleich zur Zukunft approximiert werden, wo die Unsicherheit enorm ist und das sind Ihre Wahrscheinlichkeitsverteilungen.

Joannes Vermorel: Und deshalb ist das, was sehr interessant ist und mich zur Rückkopplungsschleife bringt, dass die Rückkopplungsschleife eine weitere Dimension ist. Es ist eine Möglichkeit, die Prognose zu bereichern und robuster zu machen, aber auf eine sehr unterschiedliche Weise, denn wenn probabilistische Prognosen darum ging, Wahrscheinlichkeiten einzuführen, geht es bei der Rückkopplungsschleife darum, die Prognose zu einer Funktion höherer Ordnung zu machen. Grundsätzlich ist Ihre Prognose plötzlich kein Ergebnis mehr, nicht einmal eine Wahrscheinlichkeitsverteilung, sondern ein Mechanismus, in den Sie eine Richtlinie, eine Art Reaktion, einspeisen können und ein anderes Ergebnis erhalten. Sie sehen also, es wird irgendwie etwas, bei dem Sie einfach wissen, dass wenn jemand handelt - und dieser jemand kann sogar Sie selbst in gewisser Weise sein - Sie immer noch einen Einfluss auf die Prognose haben werden.

Nicole Zint: Die Situation wird also dynamischer und ganzheitlicher, wenn man in den Bereich der Rückkopplungsschleifen geht. Können Sie erklären, wie sich dies auf die Prognose auswirkt und wie sie schwerer fassbar wird?

Joannes Vermorel: Wenn Sie in den Bereich der Rückkopplungsschleifen gehen, haben Sie es mit etwas Dynamischem zu tun, das einen funktionalen Bestandteil in seinem Kern benötigt, wie eine Richtlinie. Diese Richtlinie gibt vor, wie Sie in Bezug auf Lagerbestände, Preis und verschiedene Faktoren reagieren, die Ihre Prognose darstellen. Die Prognose wird schwerer fassbar, weil sie kein einfaches Objekt mehr ist. Sie wird von diesen Rückkopplungsschleifen beeinflusst und wenn die Leute “Prognose” sagen, denken sie in der Regel an eine Punktprognose. Wenn wir in den Bereich der Richtlinienprognosen gehen, dehnen wir bereits aus, was die Leute denken können. Wenn wir sagen, es werden Wahrscheinlichkeitsverteilungen sein, wird es viel schwieriger zu visualisieren.

Zum Beispiel die Tatsache, dass sich Ihre Preise entwickeln werden, um den Warenfluss in Ihrer Supply Chain aufrechtzuerhalten. Wenn ein Unternehmen kurz vor einem massiven Engpass steht, ist die natürliche Reaktion, den Preis allmählich zu erhöhen, damit der Engpass weniger schwerwiegend ist. Umgekehrt, wenn Sie kurz vor einer massiven Überbestandssituation stehen, ist die natürliche Reaktion, den Preis zu senken, um die Nachfrage zu erhöhen und den Überbestand abzubauen. Die Prognose, die Sie über die Zukunft haben, hängt von Ihrer Preispolitik in diesen Beispielen ab. Wenn Sie an Rückkopplungsschleifen denken, wird Ihre Prognose bedingt und berücksichtigt eine Richtlinie, die in gewissem Maße unter Ihrer Kontrolle steht.

Nicole Zint: Alexander, stimmen Sie den Stärken und Unterschieden zu, die Joannes gerade mit dem probabilistischen Prognoseansatz im Vergleich zu einer Zeitreihe dargelegt hat?

Alexander Backus: Ja, indem Sie Ihrem Modell Zugriff auf frühere Entscheidungen wie die Preisgestaltung geben, können Sie dieses Problem mildern. Joannes hat in diesem Zusammenhang über Zeitreihen und probabilistische Prognosen gesprochen. Wir haben jedoch nicht nur den Effekt Ihrer Prognose, der zukünftige Entscheidungen und Trainingsdaten beeinflusst; wir haben auch das, was als partielle Beobachtbarkeit bezeichnet wird. Das bedeutet, dass Sie nur die Auswirkungen der getroffenen Entscheidung beobachten und nicht wissen, was passiert wäre, wenn Sie mehr Kapazität oder mehr Bestände gehabt hätten. Das ist ein Gegenfaktum. Die Herausforderung besteht darin, ein Modell zu erstellen, das gut genug ist, um die Auswirkungen aller Entscheidungen genau vorherzusagen.

Dieses Phänomen ist in E-Commerce-Empfehlungssystemen sehr bekannt und in der Supply Chain wahrscheinlich weniger bekannt. Es wird als Banditen-Feedback bezeichnet. Der Begriff stammt von den einarmigen Banditen, einer Spielautomatenkonfiguration in einem Casino, bei der Sie nur die Belohnung beobachten, die Sie vom Spielautomaten erhalten, oder welchen Arm Sie ziehen.

Nicole Zint: Und dann ist das der gleiche Effekt, und das Empfehlungssystem ist ähnlich, weil Sie nicht wissen, was passiert wäre, wenn Sie dem Kunden eine andere Anzeige gezeigt hätten. Es gibt spezifische Modellierungsansätze, die dafür gut geeignet sind, und das naive überwachte Lernsetup, über das ich am Anfang gesprochen habe, ist tatsächlich in dieser Hinsicht unzureichend. Es ist also nicht gut darin, die Wirkung der Aktion vorherzusagen. Vielmehr möchten Sie Ihr maschinelles Lernproblem neu formulieren, sodass das Modell keine Vorhersage über die Zukunft ausgibt; es sollte eine optimale Entscheidung ausgeben. Und das ist es, worauf Joannes auch hingewiesen hat, es wird als Richtlinie bezeichnet. Sie lernen also ein Modell, das besagt, was Sie tun sollten. Dies ist die Anzeige, die Sie anzeigen sollten, oder im Kontext der Supply Chain ist dies der Bestand, den Sie von A nach B verschieben sollten, dies ist die Menge an Kapazität, die Sie reservieren sollten. Also die tatsächlichen Dinge, die Ihre Supply Chain direkt beeinflussen, anstatt nur eine Prognose für sich allein, auf deren Grundlage Sie die Entscheidungen selbst treffen, die die Maschine nicht kennt. In der Theorie könnten Sie tatsächlich die gesamte Prognose überspringen und einfach sagen, was Sie tun sollten.

Alexander Backus: Es gibt spezifische maschinelle Lernalgorithmen, und die breitere Klasse wird tatsächlich als reinforcement learning bezeichnet. Dabei treffen Sie eine Aktion in der realen Welt, beobachten die Auswirkungen davon und sollten es in Bezug auf Belohnungen, finanzielle Belohnungen, formulieren. Und das ist, wenn Sie das Feedback erhalten und dann Ihr Modell basierend auf diesem Feedback aktualisieren. Sie haben finanzielle Belohnungen erwähnt, also ist ein Beispiel, wenn Sie die Entscheidung treffen, so viel Bestand zu bestellen, und dann beobachten Sie, wie die Supply Chain funktioniert, wie viel Geld auf das Konto eingegangen ist, und das wird dann in das System zurückgespeist, sodass es versteht, dass dies der Ausgangspunkt war, als wir diese Entscheidungen getroffen haben, und so geht es weiter.

Joannes Vermorel: Ja, diese Art von finanzieller Verstärkung oder finanzielles Ziel kann komplexer sein und Lagerhaltungskosten, verpasste Chancen usw. berücksichtigen. Es gibt viel, worauf man eingehen kann, oder wir können es dabei belassen. Das ist es, was Sie dann mit diesem reinforcement learning Algorithmus optimieren. Auf diese Weise lernen Sie direkt die Richtlinie, die Entscheidungen, die Sie ausgeben sollten. Sie umarmen sozusagen diese sich selbst erfüllende Prophezeiung, anstatt sie zu vermeiden, worüber wir am Anfang unserer Diskussion gesprochen haben. Es ist also nicht gut oder schlecht; es kann einfach nicht ignoriert werden. Und das ist ein Weg, um dies zu umgehen, um dieses Modell zu haben, das die Entscheidungen berücksichtigt und aus den Auswirkungen früherer Entscheidungen lernt, um immer bessere Entscheidungen zu treffen.

Alexander Backus: Wir sollten ein wenig über die Auswirkungen nachdenken, denn das bedeutet, dass Sie auch experimentieren können sollten. Und das ist in diesem Setup natürlich sehr herausfordernd, wenn das Modell lernen und sehen muss, was passiert, wenn es A oder B tut.

Nicole Zint: Warum wurde das bisher im Wesentlichen nicht angewendet oder wird es nicht überall angewendet?

Alexander Backus: Nun, das ist einer der Gründe. Typische reinforcement learning Algorithmen lernen auch in einer Online-Form, das heißt, sie nehmen eine Aktion vor und lernen dann aus dem Belohnungsfeedback, das sie dafür erhalten. Dies ist problematisch in realen Umgebungen, in denen viel Risiko besteht und Sie auch nicht haben

Nicole Zint: Sie haben nichts, um diesen Algorithmus zu starten, um vernünftige Dinge von Anfang an auszugeben. Es beginnt zufällig initiiert. Oder Sie müssen eine sehr gute Simulationsumgebung haben, was Sie oft in anderen reinforcement learning Umgebungen sehen, wie zum Beispiel AlphaZero, das von Google DeepMind Schachspielen lernt. Sie haben eine Simulation, in der dieser reinforcement learning Algorithmus herumspielen kann. So opfern Sie im Wesentlichen nicht die Lieferkette eines anderen.

Alexander Backus: Genau, Sie möchten keine Versuchskaninchen. Aber das ist in unserem Fall ein Huhn-und-Ei-Problem, denn dann benötigen Sie ein sehr genaues Modell der Realität. Und wenn Sie das haben, haben Sie das Problem bereits gelöst. Sie benötigen also eine Lieferkette, um das zu tun, und das möchten Sie nicht tun. Sie benötigen ein Modell Ihrer Lieferkette. Wenn Sie das haben, sollten Sie nicht trainieren müssen und Sie sollten bereits in der Lage sein, die Gelegenheit herauszufinden. Zurück zu unserem Ausgangspunkt.

Ja, aber es gibt heutzutage eine vielversprechende Richtung, bei der man aus historischen Daten lernt. Es nennt sich offline reinforcement learning, bei dem man im Grunde aus historischen Entscheidungen lernt, die getroffen wurden. Auch wenn sie nicht so schön verteilt sind, wie man es gerne hätte, ist es dennoch möglich, Algorithmen auf der Grundlage von realen Daten zu trainieren, die zuvor gesammelt wurden.

Nicole Zint: Wie ein Ausgangspunkt?

Alexander Backus: Ja, wie ein Ausgangspunkt. Und von dort aus können Sie dann ohne Opferung Ihrer Vorräte zu mehr Online-Einstellungen übergehen oder es offline trainieren, bevor Sie es in Chargen freigeben. Es gibt mehrere Möglichkeiten, aber das bringt auch seine eigenen Herausforderungen mit sich. Joannes, wie siehst du das, was Alexander gerade beschrieben hat: offline starten, aus früheren Daten lernen und dann im Wesentlichen umgeht die Maschine dieses Huhn-und-Ei-Problem, wird gut genug, um auf eine reale Lieferkette angewendet zu werden, hat daher mehr reale Daten zur Verfügung, mit denen gearbeitet werden kann, und geht von dort aus weiter? Wie siehst du das?

Joannes Vermorel: Dateneffizienz ist fast immer ein Anliegen für jeden maschinellen Lernalgorithmus in der Lieferkette, weil Sie nie den Luxus haben, eine riesige Menge an Daten zu haben, zumindest nicht in der Granularität, in der die Entscheidungen getroffen werden müssen. Bei Entscheidungen in der Lieferkette müssen sie in der Regel auf der SKU-Ebene getroffen werden. Und aufgrund der Tatsache, dass es zu Chargenbildung kommt, selbst wenn wir uns die SKU in einem Geschäft ansehen, wird es nicht Millionen von Einheiten pro Tag sein. Und wenn wir uns die SKU in einer Fabrik ansehen, dann wird es große Chargen geben und es wird Chargen von, sagen wir, 10.000 Einheiten sein. Und auch hier wird es nicht Millionen von Chargen pro Tag geben. Die Menge an relevanten Beobachtungen ist also immer noch relativ begrenzt.

Das ist ein Aspekt, der für das verstärkte Lernen immer eine Herausforderung darstellt, weil wir nicht so viele Daten haben. Ein Simulator ist von sehr großem Interesse, aber das war auch ein Punkt, den ich in einem meiner Vorträge kurz angesprochen habe. Im Wesentlichen besteht eine Dualität zwischen einer probabilistischen Prognose und einem Simulator. Wenn Sie eine probabilistische Prognose haben, können Sie immer Beobachtungen sampeln und somit Ihren Simulator aus Ihrer probabilistischen Prognose erhalten. Und wenn Sie einen Simulator haben, können Sie einfach viele Simulationen durchführen und die entsprechenden Wahrscheinlichkeiten berechnen, und Sie sind wieder bei Ihrer probabilistischen Prognose. Es gibt also eine sehr starke Dualität.

Ja, das ist interessant, aber das setzt voraus, dass man eine sehr genaue probabilistische Prognose hat, was sehr herausfordernd ist.

Nicole Zint: Die teilweise Beobachtbarkeit ist eine besonders schwierige Nuss zu knacken, denn wenn Sie einen Datensatz nehmen, sagen wir zum Beispiel, Sie möchten Preisbewegungen untersuchen. Das Unternehmen könnte in den letzten zehn Jahren auf eine bestimmte Weise operiert haben, bei der sie Preisbewegungen nicht zufällig durchgeführt haben; sie hatten sehr starke Gewohnheiten. Manchmal sind die Gewohnheiten so stark, dass es Probleme gibt, wenn es darum geht, die eigentliche Ursache von etwas zu unterscheiden.

Joannes Vermorel: Was ist, wenn das Unternehmen jedes Jahr Ende Januar beschließt, den ersten Jahresanfangsverkauf zu haben? Sie haben eine Praxis, bei der sie Ende Januar große Rabatte auf eine große Vielfalt von Produkten gewähren, was Sie als Nachfrageanstieg am Ende des Monats beobachten werden. Aber was ist der Effekt der Saisonalität? Würden sie auch ohne die Rabatte einen Nachfrageanstieg am Ende des Monats beobachten? Und wie hoch ist der Anteil des Einflusses, der nur von den Rabatten kommt?

Alexander Backus: Das ist das Problem, in der Tat. Die Entscheidungen wurden nicht zufällig getroffen, und daher spiegelt das, was Sie beobachten, ziemlich umfassend die üblichen Praktiken wider. Eine Möglichkeit im verstärkten Lernen, damit umzugehen, besteht darin, eine Mischung aus Exploration und Ausbeutung einzuführen. Ausbeutung bedeutet, dass Sie das Beste aus dem machen, was Sie beobachtet haben, basierend auf dem, was Sie beobachtet haben, und Exploration bedeutet, dass Sie etwas Neues ausprobieren, aber in der Erwartung, dass es aufgrund der teilweisen Zufälligkeit unterlegen sein wird.

Joannes Vermorel: Warum sollten Sie also jemals etwas ausprobieren, von dem Sie wissen, dass es höchstwahrscheinlich unterlegen sein wird? Die Antwort ist, nun, weil es die einzige Möglichkeit ist, letztendlich etwas zu entdecken, das sich als überlegen erweist. Das ist die Idee des Opferns, im Wesentlichen ist es eine Investition in Forschung und Entwicklung. Und das könnte etwas sein, das tatsächlich Formen annehmen kann, die sehr banal sind. Es könnte zum Beispiel so sein, dass Sie in einem Geschäft Kerzen verkaufen.

Alexander Backus: Und Sie stellen fest, was wäre, wenn Sie versuchen würden, dieselben Kerzen, aber zu einem viermal höheren oder viermal niedrigeren Preis zu verkaufen? Beide Optionen können gültig sein. Vielleicht, wenn Sie eine sehr große Bestellung bei einem Ihrer Lieferanten aufgeben und die Menge stark erhöhen, könnten Sie potenziell den Preis eines Grundprodukts stark senken. Ich nehme absichtlich eine Kerze, also könnten Sie einen viel niedrigeren Preis haben, und vielleicht würden Sie die beobachtete Nachfrage um das 10-fache multiplizieren.

Joannes Vermorel: Das wäre ein lohnender Kompromiss. Oder gehen Sie einen ganz anderen Weg und sagen: “Ich werde etwas wählen, das viel hochwertiger ist, Geschmack oder Duft hinzufügen und etwas anderes, bessere Verpackung, und den Preis um das Vierfache erhöhen.” Anstatt nur ein Zehntel der Nachfrage zu haben, die ich früher hatte, habe ich immer noch die Hälfte der Nachfrage, aber für ein Produkt, das einen viel höheren Preis hat.

Alexander Backus: Wenn wir uns jedoch die Geschichte anschauen, ist höchstwahrscheinlich die Variation, die wir beobachtet haben, im Vergleich zur Baseline nur geringfügig. Unsere Geschichte umfasst nicht diese verrückteren Szenarien, wenn Sie so wollen.

Joannes Vermorel: Ja, und noch einmal, es kann darum gehen, was passiert, wenn Sie ein Produkt nehmen und sagen: “Ich führe fünf Varianten in fünf verschiedenen Farben ein.”

Nicole Zint: Sie wissen, wie hoch der Kannibalisierungsgrad sein wird, den ich beobachten werde, oder ob ich tatsächlich neue Märkte erschließe? Wenn ich zum Beispiel Kerzen nehme und sage, dass ich mehrere Farben für Kerzen einführen werde, in welchem Maße werden sich diese Kerzen in verschiedenen Farben gegenseitig kannibalisieren, und in welchem Maße werde ich tatsächlich völlig neue Nachfrage erfüllen?

Joannes Vermorel: Ich weiß es nicht, und vielleicht gibt mir dieser Recorder einen kleinen Einblick. Aber in großem Umfang sehen wir in der Regel, dass, sobald Unternehmen anfangen, eine Art maschinengesteuerte Zufälligkeit einzuführen, es sehr wenig Zufälligkeit gibt. Es handelt sich viel mehr um Gewohnheitsmuster. Und wiederum hängt es auch davon ab, wie diese Unternehmen arbeiten. Wenn zum Beispiel eine Preisentscheidung ansteht, ist es in der Regel nicht nur eine Person, die auf die Idee gekommen ist. Es steckt eine Methode dahinter, und die Leute wurden darauf trainiert zu sagen: “In dieser Art von Situation sollten Sie das Produkt rabattieren, weil es die übliche Praxis ist und Sinn macht.” Das ist in Ordnung, aber es bedeutet auch, dass die meisten Preisvariationen, die Sie in den historischen Daten beobachten, immer einer kleinen Anzahl von Mustern folgen, die genau die Methoden sind, die vorhanden sind.

Alexander Backus: Aber sicherlich ist das dennoch ein guter Ausgangspunkt. Wenn, wie Sie erwähnt haben, was machen Sie sonst? Entweder opfern Sie eine Lieferkette oder Sie erstellen eine großartige Simulation, aber das basiert auch auf der Idee, dass Sie gute Daten haben, auf die Sie zurückgreifen können. Aber wie ich bereits erwähnt habe, wenn wir es auf eine Offline-Weise tun, dass wir unsere vorhandene Verkaufshistorie oder die Daten, die wir haben, betrachten, obwohl es diesen Nachteil geben kann, dass wir diese enorme Abweichung von der Norm nicht sehen könnten, um die verschiedenen Konsequenzen davon zu beobachten, ist das Ihrer Meinung nach dennoch der richtige Ausgangspunkt?

Joannes Vermorel: Ich glaube, der richtige Ausgangspunkt ist etwas anders. Der richtige Ausgangspunkt besteht darin, zunächst anzuerkennen, dass Feedbackschleifen grundlegend sind. Wenn wir anerkennen, dass diese Feedbackschleifen real sind und wir sie angehen wollen, handelt es sich um eine Veränderung des Paradigmas in der Art und Weise, wie wir die Prognose selbst angehen. Das ist ein echter Ausgangspunkt. Der Rest sind technische Details. Es gibt viele Modelle. Die einfachsten Modelle des verstärkenden Lernens, wie Banditen, können unglaublich einfach sein. Einige sind unglaublich komplex, aber das sind technische Details. Was ich in realen Supply Chains beobachtet habe, ist, dass die größte Herausforderung darin besteht, tatsächlich damit anzufangen, etwas so Einfaches wie diese Feedbackschleifen zu akzeptieren, da dies tiefgreifende Auswirkungen auf die Prognosen selbst hat. Die Prognosen werden nie mehr dieselben sein, und ich sage nicht quantitativ. Ich sage in Bezug auf das Paradigma, Sie können diese Prognosen nicht mehr auf die gleiche Weise betrachten. Dies ist nicht einmal mehr dasselbe Objekt. Dies ist etwas von anderer Natur, und das ist sehr schwierig, weil die Frage, die ich normalerweise bekomme, lautet: “Wird meine Prognose genauer sein?” Eine der Herausforderungen besteht darin, dass, sobald wir uns diese Feedbackschleifen ansehen, wie messen Sie überhaupt die Genauigkeit, wenn Sie Feedbackschleifen haben? Das ist eine eigene Frage. Es ist eine schwierige Frage.

Alexander Backus: Ja, wenn ich daran anknüpfen kann, denke ich, wir haben über die technischen Herausforderungen und die Herausforderungen bei der Verfügbarkeit von Daten diskutiert. Aber ich stimme Joannes vollkommen zu, dass der Hauptgrund, warum es nicht in Unternehmensumgebungen angewendet oder übernommen wurde, auch darin besteht, dass es einen tiefgreifenden Einfluss auf Ihre Geschäftsprozesse hat. In dieser Art von theoretischer Umgebung…

Nicole Zint: Wer sind Ihrer Meinung nach die technologisch orientiertesten Akteure in der E-Commerce-Branche?

Joannes Vermorel: Der Trend ist, glaube ich, wenn ich mir die sehr aggressiv technologieorientierten Akteure anschaue, dass das dd.com, das Amazon.com, das Alibaba.com wären. Sie wissen schon, diese E-Commerce-Unternehmen, die ihrer Zeit voraus sind. Ja, sie sind wirklich spitze. Sie sind sehr, sehr effektiv.

Alexander Backus: Dem stimme ich zu. Diese Unternehmen sind definitiv führend in der Branche, wenn es um Technologie und Innovation geht.

Nicole Zint: Die Welt hat sich also im Laufe der Jahre stark verändert. Was denken Sie, Joannes, über die Welt, in der wir heute leben?

Joannes Vermorel: Nun, es ist nicht mehr so einfach wie früher. Die Welt entwickelt sich immer noch weiter, aber wir haben in den letzten Jahren viele Überraschungen erlebt. Es ist klar, dass wir nicht am Ende der Geschichte angekommen sind, wo alles vorhersehbar ist. Die Welt ist chaotisch, und wir müssen die Unsicherheit und Komplexität von Menschen, Maschinen und Prozessen in Lieferketten akzeptieren. Wir können keine vollständige Kontrolle haben, daher ist mein Ansatz, ungefähr richtig zu sein, um alles zu erfassen, anstatt genau falsch zu sein.

Nicole Zint: Das ist eine wirklich interessante Sichtweise. Und was ist mit Ihnen, Alexander? Wonach suchen Sie, wenn Sie neue Mitarbeiter für Ihr Team gewinnen möchten?

Alexander Backus: Bei IKEA sind wir immer auf der Suche nach talentierten Data-Science-Fachleuten, um Herausforderungen in einem großen Unternehmen zu lösen. Wir haben viele Daten und das Potenzial, globalen Einfluss zu nehmen, daher müssen wir den Status quo in Frage stellen.

Nicole Zint: Vielen Dank für Ihre Einblicke. Es war uns eine Freude, Sie heute bei uns zu haben.

Joannes Vermorel: Ja, vielen Dank.

Alexander Backus: Danke, dass Sie mich eingeladen haben.