00:00:07 Einführung in das Thema maschinelles Lernen in der Supply Chain Industrie.
00:00:46 Vorstellung des Gastes Alexander Backus, der Daten- und Analyseleiter bei IKEA ist.
00:02:20 Erklärung des Konzepts der sich selbst erfüllenden Prophezeiung.
00:03:03 Diskussion darüber, wie eine sich selbst erfüllende Prophezeiung die Supply Chain beeinflusst, wie zum Beispiel Geschäftsziele und den Einfluss von Nachfrage und Angebot.
00:07:14 Erklärung, wie Feedbackschleifen in der Supply Chain die Welt komplexer machen und wie ein Überschuss eines bestimmten Produkts dessen Verkauf beeinflussen kann.
00:08:53 Diskussion über Feedbackschleifen in Supply Chains und den Einfluss menschlichen Verhaltens auf sie.
00:10:41 Verwendung von Verkaufsdaten in der Nachfrageprognose und die möglichen Folgen eines naiven Ansatzes.
00:13:08 Null-Prognose-Problem in maschinellen Lernsystemen und der Peitscheneffekt.
00:15:17 Erklärung des Stock-out-Bias und Techniken zu dessen Bewältigung.
00:17:22 Diskussion über die Häufigkeit von Stock-outs und die Wirksamkeit der Methode zur Bewältigung des Stock-out-Bias.
00:18:15 Erklärung, wie die Wahrnehmung eines Produkts durch den Kunden die Nachfrage beeinflussen kann und die Auswirkungen von Lagerbeständen auf den Verkauf.
00:20:17 Erklärung von Verlustmaskierung und ihrem Zweck.
00:20:26 Erklärung, wie die Bereitstellung von Lagerbestandsdaten für das Modell dazu beitragen kann, den Einfluss von Lagerbestandsschwankungen auf den Verkauf zu verstehen.
00:22:14 Diskussion über die Grenzen der Verwendung eines maschinellen Lernmodells für kausale Inferenz und die Auswirkungen von Störvariablen.
00:25:54 Erklärung, wie probabilistische Prognosen dazu beitragen können, die Auswirkungen von Null-Prognosen zu reduzieren, indem die “Unschärfe” der verfügbaren Informationen anerkannt wird.
00:27:04 Erklärung der Vorteile der Verwendung eines probabilistischen Prognosemodells.
00:28:44 Vorteile der Verwendung eines probabilistischen Prognosemodells gegenüber einer Punktprognose.
00:30:42 Feedbackschleifen und wie sie die Prognose beeinflussen.
00:34:35 Wie Preise die Prognose beeinflussen können.
00:36:32 Erklärung von partieller Beobachtbarkeit und ihrer Herausforderung bei der Erstellung eines Modells für das Supply Chain Management.
00:37:04 Vergleich mit dem Konzept des Bandit-Feedbacks und seiner bekannten Anwendung in E-Commerce-Empfehlungssystemen.
00:37:17 Diskussion über die Grenzen des überwachten Lernens bei der Vorhersage der Auswirkungen von Entscheidungen im Supply Chain Management.
00:38:01 Erklärung des auf Richtlinien basierenden Verstärkungslernalgorithmus.
00:41:06 Diskussion über die Herausforderungen bei der Anwendung des Verstärkungslernalgorithmus auf das reale Supply Chain Management und die Lösung des Starts mit Offline-Lernen aus historischen Daten.
00:44:55 Diskussion darüber, wie Gewohnheiten und vergangene Praktiken die Preisbewegungen in einem Unternehmen beeinflussen.
00:46:41 Erklärung von Ausbeutung und Exploration im Verstärkungslernen.
00:50:57 Die Notwendigkeit, Feedbackschleifen in der Prognose als Paradigmenwechsel anzuerkennen.
00:52:45 Die technischen und kulturellen Herausforderungen bei der Integration von KI in Geschäftsprozesse.
00:53:57 Diskussion über die Herausforderungen bei der Modellierung und Entscheidungsfindung in der Supply Chain Industrie.
00:54:55 Anerkennung der Existenz von Feedbackschleifen im Supply Chain Prozess.
00:55:06 Bewegung hin zu einem entscheidungsbasierten Ansatz anstelle eines prognosebasierten Ansatzes.
00:57:27 Der Trend in der Supply Chain Industrie, insbesondere bei großen E-Commerce-Unternehmen.
01:01:03 Welche Qualitäten werden gesucht, wenn neue Leute eingestellt werden, um an den Herausforderungen der Supply Chain bei IKEA zu arbeiten.

Zusammenfassung

In einem von Nicole Zint moderierten Interview diskutieren Joannes Vermorel, Gründer von Lokad, und Alexander Backus, Data and Analytics Leader bei IKEA, die Anwendung von Maschinellem Lernen und KI in der Supply Chain Industrie. Das Interview hebt die Auswirkungen von sich selbst erfüllenden Prophezeiungen und Feedbackschleifen auf das Supply Chain Management hervor und betont die Herausforderungen bei der Nutzung von Maschinellem Lernen Modellen in der Prognose. Das Interview untersucht auch Ansätze zur Vermeidung des Null-Prognose-Problems, wie die Verwendung von probabilistischer Prognose, und die Bedeutung der Anerkennung von Unsicherheit in der Supply Chain Prognose. Die Diskussionsteilnehmer betonen die Notwendigkeit, Unsicherheit zu akzeptieren, sich auf Entscheidungsmodelle zu bewegen und Veränderungen schrittweise einzuführen, um das Supply Chain Management zu verbessern.

Erweiterte Zusammenfassung

In diesem Interview moderiert Nicole Zint eine Diskussion zwischen Joannes Vermorel, Gründer von Lokad, und Alexander Backus, Data and Analytics Leader bei IKEA, über die Anwendung von Maschinellem Lernen und KI in der Supply Chain Industrie. Sie diskutieren das Konzept der sich selbst erfüllenden Prophezeiung und deren potenziellen Auswirkungen auf Supply Chains, die Rolle von Feedbackschleifen und die Herausforderungen bei der Nutzung von Maschinellem Lernen Modellen in der Prognose.

Eine sich selbst erfüllende Prophezeiung ist eine Vorhersage, die sich direkt oder indirekt durch die Rückkopplung zwischen Glauben und Verhalten selbst erfüllt. Im Supply Chain Management können Prognosen die Entscheidungsprozesse beeinflussen und letztendlich die Zukunft verändern. Vermorel weist darauf hin, dass sich selbst erfüllende Prophezeiungen nicht grundsätzlich gut oder schlecht sind; sie machen die Situation einfach komplexer.

Feedbackschleifen sind in Supply Chains weit verbreitet, da Menschen auf Prognosen reagieren, die dann zukünftige Vorhersagen beeinflussen können. Vermorel zeigt auf, wie sich diese Schleifen auf verschiedene Weisen manifestieren können, wie zum Beispiel durch die Anpassung von Preisen oder Produktplatzierungen basierend auf Lagerbeständen. Er merkt auch an, dass Wettbewerber ihre Strategien als Reaktion auf die Prognosen eines Unternehmens ändern können, was zusätzliche Feedbackschleifen erzeugt.

Backus erklärt, dass Verkaufsdaten ein wichtiger Input für Maschinelles Lernen Modelle in der Prognose sind, aber Verkäufe sind nicht dasselbe wie Nachfrage. Verkaufsdaten können durch Angebot und andere Faktoren beeinflusst werden, während die Nachfrage eine nicht beobachtete Größe ist, die abgeleitet werden muss. Er betont die Wichtigkeit, zwischen den beiden zu unterscheiden und ihr Zusammenspiel im Prognoseprozess zu berücksichtigen.

Maschinelles Lernen Modelle können in der Supply Chain Prognose problematisch sein, wenn sie nicht darauf ausgelegt sind, Feedbackschleifen und sich selbst erfüllende Prophezeiungen zu berücksichtigen. Backus erwähnt den “Bullwhip-Effekt”, bei dem kleine Abweichungen in der Supply Chain durch das System verstärkt werden können. Dies kann zu schädlichen Auswirkungen führen, wie zum Beispiel spiralförmigen Verkäufen oder ungenauen Vorhersagen. Er stellt das Vorhersagen des Wetters, das nicht von menschlichem Verhalten beeinflusst wird, dem Vorhersagen von Geschäftsergebnissen gegenüber, die diesen komplexen Feedbackschleifen unterliegen.

Um die Herausforderungen von Feedbackschleifen und sich selbst erfüllenden Prophezeiungen zu mildern, schlägt Vermorel vor, dass Unternehmen die Komplexität von Supply Chain Systemen anerkennen und erkennen sollten, dass Punktprognosen möglicherweise unzureichend sind. Stattdessen sollten sie versuchen, die potenziellen Auswirkungen ihrer Prognosen auf menschliches Verhalten und Entscheidungsprozesse zu verstehen und zu antizipieren.

Zusammenfassend untersucht das Interview die Feinheiten des Einsatzes von Maschinellem Lernen und KI in der Supply Chain Management, und betont die Wichtigkeit des Verständnisses von sich selbst erfüllenden Prophezeiungen und Feedbackschleifen zur Verbesserung der Prognosegenauigkeit und Entscheidungsfindung.

Das Problem der Null-Prognose tritt auf, wenn ein System aufgrund eines wahrgenommenen Nachfragerückgangs weniger Bestand bestellt, was dazu führt, dass die Nachfrage weiter sinkt und zu einem kontinuierlichen Rückgang der Bestellungen führt. Um dieses Problem zu vermeiden, schlägt Vermorel vor, die Fehlbestand Verzerrung zu entfernen, indem die in dem Prognosemodell verwendete Metrik geändert wird. Ein Ansatz besteht darin, die Messungen an Tagen mit Fehlbeständen auf null zu setzen. Diese Methode funktioniert gut, wenn Fehlbestände relativ selten sind, ist jedoch weniger effektiv in Branchen mit hohen Fehlbestandsraten.

Ein anderer Ansatz besteht darin, dem Maschinelles Lernen Modell Zugang zu historischen und zukünftigen Lagerbestandsdaten zu geben, damit es den Effekt von Lagerbestandsschwankungen auf zukünftige Verkäufe oder Nachfrage lernen kann. Diese Methode erfordert, dass alle Entscheidungen und Faktoren, die die Nachfrage beeinflussen, wie Promotionen, Preisgestaltung, Kapazität, Lagerhaus Einschränkungen und Marktkräfte, in das Prognosemodell einfließen.

Allerdings warnt Backus, dass die Verwendung eines Standard-Maschinelles Lernen Modells ohne alle notwendigen Informationen zu Fehlern führen kann, wie zum Beispiel die Verwechslung von Ursache und Wirkung von Lagerbestandsänderungen und Nachfrageschwankungen. Um diese Probleme zu vermeiden, schlägt er die Verwendung von probabilistischer Prognose vor, die die Unschärfe der verfügbaren Informationen anerkennt und vermeidet, auf eine absolute Sicherheit in der Nachfrage von null zu konvergieren.

Probabilistische Prognose verteilt Wahrscheinlichkeiten über viele Werte, was es schwieriger macht, auf eine absolute Sicherheit in der Nullnachfrage zu konvergieren. Dieser Ansatz vermeidet, dass der Bestand bei null einfriert, indem er Nicht-Null-Wahrscheinlichkeiten für die zukünftige Nachfrage schätzt. Er berücksichtigt auch die Asymmetrie zwischen der Bedienung eines Kunden und dem Halten von zusätzlichem Bestand für einen zusätzlichen Tag, und bevorzugt höhere Service Levels.

Trotz seiner Vorteile ist die probabilistische Prognose keine perfekte Lösung. Sie kann die zukünftige Nachfrage immer noch unterschätzen, wenn es wiederholt zu Fehlbeständen kommt. Sie bietet jedoch eine robustere Methode zur Bestandsverwaltung und zur Vermeidung des Problems der Null-Prognose.

Abschließend können die Anwendung von Maschinellem Lernen Techniken und probabilistischer Prognose den Supply Chain Fachleuten helfen, die Nachfrage besser vorherzusagen und Bestandskontrolle zu verwalten. Indem sie verschiedene Faktoren berücksichtigen, die die Nachfrage beeinflussen, und die Unsicherheiten in den verfügbaren Daten berücksichtigen, können Unternehmen fundiertere Entscheidungen treffen und ihre Supply Chain Leistung verbessern.

Joannes Vermorel betonte die Wichtigkeit, Unsicherheit in der Supply Chain Prognose anzuerkennen, da eine perfekte Modellierung zukünftiger Ereignisse unrealistisch ist. Er diskutierte das Konzept der probabilistischen Prognose, die die inhärente Unsicherheit von Supply Chain Ereignissen widerspiegelt, und wie sie sich von Punktprognosen unterscheidet. Probabilistische Prognosen, erklärte er, beinhalten Wahrscheinlichkeitsverteilungen, die die Zukunft sehr anders aussehen lassen als die Vergangenheit. Er sprach auch Feedbackschleifen als eine zusätzliche Dimension an, um Prognosen zu bereichern, indem sie dynamisch gemacht und von zukünftigem Verhalten abhängig gemacht werden.

Alexander Backus stimmte Vermorels Punkten zu und erläuterte, wie das Zugänglichmachen von Modellen für frühere Entscheidungen, wie zum Beispiel Preisgestaltung, Probleme mit der Prognose mildern kann. Er führte das Konzept der partiellen Beobachtbarkeit ein, das nur die Beobachtung der Auswirkung einer Entscheidung ohne Kenntnis des Kontrafaktischen beinhaltet. Um die Auswirkungen von Entscheidungen besser vorherzusagen, schlug Backus vor, Maschinelles Lernen Probleme so umzuformulieren, dass sie optimale Entscheidungen statt Vorhersagen über die Zukunft ausgeben. Dieser Ansatz wird als Verstärkungslernen bezeichnet.

Die Diskussion dreht sich um die Herausforderungen der Prognose und Entscheidungsfindung im Supply Chain Management aufgrund von Feedbackschleifen, begrenzten Daten und nicht-zufälligen Entscheidungen. Sie betonen die Notwendigkeit, diese Feedbackschleifen zu akzeptieren und sich auf ein Modell zu bewegen, das Entscheidungen statt Prognosen ausgibt. Der Trend bei technologieorientierten Unternehmen wie Amazon und Alibaba besteht darin, die Idee einer perfekten Prognose aufzugeben und sich auf die Entscheidungsfindung zu konzentrieren. Trotz bestehender Herausforderungen stimmen die Diskussionsteilnehmer darin überein, dass die Branche daran arbeiten sollte, diese Änderungen schrittweise einzuführen, um das Supply Chain Management zu verbessern.

Vermorel betont die Wichtigkeit, Unsicherheit zu akzeptieren und die unvermeidliche Komplexität von Supply Chains, die aus Menschen, Maschinen und Prozessen bestehen, anzuerkennen. Er setzt sich dafür ein, ungefähr richtig statt genau falsch zu sein. Backus betont die Notwendigkeit von großartigem Data Science Talent, um Herausforderungen in großen Unternehmen wie IKEA zu bewältigen, und betont das Potenzial für globale Auswirkungen und die Wichtigkeit, den Status quo in Frage zu stellen.

Vollständiges Transkript

Nicole Zint: Willkommen Alexander Backus bei uns hier heute in unseren Büros. Alexander ist ein Experte auf diesem Gebiet und ist der Daten- und Analyseleiter bei IKEA. Also, wie immer, möchten wir damit beginnen, unseren Gästen die Möglichkeit zur Selbstvorstellung zu geben. Alexander, wenn Sie möchten, haben Sie das Wort.

Alexander Backus: Danke, Nicole. Danke, dass Sie mich hier haben. Es ist toll, hier in Paris bei Ihnen zu sein. Mein Name ist Alexander Backus und ich leite die Datenanalyse im Bereich Bestands- und Logistikoperationen der IKEA Inka Group Digital. Ich leite eine Gruppe von Datenwissenschaftlern, Dateningenieuren und Datenanalysten, die in funktionsübergreifenden Produktteams arbeiten, um die Planung von Bestandslogistikoperationen zu optimieren. Ich habe einen Hintergrund in Datenwissenschaft und habe als Berater für große Unternehmen wie KLM Airlines, Heineken, Vodafone Ziggo und ING Bank gearbeitet. Nach einem PGD in Kognitiver Neurowissenschaft denke ich, dass die Arbeit in der Supply Chain als Datenwissenschaftler ein wirklich spannendes Feld ist, weil es viele günstige Bedingungen für die Datenwissenschaft kombiniert. Es gibt viele Daten, es hat Auswirkungen auf die Entscheidungsfindung in der realen Welt, also ist es etwas Greifbares, und Sie beeinflussen nicht nur die Gewinnspanne, sondern helfen auch, eine nachhaltigere Welt zu schaffen, indem Sie Abfall in der Supply Chain reduzieren. So bin ich hier gelandet.

Nicole Zint: Bevor wir uns diesen Themen widmen, lassen Sie uns zuerst das Konzept erklären, über das wir diskutieren werden. Lassen Sie uns einfach anfangen: Was ist eine sich selbst erfüllende Prophezeiung?

Alexander Backus: Die Idee ist, dass die Prognose, die Sie machen, um Ihren Geschäftsprozess zu optimieren, tatsächlich einen bestimmten Entscheidungsprozess beeinflusst. Es wird eine Entscheidung getroffen, die auf Ihrer Prognose basiert, zumindest ist das das, was Sie wollen. Wenn das passiert, bedeutet das, dass Ihre Prognose selbst die Zukunft verändert und auch die Daten verändert, die beim nächsten Mal zur Prognose verwendet werden. Dies kann bestimmte Herausforderungen darstellen. Im Grunde genommen ist eine sich selbst erfüllende Prophezeiung, wenn eine Vorhersage eintritt, weil sie vorhergesagt wurde. Also beeinflussen Sie die Zukunft, weil Sie dachten, sie würde auf eine bestimmte Weise sein. Sie beeinflussen nicht nur die Zukunft, sondern schaffen auch eine Realität, in der die Prognose zur Wahrheit wird, und das kann auf verschiedene Weisen geschehen. Zum Beispiel, wenn Sie eine Prognose für Ihr Geschäft oder Ihren Verkauf haben, dann kann dies zum Ziel für Ihr Geschäft werden.

Nicole Zint: Also treffen Marketing-Leute bestimmte Entscheidungen, sie sagen, okay, wir sollten dieses Ziel erreichen, weil wir jetzt ein bisschen niedrig sind, also müssen wir ein bisschen mehr verkaufen und wir müssen einige Aktionen machen. Also ist die Prognose, die Sie gemacht haben, tatsächlich das Ziel geworden, das zu Entscheidungen auf dem Weg geführt hat, die das Endergebnis des Verkaufs in diesem Beispiel beeinflussen. Und das kann auf viele Arten passieren. Ein weiteres Beispiel ist, wo Sie eine bestimmte Prognose haben, die dazu führt, dass Sie eine bestimmte Lieferkapazität oder Kommissionierkapazität in Ihren Lagern sichern, und das hat Auswirkungen auf die Durchlaufzeit. Wenn also ein Kunde auf Ihrer E-Commerce-Website schaut und sieht, dass die Durchlaufzeit sehr hoch oder sehr niedrig ist, kann es in beide Richtungen gehen; das beeinflusst tatsächlich die Nachfrage der Kunden.

Alexander Backus: Genau, also beeinflusst die Nachfrage Ihr Angebot und das Angebot beeinflusst die Nachfrage. Es kann in beide Richtungen gehen, und das ist eigentlich dieser Effekt, auf den Sie, Joannes, hinweisen. Wenn es um die Prognosen geht, die Geschäftsziele werden, wie sehen Sie das, wie beeinflusst das das Geschäft selbst? Was sind die Nachteile, wenn die Prognose etwas ist, das die Leute erreichen wollen, anstatt tatsächlich auf ihre Supply Chain-Leistung zu schauen?

Joannes Vermorel: Es gibt keine Nachteile an sich. Es ist eher eine Frage, dass dies die Art und Weise ist, wie die Supply Chain funktioniert. Sie wissen, Feedback-Schleifen sind überall. Wir haben es im Grunde mit menschlichen Angelegenheiten zu tun, wo es Praktiker überrascht, dass in vielen Ingenieurschulen und sogar in vielen Unternehmen die Leute die Prognose so angehen, wie sie die Prognose der Bewegung der Planeten angehen, etwas, wo Sie einen sehr sauberen Rahmen haben, wo Sie vergangene Beobachtungen haben, und Sie können eine Aussage über die zukünftige Position des Planeten machen. Aber Sie, als der Prognostiker, haben überhaupt keinen Einfluss auf diese beobachteten Elemente, wie die Planeten.

Nicole Zint: Also meinen Sie, dass eine sich selbst erfüllende Prophezeiung nicht unbedingt gut oder schlecht ist, sie ist einfach da?

Joannes Vermorel: Ja, genau. Man kann nicht so tun, als ob es keinen Einfluss hätte, aber es macht die Situation sicherlich komplexer und komplizierter, eigentlich ein bisschen von beidem. Und so, wo es ein bisschen verwirrend wird, ist, dass viele Unternehmen Schwierigkeiten haben, sich mit etwas abzufinden, das nicht eine Punktprognose oder Punktprognose ist. Sagen Sie, Sie haben eine Zukunft; das ist es. Und es ist im Grunde etwas, das völlig symmetrisch zur Vergangenheit ist. Sie haben Ihre vergangene Beobachtung, und Sie möchten eine Zukunft haben, die genauso sauber und ordentlich ist wie die Vergangenheit, im Grunde mehr vom Gleichen.

Nicole Zint: Ja, mehr vom Gleichen, aber auch wirklich von der gleichen Art. Also haben Sie eine perfekt klare Sicht auf die Vergangenheit und eine perfekt klare Sicht auf die Zukunft. Und übrigens, im Falle der Bewegung der Planeten, solange Sie nicht Millionen von Jahren vorausschauen, können Sie eine völlig perfekte Sicht auf die Position dieser Planeten in einem Jahrhundert haben.

Joannes Vermorel: Jetzt, wo es interessant wird, ist, dass Sie in der Supply Chain überall Feedback-Schleifen haben. Immer wenn Sie sich zu einem Produkt bekennen, indem Sie viel kaufen, dann schaffen Sie tatsächlich eine Erwartung, und die Leute haben das Gefühl, dass sie das Produkt verkaufen müssen, und sie werden alles tun, damit das Unternehmen nicht mit massiven Überbeständen zurückbleibt, die sie nicht loswerden konnten. Sie werden sich so organisieren, dass sich dieses massive Angebot in massive Verkäufe verwandelt, oder zumindest werden sie das versuchen. Sie passen den Preis an, je nachdem, wie viel sie auf Lager haben, oder manchmal sind es Dinge, die noch alltäglicher sind. Wenn es Geschäfte gibt, wenn Sie

Nicole Zint: In eine etwas andere Richtung, nur um eine größere Differenzierung zu schaffen, sehen Sie diese Feedback-Schleifen, sie sind überall und sie sind nicht schlecht. Sie sind einfach vorhanden, und wieder ist der Hauptgrund, dass wir in der Mitte Menschen haben, die denken und handeln können, basierend auf diesen Verbesserungen über die Zukunft. Also immer wenn Menschen in der Schleife sind, immer wenn Sie eine Aussage über die Zukunft machen, werden die Menschen entsprechend diesen Aussagen reagieren. Supply Chains sind sehr komplex, so dass diese Reaktionen viele Formen annehmen können. Aber alle Supply Chains haben gemeinsam, dass sie viele Menschen haben, und manchmal nimmt die Feedback-Schleife zum Beispiel auch die Form einer Ankündigung eines Mangels an etwas an. Dann stürzen sich die Leute darauf, dieses Etwas zu kaufen, und so können Sie einen vom Menschen verursachten Mangel haben, einfach weil es ein psychologischer Effekt ist.

Joannes Vermorel: Genau. Und die Idee, dass Sie, wenn Sie einen Mangel ankündigen, höchstwahrscheinlich einen Mangel verursachen werden, ist nichts Neues. Es ist relativ vorhersehbar, aber dennoch ist es schwierig, all diese Hinweise zu antizipieren, weil Sie plötzlich perfekt sein müssen. Ja, und plötzlich müssen Sie auf eine Weise das Psyche der Menschen modellieren, die mitten in der Supply Chain sind.

Nicole Zint: Joannes, Sie erwähnen immer wieder diese Feedback-Schleifen. Alexander, darf ich Sie fragen, welche tatsächlichen Daten in diese Systeme zurückgespeist werden, damit unsere Zuschauer es verstehen? Also, an welchem Punkt in der Supply Chain speisen wir die Daten zurück?

Alexander Backus: Gute Frage. Ich denke, eine sehr wichtige Quelle für jede Art von Prognose sind Ihre Verkaufsdaten, und das sind auch die Schlüsseldaten, die von den Effekten betroffen sind, über die wir gerade gesprochen haben. Wenn wir also zurückgehen zu dem, was Joannes erklärt hat, der naive Ansatz zur Nachfrageprognose oder zur Geschäftsprognose im Allgemeinen, ist, wo Sie ein überwachtes maschinelles Lernmodell nehmen und es als ein grundlegendes Regressionsproblem behandeln. Also sagen Sie: “Okay, ich werde diese Menge einfach auf der Grundlage von historischen Daten mit einem überwachten Lernalgorithmus vorhersagen.” Und dann, wenn Sie dieses Modell nehmen, das darauf trainiert ist, zukünftige Verkäufe vorherzusagen, und jetzt zurückdenken an die Beispiele für die Feedback-Schleifen, die wir besprochen haben, können Sie hier schädliche oder degenerierte Fälle haben. Also, wo Ihr Modell eine geringe Nachfrage oder geringe Verkäufe vorhersagt, seien wir sehr vorsichtig, die beiden nicht zu verwechseln, aber ignorieren wir für einen Moment, dass Verkäufe nicht Nachfrage sind.

Und so geraten Sie in eine Situation, in der Sie geringe Verkäufe vorhersagen, also auch eine geringe Kapazitätsplanung durchführen, und daher auch weniger verkaufen, und dann gehen Sie immer weiter runter, bis Sie bei null sind. Also das Modell wird anfangen zu lernen, dass die Nachfrage sinkt, aber sie sinkt. Und es kann auch andersherum gehen, tatsächlich. Also es kann auch in diesem Sinne nach oben spiralisieren.

Joannes Vermorel: Ja, es gibt diese schädlichen Auswirkungen, wenn Sie ein maschinelles Lernmodell verwenden, um aus der Geschichte zu lernen, um die Zukunft auf diese eher naive Weise vorherzusagen, die hier völlig falsch laufen kann.

Nicole Zint: Es klingt irgendwie wie ein Peitscheneffekt, bei dem ein Fehler in einer Supply Chain oder eine Abweichung von der Norm einfach vom System verstärkt wird. Und Sie haben auch die Tatsache erwähnt, dass Verkäufe nicht unbedingt Nachfrage sind, denn Sie könnten 50 Einheiten Ihres Bestands verkaufen, aber wenn die Nachfrage 100 war, wird trotzdem nur registriert, dass Ihre Verkäufe 50 sind. Diese Unterscheidung steht tatsächlich im Kern dieses Problems.

Alexander Backus: Ja, die Nachfrage selbst ist natürlich eine nicht beobachtete Menge. Sie können sie nicht messen, also müssen Sie sie ableiten. Und Verkaufsdaten sind das Nächste daran, aber das ist definitiv nicht das Ganze.

Nicole Zint: Also, wir diskutieren die Idee, dass produzierte Prognosen die Nachfrage und den Verkauf beeinflussen können und so eine Feedback-Schleife erzeugen. Einige haben den Unterschied zwischen der Vorhersage des Wetters und der Vorhersage des Geschäfts beschrieben, wobei die Vorhersage des Wetters es nicht beeinflusst, während die Vorhersage des Geschäfts es tatsächlich beeinflussen kann. Alexander, könnten Sie auf diese Feedback-Schleife eingehen und wie vermeiden wir das von Ihnen erwähnte Null-Prognose-Problem?

Alexander Backus: Sicher. Wenn ein maschinelles Lernmodell von seinen eigenen Ausgabedaten lernt, kann es Abweichungen von der Norm verstärken. Wenn die Nachfrage aus irgendeinem Grund ein wenig sinkt, kann das Modell dem System sagen, dass es weniger bestellen soll. Als Ergebnis sinkt die Nachfrage noch mehr, weil weniger bestellt wird, und das Modell schlägt dann vor, noch weniger zu bestellen, was zu einem Null-Prognose-Problem führt. Dieses Problem ist besonders häufig bei der Zeitreihen Prognose. Joannes, wie vermeiden wir dieses Problem mit maschinellen Lernsystemen?

Joannes Vermorel: Die Null-Prognose ist etwas, das Sie bekommen, wenn Sie den Ausverkaufsbias nicht entfernen, der ziemlich stark sein kann. Wenn Sie keinen Bestand mehr haben, beobachten Sie null Verkäufe, aber das bedeutet nicht, dass es keine Nachfrage gibt. Wir haben bei Lokad mindestens drei Techniken in Produktion, um mit dem Ausverkaufsbias umzugehen. Ein Ansatz besteht darin, die Metrik zu ändern, gegen die Sie Ihr Prognosemodell optimieren. Anstatt die Metrik gleichmäßig über die Zeit anzuwenden, nullen Sie die Messungen an Tagen, an denen Sie Ausverkäufe haben. Das ist ein grober Ansatz, aber er kann funktionieren.

Nicole Zint: Welche Metrik wird typischerweise zunächst verwendet, von der Sie vorschlagen, sie zu ändern?

Joannes Vermorel: Es gibt Tausende von Metriken, aber die einfachsten sind L1, L2 oder sogar MAPE. Die Frage ist, ob Sie die Metrik gleichmäßig über die Zeit anwenden. Die Antwort ist in der Regel nein, Sie wollen sie nicht gleichmäßig anwenden. Sie wollen Ihre Messungen an Tagen, an denen Sie Ausverkäufe haben, auf null setzen.

Nicole Zint: Also, auf null setzen bedeutet, den Beitrag eines Tages zu entfernen, an dem es einen Ausverkauf gab?

Joannes Vermorel: Ja, Sie entfernen den Beitrag eines Tages, an dem Sie wissen, dass Ihr Signal stark verzerrt ist. Es funktioniert gut, dieses Signal herauszuschneiden, aber es ist ein eher grober Ansatz.

Nicole Zint: Nicht, wenn Ihre Ausverkäufe sehr häufig vorkommen. Für viele Unternehmen sind Ausverkäufe statistisch relativ selten. Sie haben einen Servicelevel von 95% plus, daher funktioniert diese Methode gut, wenn Ausverkäufe eher die Ausnahme sind, ähnlich wie eine natürliche Katastrophe, die recht selten auftritt.

Joannes Vermorel: Nein, ich meine, sagen wir mal, ein allgemeines Warenhaus, Ihren Supermarkt. Sie haben jeden Tag einen Servicelevel von 95% plus, das ist in Ordnung. Wo es nicht funktionieren würde, wäre zum Beispiel ein Geschäft für harten Luxus. In diesem Fall hätte ein Geschäft für harten Luxus, um Ihnen eine Vorstellung zu geben, typischerweise sagen wir mal 500 Artikel aus einem Katalog von 5.000. Also haben Sie per Definition 90% plus Ausverkauf die ganze Zeit. In diesem Fall ist es nicht sehr sinnvoll. Also, Sie sehen, es hängt wirklich von der Branche ab. Es gibt Branchen wie zum Beispiel Lebensmittel, wo man sehr hohe Servicelevels erwartet. Ihr Sortiment ist auf Dinge ausgerichtet, die Sie haben sollen. Wenn Ihr Supermarkt normalerweise eine Packung Limonadenflaschen verkauft, sollten Sie mit dem Vertrauen in den Laden gehen können, dass Sie diese Einheiten finden werden. Manchmal werden Sie das nicht tun, aber diese Ereignisse werden selten sein. Also nochmal, es hängt von den Vertikalen ab, die Sie betrachten.

Nicole Zint: Okay, und im Grunde kann der Verkauf ein falsches Signal über die Nachfrage senden, wie Sie erklärt haben. Wenn es null Verkäufe gibt, kann schnell fälschlicherweise angenommen werden, dass dies null Nachfrage bedeutet, aber in Wirklichkeit könnte es daran liegen, dass Sie diesen Vorrat nicht haben. Tatsächlich gibt es dafür eine sehr hohe Nachfrage. Und dann ist auch das Gegenteil wahr. Wenn Sie für ein anderes Produkt, das zufällig ein guter Ersatz ist, einen Ausverkauf haben, dann können Sie den Verkauf eines Artikels steigen sehen, während es nur die Tatsache widerspiegelt, dass Sie bei etwas, das wie ein loser Ersatz ist, den Vorrat ausgehen lassen. Trotzdem könnte die Wahrnehmung des Kunden sein, dass es ein schlechter Service ist.

Joannes Vermorel: Ja, denn die Kunden könnten immer noch bereit sein, den Ersatz zu nehmen, könnten aber immer noch denken, dass es eine minderwertige Option ist. Also, was interessant ist, ist, dass man den Agenten, die Kunden, und was sie denken, berücksichtigen muss und versuchen muss, Ihre Modellierung der Nachfrage anzupassen, um die Art von Grundgedanken zu erfassen, die in Ihre Kundenbasis einfließen werden.

Nicole Zint: Wie vermeiden wir dieses Null-Prognose-Problem, so dass null Verkäufe nicht als null Nachfrage angenommen werden?

Alexander Backus: Jiran hat gerade erwähnt, dieses Signal einfach nicht zu berücksichtigen, um diese Tage einfach zu vermeiden. In technischen Begriffen nennt man das Verlustmaskierung.

Joannes Vermorel: Ja, Sie entfernen im Grunde den Beitrag dieses Datenpunkts. Eine weitere einfache Technik besteht darin, dem Modell Zugang zu historischen Lagerbeständen und vielleicht einigen zukünftigen Prognosen davon zu geben, damit Sie verstehen können, wie diese Verkäufe von den Lagerbeständen beeinflusst werden.

Alexander Backus: Das Modell kann dann lernen, welchen Einfluss bestimmte Schwankungen des Lagerbestands auf zukünftige Verkäufe oder die Nachfrage haben, wenn Sie es modellieren. Im Grunde genommen die Auswirkungen der Entscheidungen.

Joannes Vermorel: Ja, das ist, wohin jeder gehen will, wo Sie alle Entscheidungen, die auf Ihren vorherigen Prognosen basiert wurden, als Eingabe für Ihr Prognosemodell verwenden.

Nicole Zint: Wenn Sie es trainieren, sind das nicht nur Lagerentscheidungen, die den Lagerbestand beeinflussen, sondern es können auch Marketingentscheidungen sein, wie sogar ein Ziel, das vom Geschäftssteuerung gesetzt wurde. Sie sagen: “Hey, das ist, wie viel wir verkaufen wollen.” Das ist an sich schon eine Entscheidung, weil wir all diese Marktkräfte haben.

Alexander Backus: Ja, Marktkräfte. Sie fügen all das als Eingabe in die Prognose ein, wie zum Beispiel Aktionen, Preisdaten und Kapazitätsdaten. Die Kapazität kann auch die Nachfrage beeinflussen. Wenn die Lieferzeiten in die Höhe schnellen, suchen die Menschen nach Alternativen. Im Grunde genommen dienen alle Einschränkungen im Geschäft, in den Lagern und alles, was die Nachfrage beeinflussen kann, als Eingangssignale für Ihr Modell. Dann kann das Modell aus der Geschichte lernen, welchen Einfluss diese Signale auf die Nachfrage haben und daher dafür korrigieren.

Dies ist sozusagen Schritt zwei in Ihrer Modellierung, denn es gibt viele Dinge, auf die Sie hier achten müssen. Ein interessanter Nebenschritt ist, dass Geschäftsanwender Ihr Modell verwenden möchten, um das zu tun, was in technischen Begriffen als kausale Inferenz bezeichnet wird. Sie möchten Dinge wie “Was passiert, wenn wir diese Aktion durchführen oder wenn wir die Lagerbestände reduzieren? Was passiert mit der Nachfrage?” Es ist so etwas wie eine Simulation.

Damit das funktioniert, müssen Sie bei der Modellierung viel mehr Sorgfalt walten lassen. Wenn Sie es so machen, wie ich es erklärt habe, kann Ihr Modell leicht Effekte lernen, wie wenn der Lagerbestand niedrig ist, die Nachfrage hoch ist, nur weil eine Marketingkampagne, die die eigentliche Ursache ist, den Lagerbestand sinken und die Nachfrage steigen lässt. Es verwirrt das Konzept. Das nennt man einen Störfaktor oder eine umgekehrte Kausalität. Ein Standard-Machine-Learning-Modell, dem nicht alle benötigten Informationen gegeben werden, macht diesen Art von Fehler.

Ein klassisches Beispiel ist, wenn Sie versuchen vorherzusagen, ob es heißes Wetter geben wird. Sie können das anhand der Anzahl der Eisverkäufe vorhersagen. Nun, das ist natürlich ein typisches Beispiel für umgekehrte Kausalität. Aber vielleicht haben sie ihren Preis gesenkt oder hatten einen Ausverkauf, und das war der eigentliche Grund. Es gibt viele Möglichkeiten.

Aber Sie müssen vorsichtig sein. Dies ist ein Weg, um damit zu beginnen, Ihrem Modell mehr Informationen über die Entscheidungen zu geben, die darauf getroffen wurden, und sicherzustellen, dass es lernt, wie es sich verhält. Allerdings wird es für das Modell selbst immer noch ziemlich herausfordernd sein, diese Beziehungen zu lernen, insbesondere wenn es viele Zwischenschritte gibt, von denen Sie keine Daten haben. Wenn Sie eine Prognose abgeben, ist es nicht eins zu eins, dass jemand im Geschäft das übernimmt und Entscheidungen darauf trifft. Es werden Informationen hinzugefügt, Änderungen von Planern im Geschäft vorgenommen, und dann sind Sie in gewissem Maße blind dafür. Es wird wieder problematisch und komplex.

Bevor wir uns damit beschäftigen, wie wir diese neuen Herausforderungen angehen, die durch die Schaffung eines…

Nicole Zint: Machine Learning ist ein intelligenteres Modell, das Entscheidungen trifft und lernt. Alexander, wie wirkt sich jede Entscheidung auf das Geschäft aus und wie können wir sie vergleichen, um herauszufinden, welche Entscheidungen wir treffen sollten? Wir wollen nicht nur prognostizieren, sondern auch die Zwischenschritte verstehen. Aber bevor wir uns damit beschäftigen, Joannes, haben wir etwas früher dieses Null-Prognosemodell erwähnt, das ein wichtiges Konzept in diesem Machine-Learning-Modell ist. Was ist der Unterschied in den Prognoseansätzen, die wir bei Lokad nehmen? Helfen probabilistische Prognosen, das Problem mit der Null-Prognose zu lösen und sozusagen, wie wir diskutiert haben, diese Abweichungen von der Norm zu verstärken, die nur größere Fehler werden? Wie ändert die probabilistische Prognose das?

Joannes Vermorel: Probabilistische Prognosen sind in dieser Hinsicht und allgemeiner für die Feedback-Schleife sehr interessant. Es gibt zwei völlig unterschiedliche Gründe dafür. Der erste ist die Idee, dass wir eine Vorstellung von Unschärfe einführen, also versuchen wir, zumindest ungefähr richtig zu sein, anstatt genau falsch.

Wenn es um Situationen mit Null-Prognosen geht, passiert zum Beispiel Folgendes: Wenn Sie probabilistische Prognosen haben, erkennen Sie an, dass die Qualität der Informationen, die Sie haben, ziemlich unscharf ist. Sie haben keine perfekte Sicht auf das, was passiert, und deshalb wird es viel schwieriger, numerisch gesehen, zu einer absoluten Gewissheit zu gelangen, dass die Nachfrage wirklich bei Null liegt. Es ist also nicht so, dass das probabilistische Prognosemodell so viel besser ist, es ist nur so, dass es breiter gestreut ist und es vermeidet, sich auf diese Nullposition festzulegen. Es berücksichtigt alle Wahrscheinlichkeiten über viele Werte hinweg, und wenn Sie in die Mischung die Tatsache einbeziehen, dass Sie typischerweise starke Asymmetrien zwischen der Möglichkeit haben, zu bedienen oder einfach nur eine Einheit zu bedienen, im Vergleich dazu, eine zusätzliche Einheit auf Lager für einen zusätzlichen Tag zu halten, sind Sie in vielen Situationen sehr stark dafür, eine zusätzliche Einheit für einen Tag zu behalten, anstatt das Risiko einzugehen, einen Lagerausfall zu erleben. Der Trade-off ist sehr stark auf höhere Servicelevels ausgerichtet.

Was Sie also aus probabilistischen Prognosen herausbekommen, ist eine Situation, in der Sie Wahrscheinlichkeiten haben, die verteilt sind. Sie haben nicht Ihre Prognose, die Ihre numerische Aussage über die Zukunft ist, die einfach schnell in einen degenerierten Zustand zusammenbricht, das heißt, wir sagen einfach, dass die zukünftige Nachfrage Null sein wird. Es wird Probleme geben, also wenn Sie wiederholte Lagerausfälle haben, ist probabilistische Prognose kein Zauber. Sie werden höchstwahrscheinlich die tatsächliche zukünftige Nachfrage unterschätzen. Sie werden jedoch höchstwahrscheinlich vermeiden, dass der Bestand auf Null einfriert, einfach weil Sie immer noch schätzen, dass es eine Nicht-Null-Wahrscheinlichkeit gibt, eine oder zwei oder drei Einheiten Nachfrage zu haben. Das ist das erste Argument; es vermeidet eine Verstärkung in eine Richtung.

Alexander Backus: Ja, es ist auch wichtig zu bedenken, dass, besonders wenn wir Feedback-Schleifen haben, Situationen sehr schwer vollständig zu kontrollieren sind. Es ist besser, etwas zu haben, das nicht in eine Richtung verstärkt, wie Joannes erwähnt hat.

Nicole Zint: So tun, als ob man alles vollständig beherrscht. Wieder einmal, wir sprechen hier nicht von der Bewegung der Planeten. Phänomene, bei denen eine Ungenauigkeit von 30-60 Prozent nichts ist, wissen Sie, ist nichts allzu Überraschendes.

Joannes Vermorel: Also sprechen wir von einem Grad an Ungenauigkeit in der Art der numerischen Aussage, die wir über die Zukunft machen, der sehr hoch ist. Probabilistische Prognose gibt zumindest etwas, das einfach diese enorme umgebende Unsicherheit widerspiegelt, die wir haben. Wieder einmal, wir versuchen, Menschen zu modellieren, wissen Sie, Menschen, die reagieren können. Es ist sehr, sehr schwierig und das Erste, was man anerkennen muss, ist, dass man nicht die Kontrolle hat. Ich meine, diese Leute - diese Kunden, diese Lieferanten, diese Wettbewerber - sie sind schlau, sie spielen ihre eigenen Spiele, wissen Sie, sie machen eine Menge Dinge. Es wäre, würde ich sagen, ein bisschen Überheblichkeit zu behaupten, dass man perfekt modellieren kann, was passieren wird. Das wäre die Grundlage für den Science-Fiction-Roman von Asimov, in dem man eine perfekte statistische Modellierung der Zukunft großer Zivilisationen haben kann. Es ist extrem schwierig und höchstwahrscheinlich unrealistisch.

Joannes Vermorel: Probabilistische Prognosen sind auch aus einem völlig anderen Grund von hohem Interesse. Der zweite Grund ist, dass im Gegensatz zur Punktprognose, bei der Sie eine vollständige Symmetrie zwischen Vergangenheit und Zukunft haben - mit Punktprognose haben Sie im Wesentlichen eine Messung pro Tag pro SKU, das wären zum Beispiel Ihre Verkäufe oder Ihre Nachfrage - und wenn Sie in die Zukunft projizieren, enden Sie mit einer Messung pro Tag pro SKU. Die Prognose ist also sehr symmetrisch zu Ihrer vergangenen Beobachtung. Wenn Sie jedoch in den Bereich der probabilistischen Prognosen vordringen, betrachten Sie plötzlich eine Wahrscheinlichkeitsverteilung oder eine Reihe von Wahrscheinlichkeitsverteilungen. Und so haben Sie diese sehr starke Asymmetrie zwischen Vergangenheit und Zukunft. Plötzlich ist die Zukunft völlig anders als die Vergangenheit. In der Vergangenheit haben Sie Beobachtungen, sie sind einzigartig, es gibt keine Unsicherheit oder wenn es sie gibt, ist es nur die Unsicherheit der Messung selbst. Ich meine, es könnte einen Schreibfehler in Ihrer Verkaufsaufzeichnung geben, aber in Bezug auf die Größenordnung ist das sehr, sehr klein. Dies kann in der supply chain fast immer als keine Unsicherheit im Vergleich zur Zukunft angenommen werden, wo die Unsicherheit riesig ist und das sind Ihre Wahrscheinlichkeitsverteilungen.

Joannes Vermorel: Und deshalb ist es sehr interessant, und das bringt mich zur Feedback-Schleife, dass die Feedback-Schleife eine weitere zusätzliche Dimension ist. Es ist eine Möglichkeit, die Prognose zu bereichern, um sie robuster zu machen, aber auf eine Weise, die sehr unterschiedlich ist, denn wenn die probabilistische Prognose darum ging, Wahrscheinlichkeiten einzuführen, geht es bei der Feedback-Schleife darum, die Prognose zu einer höheren Funktion zu machen. So ist Ihre Prognose plötzlich nicht mehr ein Ergebnis, nicht einmal eine Wahrscheinlichkeitsverteilung, es ist ein Mechanismus, in den Sie eine Politik, eine Art Reaktion, injizieren können und Sie werden ein anderes Ergebnis bekommen. Sie sehen also, es wird irgendwie etwas, wo Sie einfach wissen, dass, wenn jemand handelt - und dieser jemand kann sogar Sie selbst in gewisser Weise sein - Sie werden immer noch einen Einfluss auf die Prognose haben.

Nicole Zint: Die Situation wird also dynamischer und ganzheitlicher, wenn Sie in den Bereich der Feedback-Schleifen vordringen. Können Sie erklären, wie sich das auf die Prognose auswirkt und wie sie schwerer fassbar wird?

Joannes Vermorel: Wenn Sie in den Bereich der Feedback-Schleifen vordringen, haben Sie es mit etwas Dynamischem zu tun, das einen funktionalen Bestandteil in seinem Kern benötigt, wie eine Politik. Diese Politik bestimmt, wie Sie in Bezug auf Bestände, Preis und verschiedene Faktoren reagieren, die Ihre Prognose darstellen. Die Prognose wird schwerer fassbar, weil sie kein einfaches Objekt mehr ist. Sie wird von diesen Feedback-Schleifen beeinflusst, und wenn die Leute “Prognose” sagen, denken sie normalerweise an eine Punktprognose. Wenn wir in den Bereich der Politikprognosen vordringen, dehnen wir bereits das aus, was die Leute denken können. Wenn wir sagen, es werden Wahrscheinlichkeitsverteilungen sein, wird es viel schwieriger zu visualisieren.

Zum Beispiel, die Tatsache, dass Ihre Preise sich entwickeln werden, um den Warenfluss in Ihrer supply chain aufrechtzuerhalten. Wenn ein Unternehmen kurz davor steht, einen massiven Mangel zu erleiden, ist die natürlichste Reaktion, den Preis allmählich zu erhöhen, damit der Mangel weniger schwerwiegend ist. Umgekehrt, wenn Sie kurz davor stehen, eine massive Überbestandsituation zu erleiden, ist die natürliche Reaktion, den Preis zu senken, um die Nachfrage zu erhöhen und den Überbestand zu liquidieren. Die Prognose, die Sie über die Zukunft haben, hängt in diesen Beispielen von Ihrer Preispolitik ab. Wenn Sie anfangen, über Feedback-Schleifen nachzudenken, wird Ihre Prognose bedingt, unter Berücksichtigung einer Politik, die in gewissem Maße unter Ihrer Kontrolle ist.

Nicole Zint: Alexander, stimmen Sie den Stärken und Unterschieden zu, die Joannes gerade mit dem probabilistischen Prognoseansatz im Vergleich zu einer Zeitreihe skizziert hat?

Alexander Backus: Ja, wenn Sie Ihrem Modell Zugang zu früheren Entscheidungen wie der Preisgestaltung geben, kann dieses Problem gemildert werden. Joannes sprach in diesem Zusammenhang von Zeitreihen und probabilistischer Prognose. Wir haben jedoch nicht nur den Effekt, dass Ihre Prognose zukünftige Entscheidungen und Trainingsdaten beeinflusst; wir haben auch das, was man partielle Beobachtbarkeit nennt. Das bedeutet, dass Sie nur die Auswirkungen der getroffenen Entscheidung beobachten und nicht wissen, was passiert wäre, wenn Sie mehr Kapazität oder mehr Bestände gehabt hätten. Das ist ein kontrafaktisches Szenario. Die Herausforderung besteht darin, ein Modell zu erstellen, das gut genug ist, um die Auswirkungen aller Entscheidungen genau vorherzusagen.

Dieses Phänomen ist in E-Commerce-Empfehlungssystemen sehr bekannt und in der supply chain wohl weniger. Es wird Bandit-Feedback genannt. Der Begriff stammt von den Multi-Arm-Banditen, einer Spielautomatenkonfiguration in einem Casino, bei der Sie nur die Belohnung beobachten, die Sie vom Spielautomaten oder von dem Arm, den Sie ziehen, erhalten.

Nicole Zint: Und dann ist das der gleiche Effekt, und das Empfehlungssystem ist ähnlich, denn wenn Sie eine bestimmte Werbung zeigen, wissen Sie nicht, was passiert wäre, wenn Sie dem Kunden eine andere gezeigt hätten. Es gab spezifische Modellierungsansätze, die dafür gut geeignet sind, und das naive überwachte Lernsetup, über das ich am Anfang gesprochen habe, ist tatsächlich der Punkt, an dem es scheitert. Es ist also nicht gut darin, die Auswirkungen der Aktion vorherzusagen. Vielmehr sollten Sie Ihr maschinelles Lernproblem umformulieren, so dass das Modell keine Vorhersage über die Zukunft ausgeben sollte; es sollte eine optimale Entscheidung ausgeben. Und das ist es, was ich glaube, worauf Joannes auch anspielte, es wird als Politik bezeichnet. Sie lernen also ein Modell, das sagt, das ist es, was Sie tun sollten. Das ist die Werbung, die Sie zeigen sollten, oder im Kontext der supply chain, das ist der Bestand, den Sie von A nach B bewegen sollten, das ist die Menge an Kapazität, die Sie reservieren sollten. Also die tatsächlichen Dinge, die Ihre supply chain direkt beeinflussen, anstatt eine Prognose für sich, aus der Sie dann Ihre eigenen Entscheidungen treffen, von denen die Maschine nicht weiß, welche Entscheidungen Sie getroffen haben. Theoretisch könnten Sie tatsächlich die gesamte Prognose überspringen und einfach sagen, das ist es, was Sie tun sollten.

Alexander Backus: Es gibt spezifische maschinelle Lernalgorithmen, und die breitere Klasse wird tatsächlich als Verstärkungslernen bezeichnet. Das ist, wenn Sie eine Aktion in der realen Welt ausführen, die Auswirkungen davon beobachten und es in Bezug auf Belohnungen, finanzielle Belohnungen, einordnen sollten. Und das ist, wenn Sie das Feedback bekommen und dann Ihr Modell auf der Grundlage dieses Feedbacks aktualisieren. Sie haben finanzielle Belohnungen erwähnt, also ist ein Beispiel, wenn Sie sagen, Sie treffen die Entscheidung, diesen Bestand zu bestellen, und dann beobachten Sie, wie die supply chain funktioniert, wie viel Geld auf das Konto eingegangen ist, und dann wird das in das System zurückgespeist, so dass es versteht, nun, als wir diese Entscheidungen getroffen haben, war das das Ergebnis, und so geht es weiter.

Joannes Vermorel: Ja, diese Art von finanzieller Verstärkung oder finanziellem Ziel kann komplexer sein und Lagerhaltungskosten, verpasste Chancen usw. berücksichtigen. Es gibt viel, was dazu ausgearbeitet werden kann, oder wir können es dabei belassen. Das ist es, was Sie dann mit diesem Verstärkungslernalgorithmus optimieren. Auf diese Weise lernen Sie direkt die Politik, die Entscheidungen, die Sie treffen sollten. Sie umarmen also eher diese sich selbst erfüllende Prophezeiung, anstatt sie zu vermeiden, worüber wir am Anfang unserer Diskussion zu sprechen begonnen haben. Es ist also nicht gut oder schlecht; es kann einfach nicht ignoriert werden. Und das ist ein Weg, dies zu umgehen, ein Modell zu haben, das die Entscheidungen berücksichtigt und aus den Auswirkungen früherer Entscheidungen lernt, um immer bessere Entscheidungen zu treffen.

Alexander Backus: Wir sollten ein wenig über die Auswirkungen davon nachdenken, denn das bedeutet, dass Sie auch in der Lage sein sollten zu experimentieren. Und das ist in diesem Setup natürlich sehr herausfordernd, wenn das Modell lernen muss und sehen, was passiert, wenn es A oder B tut.

Nicole Zint: Warum wurde das also nicht im Wesentlichen zuvor angewendet, oder wird es nicht überall angewendet?

Alexander Backus: Nun, das ist einer der Gründe. Und auch typische Verstärkungslernalgorithmen lernen auf eine Online-Art und Weise, sozusagen, sie führen eine Aktion aus und lernen dann aus dem Belohnungsfeedback, das sie davon erhalten. Dies ist problematisch in realen Situationen, in denen viel Risiko besteht, und auch Sie haben nicht

Nicole Zint: Sie haben nichts, um diesen Algorithmus zu starten, um ihn sinnvolle Dinge ausgeben zu lassen. Es beginnt zufällig initiiert. Oder Sie müssen eine sehr gute Simulationsumgebung haben, was Sie oft in anderen Verstärkungslernsituationen sehen, wie AlphaZero, das Schach von Google DeepMind lernt. Sie haben eine Simulation, also haben sie eine Computersimulation, in der dieser Verstärkungslernalgorithmus herumspielen kann. So opfern Sie im Wesentlichen nicht die Supply Chain von jemand anderem.

Alexander Backus: Genau, Sie wollen keine Versuchskaninchen. Aber das ist bei uns hier ein Henne-Ei-Problem, denn dann brauchen Sie ein sehr genaues Modell der Realität. Und wenn Sie das haben, dann haben Sie das Problem bereits gelöst. Also, Sie brauchen eine Supply Chain, um das zu tun, und das wollen Sie nicht tun. Sie brauchen ein Modell Ihrer Supply Chain. Wenn Sie das haben, sollten Sie nicht trainieren müssen, und Sie sollten bereits in der Lage sein, die Gelegenheit herauszufinden. Zurück zu dem Punkt, an dem wir angefangen haben.

Ja, aber es gibt heutzutage eine vielversprechende Richtung, bei der man aus historischen Daten lernt. Es wird Offline-Verstärkungslernen genannt, bei dem man im Grunde genommen aus historischen Entscheidungen lernt, die getroffen wurden. Auch wenn sie nicht so schön verteilt sind, wie Sie es gerne gehabt hätten, ist es immer noch möglich, Algorithmen auf der Grundlage von realen Daten zu trainieren, die zuvor gesammelt wurden.

Nicole Zint: Wie ein Ausgangspunkt?

Alexander Backus: Ja, wie ein Ausgangspunkt. Und von dort aus können Sie dann ohne Opfer Ihrer Lieferungen zu mehr Online-Einstellungen gehen, oder Sie trainieren es offline, bevor Sie es in Chargen freigeben. Es gibt mehrere Optionen, aber das bringt auch seine eigenen Herausforderungen mit sich. Joannes, was halten Sie von dem, was Alexander gerade beschrieben hat: offline starten, aus früheren Daten lernen und dann im Wesentlichen das Henne-Ei-Problem umgehen, gut genug werden, um auf eine echte Supply Chain angewendet zu werden, daher mehr echte Daten zur Verfügung haben und von dort aus weitermachen? Was halten Sie davon?

Joannes Vermorel: Die Dateneffizienz ist fast immer ein Anliegen für jede Art von maschinellem Lernalgorithmus in der Supply Chain, weil Sie nie den Luxus haben, eine riesige Menge an Daten zu haben, zumindest nicht auf der Granularitätsebene, auf der die Entscheidungen getroffen werden müssen. In Supply-Chain-Entscheidungen müssen sie typischerweise auf SKU-Ebene getroffen werden. Und aufgrund der Tatsache, dass Batching stattfindet, selbst wenn wir das SKU in einem Geschäft betrachten, wird es nicht Millionen von Einheiten pro Tag geben. Und wenn wir das SKU in einer Fabrik betrachten, dann wird es große Chargen geben, und es wird Chargen von, sagen wir, 10.000 Einheiten geben. Und wieder wird es nicht Millionen von Chargen pro Tag geben. Die Menge der relevanten Beobachtungen ist also immer noch relativ begrenzt.

Das ist ein Aspekt, der immer eine Herausforderung für das Reinforcement Learning darstellt, weil wir nicht so viele Daten haben. Ein Simulator ist von sehr hohem Interesse, aber das war auch ein Punkt, den ich kurz in einer meiner Vorlesungen angesprochen habe. Im Grunde gibt es eine Dualität zwischen einer probabilistischen Prognose und einem Simulator. Wenn Sie eine probabilistische Prognose haben, können Sie immer Beobachtungen abtasten und so bekommen Sie Ihren Simulator aus Ihrer probabilistischen Prognose. Und wenn Sie einen Simulator haben, können Sie einfach viele Simulationen durchführen und die jeweiligen Wahrscheinlichkeiten berechnen, und Sie sind wieder bei Ihrer probabilistischen Prognose. Es gibt also eine sehr starke Dualität.

Ja, das ist interessant, aber das setzt voraus, dass man eine sehr genaue probabilistische Prognose hat, was sehr herausfordernd ist.

Nicole Zint: Die partielle Beobachtbarkeit ist eine besonders harte Nuss zum Knacken, denn wenn man einen Datensatz nimmt, sagen wir zum Beispiel, man möchte Preisbewegungen untersuchen. Das Unternehmen hat vielleicht in einer bestimmten Weise operiert, in der letzten Dekade, wo sie nicht zufällige Preisbewegungen gemacht haben; sie hatten sehr starke Gewohnheiten. Zum Beispiel sind manchmal die Gewohnheiten so stark, dass es Probleme gibt, wenn es darum geht, die tatsächliche Ursache von etwas zu differenzieren.

Joannes Vermorel: Was ist, wenn das Unternehmen jedes Jahr Ende Januar beschließt, den ersten Anfang des Jahresverkaufs zu haben? Sie haben eine Praxis, bei der sie Ende Januar große Rabatte auf eine große Vielfalt von Produkten geben, was Sie als Nachfrageanstieg am Ende des Monats beobachten werden. Aber was ist der Effekt der Saisonalität? Würden sie einen Nachfrageschub am Ende des Monats auch ohne die Rabatte beobachten? Und welcher Anteil der Auswirkungen kommt nur von den Rabatten?

Alexander Backus: Das ist in der Tat das Problem. Die Entscheidungen wurden nicht zufällig getroffen, und so spiegelt das, was Sie beobachten, ziemlich umfangreich die üblichen Praktiken wider. Eine Möglichkeit im Reinforcement Learning, das zu bewältigen, besteht darin, eine Mischung aus Exploration und Ausbeutung einzuführen. Ausbeutung bedeutet, dass Sie das Beste aus dem tun, was Sie auf der Grundlage dessen, was Sie beobachtet haben, beobachtet haben, und Exploration bedeutet, dass Sie etwas Neues ausprobieren, aber mit der Erwartung, dass es wegen seiner teilweisen Zufälligkeit minderwertig sein wird.

Joannes Vermorel: Warum sollten Sie also jemals etwas ausprobieren, von dem Sie wissen, dass es wahrscheinlich minderwertig sein wird? Die Antwort ist, nun, weil es der einzige Weg ist, dass Sie letztendlich etwas entdecken können, das sich als überlegen herausstellt. Das ist die Idee des Opferns, im Grunde ist es eine Investition in Forschung und Entwicklung. Und das könnte etwas sein, wo es nicht tatsächlich etwas ist, das Formen annehmen kann, die sehr alltäglich sind. Es könnte zum Beispiel sein, dass Sie in einem Geschäft sind, Sie verkaufen Kerzen.

Alexander Backus: Und Sie stellen fest, was wäre, wenn Sie versuchen würden, die gleichen Kerzen zu verkaufen, aber zu einem Preis, der viermal höher oder viermal niedriger ist? Beide Optionen könnten gültig sein. Vielleicht, wenn Sie eine sehr große Großbestellung bei einem Ihrer Lieferanten aufgeben und die Menge stark erhöhen, könnten Sie möglicherweise den Preis eines Grundprodukts stark senken. Ich nehme absichtlich eine Kerze, so könnten Sie einen viel niedrigeren Preis haben, und vielleicht würden Sie die Nachfrage, die Sie beobachtet haben, um das Zehnfache erhöhen.

Joannes Vermorel: Das wäre ein lohnenswerter Kompromiss. Oder gehen Sie den anderen Weg, ändern Sie Ihren Weg komplett und sagen Sie: “Ich werde für etwas gehen, das viel hochwertiger ist, fügen Sie Geschmack oder Duft hinzu, und etwas anderes, bessere Verpackung, und vervierfachen Sie den Preis.” Anstatt ein Zehntel der Nachfrage zu haben, die ich früher hatte, habe ich immer noch die Hälfte der Nachfrage, aber für ein Produkt, das einen viel höheren Preis hat.

Alexander Backus: Wenn wir jedoch auf die Geschichte schauen, waren die Variationen, die wir beobachtet haben, höchstwahrscheinlich nur geringe Variationen im Vergleich zur Baseline. Unsere Geschichte umfasst nicht diese verrückteren, wenn Sie so wollen, Szenarien.

Joannes Vermorel: Ja, und wieder, es kann darum gehen, was wäre, wenn Sie ein Produkt nehmen und sagen: “Ich führe fünf Varianten in fünf verschiedenen Farben ein.”

Nicole Zint: Sie wissen, welchen Grad an Kannibalisierung werde ich beobachten, oder berühre ich tatsächlich neue Märkte? Wieder, wenn ich Kerzen nehme und wenn ich sage, dass ich mehrere Farben für Kerzen einführen werde, in welchem Maße werden diese Kerzen unterschiedlicher Farben sich selbst kannibalisieren, und in welchem Maße werde ich tatsächlich eine völlig neue Nachfrage erfüllen?

Joannes Vermorel: Ich weiß es nicht, und vielleicht könnte dieses Aufnahmegerät mir einen Einblick davon geben. Aber in weitem Maße sehen wir normalerweise, dass, solange Unternehmen anfangen, eine Art von maschinengesteuerter Zufälligkeit einzuführen, es sehr wenig Zufälligkeit gibt. Es ist viel mehr eine Frage von Gewohnheitsmustern. Und wieder, es hängt auch davon ab, wie diese Unternehmen arbeiten. Wenn zum Beispiel eine Preisentscheidung getroffen wird, ist es normalerweise nicht nur eine Person, die die Idee hatte. Es gibt eine Methode dazu, und die Leute wurden darauf trainiert zu sagen: “In dieser Art von Situation sollten Sie das Produkt rabattieren, weil es die übliche Praxis ist und Sinn macht.” Das ist in Ordnung, aber es bedeutet auch, dass die meisten der Preisvariationen, die Sie in den historischen Daten beobachten, immer einem kleinen Muster folgen, das genau die Methoden sind, die vorhanden sind.

Alexander Backus: Aber sicherlich ist das immer noch ein guter Ausgangspunkt. Wenn, wie Sie erwähnt haben, was machen Sie sonst? Entweder opfern Sie eine Supply Chain oder Sie erstellen eine großartige Simulation, aber das basiert auch auf der Idee, dass Sie gute Daten haben, auf die Sie sich stützen können. Aber, wie ich erwähnt habe, wenn wir es auf eine Offline-Weise tun, dass wir uns unsere bestehende Verkaufsgeschichte oder Daten, die wir haben, ansehen, obwohl es diesen Nachteil geben kann, dass wir diese große Abweichung von der Norm nicht sehen, um die verschiedenen Konsequenzen davon zu beobachten, ist das immer noch der richtige Ausgangspunkt, Ihrer Meinung nach?

Joannes Vermorel: Ich glaube, dass der richtige Ausgangspunkt etwas anders ist. Der richtige Ausgangspunkt besteht zunächst darin, anzuerkennen, dass Rückkopplungsschleifen grundlegend sind, wenn wir sie haben. Wenn wir anerkennen, dass diese Rückkopplungsschleifen real sind und wir sie angehen wollen, ist das ein Paradigmenwechsel in der Art und Weise, wie wir die Prognose selbst angehen. Sie sehen, das ist ein echter Ausgangspunkt. Der Rest sind technische Details. Es gibt viele Modelle. Die einfachsten Verstärkungslernmodelle, wie Banditen, können unglaublich einfach sein. Einige sind unglaublich komplex, aber das sind technische Details. Was ich in realen Supply Chains beobachtet habe, ist, dass die größte Herausforderung, um tatsächlich etwas so Einfaches wie diese Rückkopplungsschleifen zu akzeptieren, darin besteht, anzuerkennen, dass es tatsächlich tiefe Auswirkungen auf die Prognosen selbst haben wird. Die Prognosen werden nie mehr die gleichen sein, und ich meine nicht quantitativ. Ich meine in Bezug auf das Paradigma, man kann diese Prognosen nicht mehr auf die gleiche Weise betrachten. Es handelt sich nicht einmal mehr um das gleiche Objekt. Es ist etwas von anderer Natur, und das ist sehr schwierig, weil die Frage, die ich normalerweise bekomme, lautet: “Wird meine Prognose genauer sein?” Eine der Herausforderungen besteht darin, sobald wir anfangen, diese Rückkopplungsschleifen zu betrachten, wie messen Sie überhaupt die Genauigkeit, wenn Sie Rückkopplungsschleifen haben? Das ist eine ganz eigene Frage. Es ist eine schwierige Frage.

Alexander Backus: Ja, wenn ich dazu etwas sagen darf, ich denke, wir haben über die technischen Herausforderungen und die Herausforderungen der Datenverfügbarkeit gesprochen. Aber ich stimme Joannes voll und ganz zu, dass der Hauptgrund, warum es nicht in Unternehmenseinstellungen angewendet oder übernommen wurde, auch darin besteht, dass es einen tiefgreifenden Einfluss auf Ihren Geschäftsprozess hat. Also, in dieser Art von theoretischer Einstellung…

Nicole Zint: Wer sind Ihrer Meinung nach die technologisch fortschrittlichsten Akteure in der E-Commerce-Branche?

Joannes Vermorel: Der Trend ist, glaube ich, wenn ich mir die sehr aggressiven technologieorientierten Akteure anschaue, das wäre dd.com, Amazon.com, Alibaba.com. Sie wissen schon, diese E-Commerce-Unternehmen, die ihrer Zeit voraus sind. Ja, sie sind wirklich auf dem neuesten Stand. Sie sind sehr, sehr effektiv.

Alexander Backus: Ich stimme dem zu. Diese Unternehmen sind definitiv führend in der Branche, wenn es um Technologie und Innovation geht.

Nicole Zint: Die Welt hat sich im Laufe der Jahre stark verändert. Was denken Sie, Joannes, über die Welt, in der wir heute leben?

Joannes Vermorel: Nun, es ist nicht so einfach wie früher. Die Welt macht immer noch Fortschritte, aber wir hatten in den letzten Jahren viele Überraschungen. Es ist klar, dass wir nicht am Ende der Geschichte sind, wo alles vorhersehbar ist. Die Welt ist chaotisch, und wir müssen die Unsicherheit und Komplexität von Menschen, Maschinen und Prozessen in Supply Chains akzeptieren. Wir können keine vollständige Kontrolle haben, daher ist mein Ansatz, ungefähr richtig zu sein, um alles zu erfassen, anstatt genau falsch zu sein.

Nicole Zint: Das ist eine wirklich interessante Sichtweise. Und was ist mit Ihnen, Alexander? Welche Art von Talent suchen Sie, wenn Sie neue Leute in Ihr Team aufnehmen?

Alexander Backus: Bei IKEA sind wir immer auf der Suche nach großartigen Data-Science-Talenten, um Herausforderungen in einem großen Unternehmen zu lösen. Wir haben viele Daten und das Potenzial, auf globaler Ebene Einfluss zu nehmen, daher müssen wir den Status quo herausfordern.

Nicole Zint: Vielen Dank an Sie beide für Ihre Einblicke. Es war uns eine Freude, Sie heute bei uns zu haben.

Joannes Vermorel: Ja, danke.

Alexander Backus: Danke, dass Sie mich eingeladen haben.