00:00:00 Einführung des Interviews
00:00:42 Meinolf Sellmans Karriere und die Entscheidungsfindung bei InsideOpt
00:03:47 Störungen und Überoptimismus in der Optimierung
00:06:18 Vermorels Entdeckung der stochastischen Optimierung und ihre Einflüsse
00:08:10 E-Commerce-Fulfillment und Prognose der Supply Chain
00:09:56 Ansatz “vorhersagen und dann optimieren” und seine Folgen
00:11:41 Verbesserung der betrieblichen Ergebnisse und Geschäftskosten
00:14:08 Unvorhersehbarkeit und Chaos in der Supply Chain
00:16:16 Attraktivität der Prognose und rationale Entscheidungsfindung
00:18:43 Rationale Entscheidungsfindung und Overbooking-Spiel
00:21:55 Beispiel für ein Supermarktprodukt und Verfügbarkeit der Supply Chain
00:24:27 Stochastische Optimierung und saisonale Verkaufsschwankungen
00:28:53 Auswirkungen von Preisänderungen und gemeinsame a posteriori Verteilung
00:30:39 Problemlösungsheuristiken und Bewältigung von Komplexität
00:33:10 Herausforderungen bei verderblichen Gütern und a posteriori Verteilung
00:36:01 Schwierigkeiten beim Denken und Schaffen von Lösungsbewusstsein
00:38:40 Kaffeeroastery-Problem und Produktionsplanung
00:42:20 Geschäftsmodellierung und Realität komplexer Variablen
00:45:34 Vernachlässigte Bedenken bei der Optimierung und Suche nach der eierlegenden Wollmilchsau
00:49:00 Ratschläge des CEO und Verständnis von Geschäftsprozessen
00:51:58 Lagerkapazität und Unsicherheit bei der Lieferung durch Lieferanten
00:54:38 Wahrnehmung des Serviceniveaus und Übung zur Besprechung
00:57:33 Finanzielle Verluste von Fluggesellschaften und Technologieadoption
01:00:10 Vorteile der KI-basierten Suche und Hardwarekompatibilität
01:03:05 Konvexität in der Optimierung und Nützlichkeit gegenüber dem Beweis
01:06:06 Konvergenz von maschinellem Lernen mit Optimierungstechniken
01:09:34 Laufzeitfunktionen und Erweiterung des Suchhorizonts
01:12:22 Mikroanpassungen und Risiken im Lagerbetrieb
01:16:09 Finden eines guten Kompromisses und Absicherung gegen Unsicherheit
01:19:11 Erwarteter Gewinnanstieg mit stochastischer Optimierung
01:22:23 Beispiel aus der Luft- und Raumfahrtindustrie
01:24:30 Akzeptanz guter Entscheidungen und Schadensbegrenzung
01:25:19 Effizienz der Supply Chain
01:26:22 Kundenfeedback und Bedeutung von Technologie
01:26:56 Ende des Interviews
Über den Gast
Dr. Meinolf Sellmann ist Gründer und CTO bei InsideOpt, einem in den USA ansässigen Startup, das Software für die Automatisierung der Entscheidungsfindung unter Unsicherheit entwickelt. Er war früher Direktor für Netzwerkoptimierung bei Shopify, Labordirektor für die Labore für maschinelles Lernen und Wissensrepräsentation am Global Research Center von General Electric, Senior Manager für kognitive Informatik bei IBM Research und Assistenzprofessor für Informatik an der Brown University. Meinolf hat Systeme wie das Handelssystem für die Abwicklung des Eurosystems entwickelt, das jede Nacht über 1 Billion Euro abwickelt. Er hat über 80 Artikel in internationalen Konferenzen und Zeitschriften veröffentlicht, hält sechs Patente und hat über 22 erste Preise bei internationalen Programmierwettbewerben gewonnen.
Zusammenfassung
In einem kürzlichen Interview bei LokadTV diskutierten Conor Doherty, Joannes Vermorel und Gast Meinolf Sellmann die Rolle der stochastischen Optimierung im Supply Chain Management. Sie betonten die Bedeutung der Berücksichtigung von Variabilität und Unsicherheit in Entscheidungsprozessen. Traditionelle deterministische Methoden stoßen in realen Szenarien oft an ihre Grenzen und führen zu überoptimistischen Optimierungsplänen. Sowohl Vermorel als auch Sellmann kritisierten den Ansatz “vorhersagen und dann optimieren” und schlugen vor, dass Unternehmen bessere Ergebnisse erzielen können, indem sie die Variabilität der Prognose bei der Optimierung berücksichtigen. Sie betonten die Notwendigkeit von ausführbaren Plänen und messbarer Effektivität in jedem Optimierungsmodell.
Erweiterte Zusammenfassung
In einem kürzlichen Interview mit Conor Doherty, Leiter der Kommunikation bei Lokad, diskutierten Dr. Meinolf Sellmann, CTO bei InsideOpt, und Joannes Vermorel, CEO von Lokad, die Komplexitäten der Entscheidungsfindung unter Unsicherheit im Supply Chain Management. Das Gespräch drehte sich um das Konzept der stochastischen Optimierung, einer Methode, die die inhärente Variabilität und Unvorhersehbarkeit in Supply Chain Prozessen berücksichtigt.
Dr. Sellmann, ein preisgekrönter Informatiker und KI-Forscher, begann damit, seinen beruflichen Werdegang bei IBM, GE, Shopify und nun InsideOpt zu teilen. Er betonte, wie maschinelles Lernen zunehmend Teil seiner Arbeit geworden ist und wie traditionelle Optimierungsmethoden, die deterministisch sind, in realen Szenarien oft an ihre Grenzen stoßen. Er betonte, dass die Entscheidungsfindung unter Unsicherheit ein notwendiger Aspekt des Supply Chain Managements ist und dass dies der Schwerpunkt bei InsideOpt ist.
Anhand der Luftfahrtindustrie erläuterte Dr. Sellmann die Herausforderungen der Optimierung unter Unsicherheit. Er erklärte, dass Optimierungspläne auf dem Papier großartig aussehen können, in der Praxis jedoch oft aufgrund unvorhergesehener Umstände scheitern. Dies führt zur Erkenntnis, dass Optimierung unter Überoptimismus leidet.
Vermorel stimmte Dr. Sellmanns Perspektive zu und teilte seine eigenen Erfahrungen mit dem Konzept der stochastischen Optimierung. Er bemerkte, wie die Idee der Unsicherheit in der traditionellen Optimierungsliteratur oft fehlt. Vermorel diskutierte auch die Idee, die Zukunft zu beherrschen, um Unsicherheit zu beseitigen, ein Konzept, das seit fast einem Jahrhundert attraktiv ist. Er erwähnte den Versuch der Sowjetunion, 30 Millionen Produkte fünf Jahre im Voraus vorherzusagen und zu preisen, was ein Misserfolg war. Trotzdem spricht die Idee immer noch Akademiker und bestimmte Arten von Managern aufgrund ihres top-down Ansatzes an.
Dr. Sellmann kritisierte den traditionellen Ansatz “vorhersagen und dann optimieren”, bei dem eine Abteilung eine Prognose erstellt und eine andere diese Prognose für die Optimierung verwendet. Er argumentierte, dass dieser Ansatz die Variabilität in der Prognose ignoriert und schlug vor, dass Unternehmen deutlich bessere operative Ergebnisse erzielen können, indem sie die Variabilität in der Prognose bei der Optimierung berücksichtigen.
Vermorel verwendete das Beispiel der Überbuchung von Fluggesellschaften, um die Nichtlinearität bestimmter Probleme zu veranschaulichen, bei denen geringfügige Abweichungen schnell zu erheblichen Problemen führen können. Dr. Sellmann verwendete das Beispiel eines Supermarkts, der Butter und Sonnenschutzsets verkauft, um die Bedeutung der Nachfragevariabilität zu verdeutlichen. Er argumentierte, dass es entscheidend ist, die gesamte Lieferung zur richtigen Zeit zur Verfügung zu haben, insbesondere für saisonale Produkte wie Sonnencreme.
Das Gespräch berührte auch die Diskrepanz zwischen gesundem Menschenverstand und der Verwendung von Software im Supply Chain Management, die Bedeutung der Prognose potenzieller Szenarien für alle Produkte und die Komplexität der Produktionsplanung. Dr. Sellmann erklärte, dass eine perfekte Genauigkeit zwar ideal wäre, aber aufgrund inhärenter Unsicherheiten in der Prognose nicht möglich ist. Stattdessen ist das nächstbeste, zu lernen, wie Prognosen fehlerhaft sind, und diese Informationen zu nutzen, um bessere Entscheidungen zu treffen.
Zusammenfassend betonte das Interview die Bedeutung der stochastischen Optimierung im Supply Chain Management. Sowohl Dr. Sellmann als auch Vermorel betonten die Notwendigkeit, Variabilität und Unsicherheit in Prognosen bei Entscheidungen zu berücksichtigen und die Modelle nicht zu vereinfachen. Sie schlugen vor, dass jedes Optimierungsmodell als Simulation dessen betrachtet werden kann, was unter bestimmten Bedingungen geschehen würde, und es ist entscheidend sicherzustellen, dass der Plan ausführbar ist und seine Wirksamkeit gemessen werden kann.
Vollständiges Transkript
Conor Doherty: Willkommen zurück. Unsicherheit und Stochastik sind die eigentliche Natur der Supply Chain. Unser heutiger Gast, Dr. Meinolf Sellman, ist mit diesem Thema bestens vertraut. Er ist ein preisgekrönter Informatiker, ein renommierter KI-Forscher und CTO bei InsideOpt. Heute wird er mit Joannes und mir über Entscheidungsfindung unter Unsicherheit sprechen. Meinolf, herzlich willkommen bei Lokad.
Meinolf Sellman: Vielen Dank, Conor, und schön, Sie kennenzulernen, Joannes. Ich freue mich auf die Diskussion.
Conor Doherty: Nun gut, vielen Dank, dass Sie uns beigetreten sind. Entschuldigen Sie die kurze Einführung. Ich möchte gerne direkt zum Gast kommen, aber das hat zur Folge, dass ich nicht gerecht werde, wenn es um den Hintergrund der Person geht, mit der wir sprechen. Könnten Sie mir also bitte zunächst verzeihen und einige Lücken in Bezug auf Ihren Hintergrund füllen?
Meinolf Sellman: Sicher. Ich denke, Sie haben das Wesentliche abgedeckt. Ich bin im Herzen ein Optimierungsmensch. Das hat mich auch zu meiner Diplomarbeit getrieben. Das deutsche System ist dem französischen sehr ähnlich. Meine Diplomarbeit bestand darin, einen Mixed-Integer-Programmierungs-Solver für ein Computeralgebrasystem zu entwickeln. Schon seit meinen frühen Studententagen beschäftige ich mich also mit dieser Entscheidungsfindung und erforsche, wie wir Computer nutzen können, um bessere Entscheidungen zu treffen.
Ich war Postdoc an der Cornell University, Professor an der Brown University, dann Senior Manager bei IBM, Technologie-Direktor bei GE, dann Direktor bei Shopify und jetzt CTO bei InsideOpt. Auf dieser Reise können Sie sehen, dass immer mehr maschinelles Lernen in die Mischung gekommen ist.
Traditionelle Optimierung ist deterministisch. Sie haben vollständige Kenntnis von allem, was vor sich geht, und versuchen nur, den besten Handlungsverlauf zu finden. Sobald Sie jedoch tatsächlich mit der Praxis in Berührung kommen, erkennen Sie, dass dies nicht der Fall ist. Sie müssen immer mehr Technologie einbringen, die es Ihnen ermöglicht, Entscheidungen unter Unsicherheit zu treffen, und das ist es, was uns hier bei InsideOpt wirklich begeistert.
Conor Doherty: Vielen Dank. Sie haben wiederholt große Namen wie IBM, General Electric und Shopify erwähnt, wenn es um Ihren Hintergrund geht. Ohne mögliche NDAs zu verletzen, welche Details oder Erfahrungen haben Ihren Blickwinkel auf Prognosen und Entscheidungsfindung am meisten beeinflusst, jetzt wo Sie bei InsideOpt sind?
Meinolf Sellman: Schauen Sie sich eine Branche wie die Flugzeugindustrie an. Traditionell hohe Ausgaben für Optimierung. Es ist eine der Branchen oder eine der Industrien, die wahrscheinlich am frühesten und auch am meisten über Jahrzehnte hinweg in Optimierungstechnologie investiert haben. Und dann schauen Sie, wie viel Spaß es macht, eine Fluggesellschaft zu betreiben. Sie erhalten großartige Pläne, oder? Sie erhalten Crew-Pläne. Sie müssen entscheiden, welcher Pilot auf welchem Flugzeug ist, welcher Flugbegleiter auf welchem Flugzeug ist, welche Flugzeuge für welche Strecken verwendet werden sollen. Sie müssen auch entscheiden, welche Art von Strecken angeboten werden sollen, welche Direktflüge angeboten werden sollen und wie man sie zu Routen macht, sie müssen das Ertragsmanagement durchführen. Für all diese operativen Entscheidungen verwenden sie Optimierung und auf dem Papier sehen diese Pläne fantastisch aus. Sie kommen normalerweise, wenn nicht mit nachweisbarer Optimalität, dann mit einer Leistungsgarantie.
Aber dann, wenn Sie eine Fluggesellschaft betreiben, wissen Sie, dass Sie am Tag des Betriebs Geld verlieren, weil dann die Dinge etwas anders sind. Das Wetter ist nicht so, wie Sie es erwartet haben, die Fluglotsen in Frankreich haben das Gefühl, dass sie nicht genug bezahlt werden, das Gate ist voll, einige Geräte gehen kaputt. All diese Dinge, die schief gehen können. Und wenn Sie jemals geflogen sind, wissen Sie, dass das Motto der Fluggesellschaft lautet: “Wenn heute etwas schief geht, dann geht heute etwas schief. Sorgen wir dafür, dass morgen nichts schief geht.” Und so behandeln sie Sie. Es ist ihnen egal, ob Sie heute dorthin kommen, wo Sie hinmüssen, sie wollen morgen wieder im Plan sein, denn wenn sie mit einer schlechten Situation in den nächsten Tag kommen, wird auch der nächste Tag schiefgehen.
Was sagt Ihnen das? Es sagt Ihnen, dass die Optimierung unter Überoptimismus leidet, dass alles nach Plan verläuft. Und das wollen wir ändern.
Conor Doherty: Vielen Dank. Joannes, stimmt das mit Ihrer Sicht überein?
Joannes Vermorel: Absolut. Für mich war es sehr faszinierend, weil ich relativ spät das Konzept der stochastischen Optimierung entdeckt habe. In meinen Zwanzigern war ich sehr vertraut mit der regulären Optimierung, Sie wissen schon, konvexe Optimierung, habe ganze Bücher über solche Dinge gelesen. Und so die klassische Optimierung, die mit linearer Algebra und Dingen wie dem Simplex-Algorithmus und so weiter beginnt, diese Dinge werden buchstäblich nicht in der High School, sondern erst danach gelehrt.
Und dann habe ich einige Jahre lang Operations Research studiert, das ist der traditionelle Name für das Thema. Und auch hier kann man buchstäblich Hunderte von Seiten mit Fällen durchgehen, in denen man Fabriken, Flugzeuge, alle Arten von Zuweisungen von Vermögenswerten, Maschinen, Menschen usw. hat. Und doch wird an keiner Stelle jemals das offensichtliche Problem diskutiert, dass etwas schiefgehen kann. Sie haben nur eine Modellierung der Situation, die möglicherweise falsch ist, und dann ist alles, was Sie optimieren, äußerst fragil.
Der Moment, in dem ich erkannte, wie tief das Kaninchenloch ging, war das Lesen des Buches “Antifragile” von Nassim Nicholas Taleb. Das ist schon eine Weile her, aber dann wurde mir klar, dass ein fehlendes Paradigma wirklich allgegenwärtig war. Und dann begann ich mich allgemein sehr für diese Art der Optimierung zu interessieren. Für mich ist das Überraschendste, wie abwesend es in buchstäblich ganzen Literaturkörpern ist, die so tun, als ob diese Idee der Unsicherheit, des nicht perfekten Wissens über Ihre Verlustfunktion, buchstäblich eine fehlende Dimension ist. Es gibt eine fehlende Dimension und es ist schwieriger zu sehen, was man nicht sieht. Es ist nicht so, dass es falsch ist, es ist eher so, dass eine ganze Dimension in einem sehr großen, sehr umfangreichen, sehr alten Forschungsfeld fehlt.
Conor Doherty: Nun, wenn ich darauf eingehen darf. Als du das Konzept der fehlenden Paradigmen und der völligen Abwesenheit erwähnt hast, passt das gut zu einem der Gründe, warum wir uns tatsächlich an Meinolf gewandt haben. Deine Perspektive auf das, was wir als Mainstream- oder traditionelle Planung, Prognosen und Bestandspolitik bezeichnen könnten, fällt normalerweise in einen Ansatz, den wir paradigmatisch als “erst prognostizieren, dann Entscheidungen treffen” bezeichnen würden. Das ist paradigmatisch ziemlich anders als das, was ich denke, dass jeder im Raum befürworten würde. Also, zuerst werfe ich es zu dir, Meinolf. Könntest du die Unterschiede dort skizzieren, den traditionellen Ansatz und dann die fehlenden Paradigmen, die du und Joannes sehen?
Meinolf Sellman: Ja, also ich meine, wie du dir vorstellen kannst, wenn du ein Erfüllungssystem betreibst, einen E-Commerce-Shop hast und die Produkte, von denen du hoffst, dass die Leute sie kaufen werden, irgendwo in deinem Lager unterbringen musst. Das inhärente Problem, auf das du stößt, ist, dass du nicht weißt, wie viel wo gekauft wird. Du musst also eine Erwartung formulieren, sagen wir es mal so. Du musst eine Prognose oder allgemeiner eine Vorhersage treffen. Und dafür gibt es Leute, die das für dich tun, und das ist in der Regel deine Abteilung für maschinelles Lernen. Diese Leute wissen alles über “Oh, hier fehlen Werte.” Richtig, sagen wir, du hattest zu einem bestimmten Zeitpunkt Fehlbestände, was bedeutet, dass du nicht wirklich weißt, wie viel verkauft worden wäre, weil du ausverkauft warst. Du weißt also tatsächlich nicht, wie viel du hättest verkaufen können, wenn du mehr gehabt hättest. Sie beschäftigen sich mit Ausreißern, fehlenden Werten, Rauschen und allem, was unsicher und außerhalb davon liegt, machen sie eine Prognose, eine Vorhersage.
Und dann hast du diese zweite Abteilung, die, wie Joannes ganz richtig sagte, im Allgemeinen nicht mit Unsicherheit umgeht. Sie gehen so vor: “Oh, großartige Vorhersage. Lass uns das in mein Optimierungsmodell stecken, als ob es vom Orakel von Delphi gegeben wäre oder so.” Es ist so, als hättest du perfektes Wissen über die Zukunft. Du behandelt diese Zahlen, die du dort hast, und sagst: “Oh, mein Bedarf an Sonnencreme nächste Woche beträgt 20 Tuben. Also stellen wir sie ins Regal”, ohne jegliche Variabilität zu berücksichtigen, die vorhanden ist.
Dieses “erst prognostizieren, dann optimieren”, so nennt man das, liegt zum Teil daran, dass du zwei verschiedene Abteilungen hast, die sehr unterschiedliche Fähigkeiten haben. Und es wäre sehr schwierig für dich zu sagen: “Oh, die Maschinenlerner müssen jetzt alles über Optimierung lernen” oder vielleicht müssen die Optimierer mehr über maschinelles Lernen lernen. Das ist typischerweise etwas, wovor Unternehmen zurückschrecken würden. Das ist ein Grund, warum diese Trennung existiert.
Der Punkt dabei ist jedoch, dass wenn du Unsicherheit von einer Abteilung zur anderen weitergibst, verschwindet sie nicht. Indem du sie einfach ignorierst, lässt du tatsächlich viel Geld auf dem Tisch liegen. Und das ist der zweite Grund, warum die Leute sich das nicht genauer anschauen, weil es ihnen so vorkommt, als ob die Maschinenlerner ihre Arbeit erledigt hätten. Sie kommen zurück und machen Dinge wie nachdem sie ein Modell erstellt haben, testen sie ihre Maschinerie durch etwas, das zum Beispiel als Kreuzvalidierung bezeichnet wird. Du würdest in bekannte Daten gehen und sagen: “Hey, wenn ich nur diesen Ausschnitt der Daten gehabt hätte und ich eine Vorhersage für den anderen Teil der Daten hätte machen müssen, wie gut hätte das funktioniert?” Auf diese Weise kannst du dich irgendwie davon überzeugen, dass du sehr gute Vorhersagen aus der Abteilung für maschinelles Lernen bekommst.
Und das tun sie auch und du kontrollierst das und denkst: “Oh, das ist großartig. Sie haben gute Vorhersagen.” Und dann kommen die Optimierer trotzdem zurück und sagen: “Entweder habe ich eine Leistungsgrenze oder hey, ich habe eine wahrscheinlich optimale Lösung hier.” Also würdest du nicht erwarten, wenn du ein Unternehmen führst, dass es Raum für Verbesserungen gibt, indem du diese Abteilungen besser zusammenarbeiten lässt. Und in Wirklichkeit kannst du sehr einfach um 15%, 20%, 25% bessere operative Ergebnisse erzielen, wenn du die Variabilität in der Prognose berücksichtigst, wenn du die Optimierung durchführst. Aber die Leute sehen das nicht.
Es ist also zum Teil strukturell bedingt, dass dieses “Vorhersagen und Optimieren” so stark fortbesteht, dass du die Fähigkeiten nicht vermischen möchtest. Der andere Teil ist, dass du nicht siehst, wie viel du tatsächlich auf dem Tisch liegen lässt, indem du diese Dinge enger miteinander verknüpfst. Denn es klingt so: “Hey, großartige Vorhersage, nachweisliche Optimalität, super. Der Rest ist nur der Preis des Geschäfts.” Und das ist es nicht. Das ist, glaube ich, was Joannes und ich dem Publikum heute sagen wollen. Das ist nicht der Preis des Geschäfts.
Conor Doherty: Nun, Joannes, ist das der Preis des Geschäfts? Hat Meinolf recht?
Joannes Vermorel: Ja, und ich denke auch, dass es eine weitere Dimension gibt. Die Idee, die Zukunft zu beherrschen, um die Unsicherheit vollständig zu beseitigen, ist seit fast einem Jahrhundert eine sehr verlockende Idee. Die Sowjetunion ist zusammengebrochen, aber die Idee, einen Fünfjahresplan zu erstellen und alles zu orchestrieren, ist mit der Sowjetunion nicht gestorben. Irgendwann hatten sie glaube ich etwa 30 Millionen Produkte, die sie fünf Jahre im Voraus preisen und prognostizieren mussten. Es war ein vollständiges Scheitern auf pragmatischer Ebene.
Die Anziehungskraft dieser Idee ist mit der Sowjetunion nicht gestorben. Sie hat immer noch Anziehungskraft, besonders für Akademiker. Die Idee, dass du die Zukunft der Welt so gestalten könntest, dass du deine Prognose hast und das wird die Wahrheit sein und dann geht es nur noch um die Orchestrierung. Es spricht auch bestimmte Arten von Management an, weil es diesen sehr top-down Ansatz hat.
Es hat diesen Reiz der Einfachheit. Offensichtlich ist dies eine Fehleinschätzung, denn du hast keine Kontrolle. Deine Kunden haben ihre eigenen Agenden, sie können andere Dinge entscheiden. Dein Lieferant versucht sein Bestes, aber manchmal ist sein Bestes immer noch nicht sehr gut. Außerdem gibt es Schocks. Manchmal ist es etwas sehr Dramatisches wie ein Krieg, manchmal ist es etwas sehr Dummes wie ein Schiff, das im Suezkanal stecken bleibt, und alle deine Importe werden aufgrund eines dummen Ereignisses verzögert. Aber egal, was die Ursache ist, die Zukunft ist chaotisch.
Es ist sehr schwer, dieses Chaos zu rationalisieren. Es ist schwieriger, darüber nachzudenken. Über die perfekte Zukunft nachzudenken, ist einfach. Das war das Feedback, das wir in den ersten Jahren von Lokad bekommen haben. “Herr Vermorel, geben Sie uns einfach genaue Prognosen. Halten Sie sich an einen Fehler von 3% und fertig.” Und offensichtlich, wenn wir das hätten liefern können, dann hätte es keinen wahren Vorteil gegeben, die Prognose und die Optimierung zu kombinieren.
Aber hier sind wir, 15 Jahre später. Auch wenn Lokad in Bezug auf die Prognose sehr gut abschneidet, ist eine Ungenauigkeit von 3% für die meisten Unternehmen einfach lächerlich. Wir sind noch nicht einmal annähernd in der Nähe davon. Auf SKU-Ebene wird es nie annähernd so sein.
Meinolf Sellmann: Ja, es klingt hart, die industrielle Praxis mit der Sowjetunion zu vergleichen, aber ich habe neulich eine Anzeige für einen MIP-Löser gesehen, in der stand: “Mit unserem MIP-Löser hat diese Fluggesellschaft jetzt ihren Fünfjahresplan optimiert.” Und ich glaube, ich habe einen Kommentar hinterlassen, dass Chruschtschow stolz wäre. Es ist wahr, es hat einen großen Reiz zu sagen: “Ich kann die Zukunft prognostizieren, KI ist großartig, und dann optimiere ich dafür und jetzt bin ich gut.”
Joannes Vermorel: Ich denke, der Reiz der Ideologie ist stark. Ich denke, die Leute würden das abtun mit: “Oh nein, ich bin pro Markt, ich bin nicht kommunistisch.” Aber sie übersehen, was diese Art von Ideologie so attraktiv gemacht hat. Selbst wenn man in die Wissenschaft geht, findet man häufig Befürworter solcher Visionen. Die Idee, die Kontrolle über seine Zukunft zu haben, ist sehr verlockend. Die Idee, von oben herab wissenschaftliche Methoden anwenden und von oben her rationalisieren zu können, mit einem großen Plan, das ist vollständig rational von oben bis unten. Auf dem Papier sieht es aus wie modernes Management. Es stellt sich heraus, dass es tatsächlich kein modernes Management ist, sondern eher modernes Missmanagement, aber ich kann den Reiz und den Anschein von Rationalität spüren.
Aber es hat Nebenwirkungen, die iatrogen sind, Dinge, die unbeabsichtigt sind, aber diese Pläne grundlegend untergraben. Man endet mit vermeintlich optimalen Entscheidungen, die sich als unerwartet fragil erweisen, bei denen schon die geringste Abweichung in unerwarteter Weise scheitert.
Meinolf Sellmann: Das ist wahrscheinlich der häufigste Trugschluss. Die Leute denken: “Vielleicht kann ich die Zukunft nicht perfekt prognostizieren, aber selbst wenn es leichte Abweichungen gibt, werden meine Entscheidungen wahrscheinlich mehr oder weniger die gleichen sein.” Das ist genau das, was nicht stimmt. Diese Art von kontinuierlicher Veränderung, die man erwarten würde, ist in der Praxis einfach nicht vorhanden. Deshalb ist es, obwohl es so rational klingt, eine Prognose zu machen und dann eine Entscheidung darauf zu basieren, tatsächlich das irrationalste, was man tun kann. Man sollte erwarten, dass man nicht auf alle Informationen zugreifen kann, die man haben sollte.
Tatsächlich ist der rationale Ansatz, das zu tun, was Lokad tut, wofür wir unsere Software insideOpt entwickeln, nämlich die Variabilität, die man in seiner Prognose erwarten muss, bei der Entscheidungsfindung zu berücksichtigen.
Joannes Vermorel: Ja, und nur ein Beispiel für das Publikum. Wenn Sie das Spiel des Überbuchens bei Fluggesellschaften spielen wollen, ist das in Ordnung. Es gibt immer ein paar Passagiere, die nicht erscheinen, sodass Sie ein paar mehr Tickets verkaufen können, als Sie Sitze im Flugzeug haben. Aber das Problem ist, dass Sie irgendwann wirklich zu wenig Sitze haben. Sie hatten nur 200 Sitze, Sie haben 220 verkauft in der Annahme, dass 20 Personen nicht erscheinen werden, aber tatsächlich sind 205 Personen erschienen. Also haben Sie fünf Personen, die egal wie Sie es machen, nicht ins Flugzeug passen. Ja, Sie können ihnen eine Entschädigung geben und alle möglichen Spiele spielen, aber am Ende des Tages haben Sie fünf Personen, die eine schreckliche Servicequalität für den Flug haben, den sie bei Ihnen gekauft haben.
Es ist also eine sehr nichtlineare Sache, bei der die ersten paar Sitze ja, Sie können das Flugzeug überbuchen, aber dann gibt es eine Grenze und das Erreichen der Grenze ist brutal, besonders für diese Menschen, wenn sie etwas wirklich Wichtiges zu erledigen hatten. Es ist absolut nicht wie ein sanft lineares Problem, bei dem es einfach ein wenig mehr vom Gleichen ist. Nein, es gibt eine Grenze und dann wird es sehr schnell zu einem echten Problem.
Conor Doherty: Um darauf aufzubauen und ein paar Gedanken zusammenzuführen, weil ihr beide wirklich interessante Dinge gesagt habt, die zum nächsten Punkt führen. Joannes, dein Beispiel mit der Überbuchung und Meinolf, dein Beispiel zur Messung der Nachfrage. Zum Beispiel habe ich letzten Monat 20 Einheiten Hautcreme verkauft. Nun, das hast du zwar, aber du hattest einen Lagerbestandsausfall, also weißt du eigentlich nicht, wie hoch die Nachfrage gewesen wäre.
Wenn man rational über das Problem nachdenkt, führt es natürlich zur stochastischen Optimierung, zur Akzeptanz dieser Unsicherheit. Es gibt keine perfekte Antwort, und ich glaube, du hast in deinen YouTube-Vorlesungen einen Satz, so etwas wie “Ich werde ihn jetzt vermasseln, weil eine gute Lösung jetzt besser ist als die perfekte Lösung zu spät” oder so ähnlich.
Meinolf Sellmann: Ja, das ist auch ein anderer Punkt, wenn die Zeit, die man braucht, um eine gute Antwort zu finden, irgendwie in die Qualität der Antwort selbst einfließt. Ja, das brauchst du definitiv. Aber zu deinem Punkt, warum spielt die Variabilität eine Rolle? Lassen Sie uns das anhand eines Beispiels erklären. Angenommen, Sie betreiben einen Supermarkt in Paris und haben verschiedene Produkte, die Sie in die Regale stellen. Es gibt Butter und Sonnenschutzsets. Zwei sehr unterschiedliche Produkte. Wenn Sie eine Prognose haben, dass Sie in den nächsten 30 Tagen 300 dieser Sets verkaufen werden, sollten Sie dann sagen, dass es 10 pro Tag sind? Nein. Bei Butter können Sie das tun, weil Butter eine konstante Nachfrage hat und Ihre Prognose im Durchschnitt immer um diesen Wert herum liegt und ein wenig nach links und rechts abweicht. Aber beim Sonnenschutz ist es eher so, dass das Wetter jetzt schlecht ist, das Wetter jetzt schlecht ist, das Wetter jetzt schlecht ist, und dann kommt dieses eine Wochenende, an dem die Sonne scheint und jeder sich vorbereitet und den Sonnenschutz für den ganzen Sommer kauft. Wenn Sie zu diesem Zeitpunkt nicht den gesamten Vorrat im Supermarkt haben, haben Sie es verpasst. Es ist nicht so, dass Sie die anderen 290 morgen verkaufen werden, nur weil Sie heute 10 dieser Sets herumliegen hatten. Nein, ab Montag werden Sie keine davon mehr verkaufen.
Und das ist der Unterschied, oder? Der erwartete Wert kann derselbe sein, aber es spielt eine große Rolle, ob die Variabilität eng um diesen erwarteten Wert verteilt ist oder ob es einen großen Unterschied gibt, bei dem man sagen würde, entweder nichts oder dieser große Wert. Und wenn Sie das bei Ihren Entscheidungen nicht berücksichtigen, verpassen Sie es einfach, oder? Und Sie lassen viel Geld auf dem Tisch liegen, wenn Sie Produkte zum Beispiel so behandeln. Ich hoffe, das verdeutlicht, worüber wir hier sprechen, oder? Erwartungswerte sind Erwartungswerte, aber was Sie wissen müssen, sind die Szenarien, die Sie tatsächlich betrachten müssen. Und das ist es, was die stochastische Optimierung tut. Sie betrachtet verschiedene potenzielle Zukunftsszenarien und versucht, eine kompromittierte Entscheidung heute zu finden.
Also, für die Dinge, die Sie heute entscheiden müssen, bei denen Sie nicht warten können, um zu sehen, wie die Zukunft aussieht, versucht sie, eine gute Ausgangsposition zu finden, damit Sie dann sehr gut handeln können, sobald die Zukunft enthüllt wird. Das ist es, was stochastische Optimierung ist, und das ist meiner Meinung nach das, was jeder Mensch jeden Tag tut. Denn wir vergessen das, sobald wir einen Computer für diese Aufgaben verwenden.
Conor Doherty: Danke, Meinolf. Joannes, wie passt das zu deinem Verständnis von stochastischer Optimierung?
Joannes Vermorel: Ja, das ist der Fall, wenn es, wie Meinolf erwähnt hat, ein Muster bei Sonnenschutz gibt, das sehr saisonal ist, aber der Beginn der Saison von Jahr zu Jahr vom Wetter abhängt. Das ist sehr klassisch. Es gibt tonnenweise Produkte, die in diese Kategorie fallen. Ein weiteres Produkt, das auch in einem ähnlichen Einzelhandelsbeispiel genannt werden könnte, ist der Baumarkt, in dem die Leute zum Beispiel vier oder acht Einheiten auf einmal kaufen würden, weil es Lichtschalter sind und sie nicht vier oder acht unterschiedlich aussehende Lichtschalter in ihrer Wohnung haben möchten. Wenn sie kaufen, möchten sie vier oder acht gleiche Einheiten zur gleichen Zeit haben.
Wenn Sie denken, dass drei auf dem Regal bedeutet, dass Sie keinen Lagerbestand haben, ist das falsch. Denn tatsächlich betritt die Person den Laden, sagt “Ich möchte vier”, es gibt nur drei, also gehen sie woanders hin, wo sie vier Einheiten finden können, die zufällig gleich sind. Die Unregelmäßigkeit der Nachfrage spielt also eine große Rolle, und das ist der Punkt, an dem wir uns plötzlich die feine Struktur der Unregelmäßigkeit genauer ansehen müssen, anstatt etwas zu betrachten, das über einen längeren Zeitraum gemittelt ist.
Und tatsächlich weiß das intuitiv auch die Person, die den Laden führt. Diese Lichtschalter sind nutzlos, wenn man nur einen hat. Ich muss entweder eine Schachtel mit allen gleichen haben oder es ist besser, sie erst gar nicht zu haben, weil die Leute sich nicht einmal die Mühe machen, sich ein einzelnes Produkt anzusehen. Ein einzelner Hammer ist in Ordnung, weil die Leute nicht kommen und vier identische Hämmer kaufen, aber Lichtschalter nicht. Und das ist etwas, das sehr, ich meine, es ist nicht wie Raketenwissenschaft, wenn man darüber nachdenkt.
Ich denke, du hast völlig recht. Ich habe dasselbe beobachtet. Menschen, insbesondere Supply-Chain-Praktiker, wissen das instinktiv. Sie brauchen keine Mathematik, aber sobald sie in den Bereich der Unternehmenssoftware eintreten, soll plötzlich ein gleitender Durchschnitt und ein wenig exponentielle Glättung den Fall abdecken. Und sie sagen, mach dir keine Sorgen, wenn der gleitende Durchschnitt nicht ausreicht, haben wir noch ABC-Klassen, um die Sache zu verfeinern. Und ich denke, das hilft immer noch nicht. Und ich stimme zu, es gibt diese Diskrepanz, wo angeblich, wenn wir in diesen Bereich der Software gehen, die Leute ihren gesunden Menschenverstand an der Tür lassen und denken, es ist die Maschine, es ist zu kompliziert. Also, offensichtlich, wenn sie exponentielle Glättung machen, ist das Wort exponentiell enthalten, es muss wissenschaftlich und fortgeschritten sein, oder?
Meinolf Sellmann: Wir mögen es, Probleme zu zerlegen. Deshalb mag ich den Begriff der Unregelmäßigkeit, den du erwähnt hast. Es ist herrlich kein technischer Begriff, den man verwenden kann. Aber es geht sogar über Produkte hinweg. Wenn Sie einen Supermarkt betreiben und Ihre Milchpreise erhöhen, kommen plötzlich weniger Leute in Ihren Laden, weil sie ihre Grundnahrungsmittel nicht mehr dort bekommen. Plötzlich werden auch die Kajaks oder was auch immer Sie dort saisonal verkaufen, nicht mehr verkauft, weil Sie einfach viel weniger Verkehr im Laden haben. Also, was Sie wirklich brauchen, ist eine gemeinsame a posteriori-Verteilung, in der Sie potenzielle Szenarien prognostizieren, wie alles fließt.
Conor Doherty: Diese Beschreibung dort, insbesondere der Grundnahrungsmittel und dann der Zusammenhang, klingt bemerkenswert ähnlich zur Korb-Perspektive, über die wir sprechen. Sie gehen rein, Sie möchten einen Hammer kaufen, nun, sie haben keinen Hammer, ich gehe. Ich gehe rein, ich möchte viele Dinge kaufen, ich möchte eine vollständige Einkaufsliste machen, Milch fehlt, okay, ich gehe woanders hin, wo ich Milch und alles andere bekommen kann. Daher bezieht sich die Strafe für das Fehlen der Milch nicht nur auf den entgangenen Verkauf der Milch, sondern auf alles. Denn wenn ich die Milch gehabt hätte, hätte ich auch die Butter, das Brot, die Marmelade, das Eis, den Speck, was auch immer verkauft. Aber noch einmal, und jetzt kommt die nächste Frage, die an Meinolf gerichtet ist, um das Prinzip der Wohltätigkeit zu verteidigen, für den Fall, dass jemand anderer Meinung ist, Menschen mögen Heuristiken. Als du über die Zerlegung von Problemen gesprochen hast, mögen Menschen Heuristiken. Die Idee einer ABC-Klasse, der exponentiellen Glättung, das sind Dinge, die leichter zu verstehen sind, weißt du, Faustregeln. Stochastische Optimierung ist fairerweise komplexer als das, oder?
Meinolf Sellmann: Nun, ich denke, es ist fair zu sagen, dass wir früher nicht die Werkzeuge hatten, um es ordentlich für eine Abteilung anzugehen, während wir diese Trennung zwischen maschinellem Lernen und Optimierung beibehalten. Sie möchten nicht das gesamte Team neu schulen müssen, um diese Dinge zu tun. Bis vor vielleicht fünf Jahren wäre das fair gewesen. Aber mit der heutigen Technologie würde ich nicht unbedingt sagen, dass es für diejenigen, die diese Lösungen implementieren müssen, komplexer ist.
Conor Doherty: Nun, als nächstes, und wieder werde ich Joannes speziell zu dieser Frage kommen, aber zuvor haben wir über Genauigkeit gesprochen. Wie spielt Genauigkeit in der stochastischen Optimierung eine Rolle, die traditionell als absoluter Benchmark-KPI für jede Prognose gilt? Oder ist das nur eine weitere Heuristik, die in den Hintergrund tritt, wenn man über Entscheidungen nachdenkt?
Meinolf Sellmann: Ja, also offensichtlich wäre es großartig, wenn jemand Ihnen sagen könnte, welche Lottozahlen nächsten Samstag gezogen werden. Das Problem ist, dass Sie Prognosen erstellen müssen und diese mit inhärenter Unsicherheit einhergehen. Sie wissen nicht alles über die Welt, um vorhersagen zu können, was passieren wird. Wenn Sie also ein Geschäft sind und entscheiden müssen, welche Art von Sushi-Gerichten Sie dort anbieten möchten, gelten für verderbliche Waren dieselben Prinzipien, die Joannes zuvor in Bezug auf den Überverkauf von Flugzeugsitzen erwähnt hat. Wenn Sie das Sushi nicht verkaufen, müssen Sie es wegwerfen. Das bedeutet, dass die gesamten Kosten für Produktion, Transport, Preisgestaltung und Platzierung verloren gehen, wenn Sie es nicht verkaufen. Sie möchten also nicht zu viel davon auf Lager haben, da die Marge im Vergleich zu den Kosten, die Sie verlieren, wenn es verderblich ist, relativ gering ist.
Wissen Sie, ob es diese fünf jungen Mütter gibt, die sich entschieden haben “Super, wir können wieder Sushi essen” und eine Party veranstalten und Ihr Geschäft stürmen? Sie wissen es nicht, Sie wissen einfach nicht, ob sie auftauchen und plötzlich 40 dieser Sushi-Gerichte kaufen würden. Und Sie können diese Dinge unmöglich wissen. Es gibt also Unsicherheit. Wenn Sie eine perfekte Prognose hätten, wäre das großartig. Aber jetzt, da Sie diese nicht haben können, tun Sie das nächstbeste und das ist, herauszufinden, wie sich meine Prognosen irren. Und das bezeichnen wir als eine posteriori-Verteilung. Wir sagen also, okay, bedeutet das, wenn ich diese Sushi-Gerichte dort platziere, dass mein erwarteter Wert hier, sagen wir 50 Gerichte oder so, an den meisten Tagen 50 Gerichte beträgt, manchmal 48, manchmal 42, gut. Oder bedeutet 50 Gerichte, dass es entweder 25 oder 75 sind. Großer Unterschied. Die Genauigkeit ist gleich, der erwartete Wert beträgt 50, richtig? Aber die Szenarien, die Sie betrachten müssen, und die Entscheidungen, die Sie daraus ableiten müssen, hinsichtlich dessen, was Sie auf Ihr Regal stellen werden, sind sehr, sehr unterschiedlich. Es ist ein wenig irreführend. Genauigkeit wäre großartig, wenn Sie 100% erreichen könnten. Wenn Sie keine 100% erreichen können, müssen Sie das nächstbeste tun, und das ist, Ihre Prognosen zu erstellen und zu bewerten, wie Sie sich irren.
Joannes Vermorel: Ja, und um auf den Kommentar von Meinolf zur Komplexität oder zur wahrgenommenen Komplexität zurückzukommen, meine Meinung dazu ist, dass es sehr häufig ist, dass man bei der Herangehensweise an eine Situation instinktiv mit einer Lösung beginnt. Es ist sehr schwierig, ein Problem zu konzipieren, bevor man die Lösung hat. Das ist sehr seltsam. Das cartesianische Denken würde sein, dieses Problem zu betrachten und die Lösung zu untersuchen, aber das ist absolut nicht die Art und Weise, wie Menschen, auch ich selbst, vorgehen. Es ist eher so, dass ich diese Reihe von Lösungen habe, die ich mir vorstellen kann, und daraus kann ich ein Problem rekonstruieren, das ich lösen kann. Es ist typischerweise umgekehrt.
Also beginnen Sie mit einer Lösung oder der Reihe von Lösungen, die Sie in Betracht ziehen möchten, und basierend darauf wählen Sie das Problem aus, von dem Sie denken, dass Sie es lösen können. Denn es gibt viele Probleme, die fantastisch wären, aber die Sie einfach nicht lösen können. Sie wissen, das haben fliegende Autos, ich weiß nicht, wie man einen Anti-Schwerkraft-Motor baut, also verschwende ich nicht einmal Zeit damit, zu überlegen, was das beste Design für ein fliegendes Auto wäre, weil es so weit entfernt ist, dass es nicht einmal ein Problem ist, das meine Zeit wert ist.
Also zurück zu dem, ich denke, wenn wir zu Unsicherheit in der Prognose gehen und dann diese Unsicherheit auf der Optimierungsseite bewältigen, das ist stochastische Optimierung. Ich denke, das Element, und ich bin bei Ihnen mit dem Fortschritt der Technologie, das Element erfordert technologische Zutaten, Konzepte, Paradigmen, ein paar Dinge. Sie sind nicht von Natur aus super schwer, aber wenn Sie anfangs mit diesen Dingen leben, die völlig abwesend sind, ist es sehr schwer, sie aus dem Nichts heraus vorzustellen. Es ist einfach so, dass sie grundsätzlich nicht sehr schwierig sind, aber sie sind sehr seltsam.
Die Menschen nehmen heutzutage als selbstverständlich hin, dass sie mit jemandem auf der anderen Seite der Welt telefonieren können, und das ist eine Selbstverständlichkeit. Sagen Sie das einer Person vor 200 Jahren, und sie würde denken, es sei pure Magie. Sie wissen, dass die Vorstellung, so etwas tun zu können, einfach unvorstellbar war. Können die Menschen es heutzutage tun? Ja, ziemlich einfach. Aber auch hier kennen sie die Lösung, also ist das Nachdenken über das Problem viel einfacher.
Also zurück zu dem, ich glaube, die Herausforderung besteht darin, dass es sehr schwer ist, darüber zu argumentieren, bis Sie die Lösung haben. Und wenn Sie vielleicht in das Produkt übergehen, das Sie bei InsideOpt machen, mit Seeker, dann sind alle Optimierungsprobleme, die Sie in Betracht ziehen möchten, aufgrund Ihres Tools, das keine Art von Unsicherheit behandelt, von Design her diejenigen, bei denen Sie die Unsicherheit paradigmatisch eliminiert haben.
Das ist meine Wunderwaffe, also brauche ich ein passendes Problem. Und das ist es. Dort sehe ich also die größte Herausforderung darin, manchmal das Bewusstsein für die Existenz der Klasse von Lösungen zu schaffen, damit die Menschen überhaupt an die Klasse von Problemen denken können. Ich weiß, ich bin hier sehr meta.
Conor Doherty: Nun, um darauf einzugehen, weil es ein perfekter Übergang ist, vielleicht unbeabsichtigt, aber ich gebe Ihnen trotzdem Anerkennung. Wenn Sie über Erstprinzipien sprechen, beginnend mit dem Problem und dann zur Lösung gehen, sprechen Sie in einem Ihrer Vorträge über das Kaffeeroastery-Problem. Könnten Sie das bitte skizzieren? Denn auch hier handelt es sich um ein sehr anschauliches, sehr angenehmes Beispiel. Definieren Sie, was das Problem ist, und erklären Sie dann, wie wir das stochastisch lösen könnten oder wie wir das Problem mit stochastischer Optimierung lösen könnten.
Meinolf Sellmann: Es handelt sich tatsächlich um ein sehr klassisches Optimierungsproblem. Es wird als Produktionsplanung bezeichnet. Wenn Sie jemals einen Kurs zur Standardarbeit belegt haben, auf den Sie gerade Bezug genommen haben, der die Wunderwaffe für alles in der Optimierung ist, nämlich gemischt-ganzzahlige Programmierung, sind Sie wahrscheinlich auf ein Beispiel zur Produktionsplanung gestoßen.
Was ist also die Produktionsplanung? Sie haben begrenzte Ressourcen, um die Produkte herzustellen, die Sie herstellen möchten, und Sie haben einen erwarteten Gewinn, der mit der Herstellung jeder Einheit jedes Produkts einhergeht. Aber diese Produkte teilen sich diese Produktionsmöglichkeiten. Zum Beispiel Maschinen, die mehrere verschiedene Produkte herstellen können, die Verpackungsstraße, die Röster im Falle von Kaffee, manchmal teilen sie sich die Zutaten. Verschiedene Arten von Kaffees können dieselben Bohnen verwenden. Es handelt sich in der Regel um eine Mischung von Bohnen, die dort hineinkommt.
Die Frage lautet also, was werde ich auf welcher Produktionskapazität und zu welcher Zeit produzieren? Dies ist etwas, das jeden Tag getan werden muss, um Kaffee herzustellen. Es muss jemand da sein, der sagt: “Lassen Sie uns diese rohen Bohnen hier rösten, lassen Sie uns sie in jenem Silo lagern, weil Sie sie nicht sofort verwenden können. Sie müssen abkühlen, bevor Sie sie verpacken.”
Und dann gehen Sie hin und nehmen sie wieder heraus. Sie müssen auch entscheiden, wann Sie was aus welchem Silo nehmen und es zu den Verpackungsstraßen bringen, die begrenzte Kapazitäten haben. Soweit so gut.
Wenn Sie jetzt genau wüssten, wie lange es dauert, den Kaffee zu rösten, wäre das Leben viel einfacher. Auch wenn Sie genau wüssten, wie lange es dauert, bis die Bohnen abkühlen, wäre das Leben viel einfacher. Das Problem ist, dass Sie Schätzungen für beides haben. Je nachdem, wie trocken die Bohnen sind, die in die Rösterei gelangen, ist die Röstzeit kürzer oder länger, um die Bohnen perfekt zu bekommen. Und das bringt natürlich alles durcheinander, weil Sie den Röster nicht einfach alleine lassen können.
Wenn Sie nichts länger als 10 Minuten rösten, müssen Sie ihn ausschalten und wenn Sie ihn ausschalten, dauert es eine halbe Stunde, bis er wieder betriebsbereit ist. Plötzlich haben Sie also diese Nichtlinearitäten, mit denen Sie plötzlich konfrontiert werden, und Sie denken sich, na gut, jetzt hat sich der Röster gerade ausgeschaltet und jetzt viel Glück beim Rösten für die nächsten halbe Stunde.
Nun könnten Sie sagen, was macht es schon, wenn ich das nächste Ding früher röste? Nun, Sie wissen nicht, wohin Sie das Zeug stellen sollen, weil die Silos voll sind und die Verpackung nicht folgt. Um Platz für das nächste Produkt zu schaffen, das aus dem Röster kommen würde, müssen Sie diese Kapazität freigeben, aber das bedeutet, dass Sie Stress auf einen anderen Teil des Systems ausüben.
Und jetzt sitzen Sie da und müssen einen Plan entwickeln. Ich meine, Sie stellen fest, dass Röster tatsächlich für eine bestimmte Zeit stillstehen, ganz einfach, weil sie nicht wissen, wo sie das Produkt, das fertig aber noch nicht verpackt ist, lagern sollen. Und das ist natürlich eine enorme Belastung für die Betriebskosten eines solchen Unternehmens.
Joannes Vermorel: Ich denke, das spiegelt die Tatsache wider, dass man sich vor einer simplen Modellierung in Acht nehmen sollte. Es gibt einen sehr hohen Detailgrad im Geschäft und das ruft auch nach etwas anderem. Die meisten Modelle, die in der Literatur veröffentlicht werden und die meisten Dinge, die Sie in Kursen bekommen, geben Ihnen eine direkte, mehr oder weniger ausgefeilte Lösung für ein schön verhaltenes Problem.
Sie haben also ein Problem, das eine schöne Struktur hat, etwas, das Sie als Lehrer, ich habe an der Universität unterrichtet, nicht zwei Stunden damit verbringen wollen, alle Variablen aufzuschreiben. Sie präsentieren das Problem also so, dass es maximal 10 Variablen hat und dass Sie nicht zwei Stunden damit verbringen, alle Faktoren des Problems zu präsentieren. Sie wollen etwas, das maximal 10 Variablen, maximal drei Gleichungen hat und fertig.
Das ist irreführend, denn die Realität kommt mit vielen Details und was bedeutet das? Es bedeutet, dass es nutzlos ist, eine Lösung, ein Modell, zu bekommen. Es ist nicht ausreichend. Es ist nicht ausreichend, weil Sie Ihre Situation nie genau kennen. Sie werden versuchen, es zu modellieren, dann werden Sie etwas entdecken und dann werden Sie Ihre Modellierung überarbeiten.
Und vielleicht werden Sie sagen, okay, diese Sache ist einfach zu komplex, um sie zu modellieren, ich gebe auf. Aber ich muss diese andere Variable wieder einführen, die ich ignoriert hatte, weil es tatsächlich ein Fehler war, sie zu ignorieren. Sie beeinflusst wirklich meinen Betrieb. Und das Modell selbst, das ist wieder, wenn wir die typische Perspektive der Akademie betrachten, ist das Modell gegeben. Es wird einen Beweis geben, es wird so etwas wie kanonische Formen geben und so weiter.
Und das ist genau das, was Sie bei gemischt-ganzzahliger Programmierung bekommen, wo sie eine Reihe von Problemen haben, die mit kanonischen Formen und so weiter leicht gelöst werden können. Aber die Realität ist, dass Sie es mit einem sich ständig ändernden Problem zu tun haben, und Sie lernen aus der Anwendung des Werkzeugs, das Sie haben, auf das Problem und Sie überarbeiten es.
Und plötzlich erkennen Sie, dass es mehr darauf ankommt, dass Sie etwas brauchen, das wieder abstrakter ist, etwas, das es Ihnen ermöglicht, schnell und effizient von einer Instanz des Problems zur nächsten Instanz des Problems zu wechseln und das kontinuierlich zu tun. Das bedeutet allerlei Dinge. Es muss rechnerisch schnell sein, es muss vielseitig sein, damit Sie alle möglichen unterschiedlichen Lösungen ausdrücken können. Es sollte ziemlich bequem sein, es in den Rest Ihrer Anwendungsumgebung einzubinden.
Es bringt also viele zusätzliche Anliegen mit sich, die wiederum, wenn man die typische mathematische Optimierungsliteratur betrachtet, nicht einmal aufgeführt sind. Sie können von Seite eins bis zur letzten Seite des Buches gehen und an keiner Stelle würden sie diskutieren, nun ja, diese Methode ist super langsam, unpraktisch oder dieser Ansatz ist so starr, dass bei der kleinsten Überarbeitung des Modells Sie es komplett verwerfen und von vorne beginnen müssten.
Oder dieser Ansatz ist so fehleranfällig, dass Sie theoretisch zwar auf diese Weise vorgehen könnten, wenn Sie wie die NASA wären und super kluge Ingenieure und ein Jahrzehnt Zeit hätten, um das Problem anzugehen. Aber in der Praxis, wenn Sie es eilig haben und so weiter, wird es nie funktionieren. Es gibt also viele Meta-Anliegen, die sehr, sehr wichtig sind. Und nochmals, ich glaube, dass es sich auf die Art von Dingen beziehen könnte, die Sie mit Seeker machen und wie Sie über diese Art von Problemen nachdenken.
Meinolf Sellman: Ja. Und ich meine, wenn man sich ansieht, was Sie vorhin gesagt haben, dass wir immer nach einer Wunderwaffe suchen, richtig? Also, Sie haben absolut recht, Joannes, dass wenn Menschen das Geschäft modellieren, und das ist wahrscheinlich das, was das Publikum hier interessiert, ist zu sagen, hey, wie bekommen wir bessere Ergebnisse, die für das Geschäft greifbarer sind?
Sie sind in gewisser Weise gezwungen, eine Annäherung an das wirkliche Leben im Computer zu machen und das irgendwie zu simulieren, richtig? Ich meine, man kann sich jede Optimierungsmodellierung irgendwie als Simulation dessen vorstellen, was passieren würde, wenn ich das tue. Und dann berechnen Sie, was passieren würde, richtig? Ist das immer noch etwas, das der Plan ausführen kann, was wir in der Terminologie der Optimierung als machbar bezeichnen würden?
Also, hält es sich an alle Nebenbedingungen? Das ist ausführbar. Aber zweitens, wie gut ist es eigentlich, richtig? Welche Zielgröße, so messen wir den KPI, den wir optimieren wollen, wird genannt. Würden Sie das wissen, also, also wäre das besser. Aber der Punkt ist jetzt, wenn Sie herumlaufen und das einzige Werkzeug, das Sie kennen, ein Hammer ist, werden Sie sich irgendwann dabei erwischen, Nägel auf Ihre Fenster zu setzen, um Ihre Vorhänge aufzuhängen.
Und das ist eine sehr, sehr schlechte Idee. Und das ist sozusagen das, was die MIP-Leute tun, wenn sie sich mit Dingen wie Supply Chain und Optimierung unter Unsicherheit im Allgemeinen befassen. Denn sie verwenden ein Werkzeug, das für deterministische Optimierung gemacht ist und dafür ist es absolut fabelhaft. Aber es zwingt Sie dazu, Annäherungen sowohl auf der Seite von Determinismus versus Nicht-Determinismus oder Unsicherheit zu machen, muss ich sagen, denn Nicht-Determinismus hat in diesem Kontext eine andere Bedeutung.
Durch die Linearisierung von allem gibt es so viele Beziehungen in einem Unternehmen, die einfach nicht linear sind. Und dann stellt sich die Frage, okay, können Sie das irgendwie approximieren? Können Sie eine stückweise lineare Funktion an Ihre nichtlineare Funktion anpassen? Können Sie Dinge binarisieren? Ist das, was passiert?
Nun, um das für das Publikum greifbarer zu machen, wenn Sie ein Unternehmen führen, sagen wir, Sie sind der CEO eines Unternehmens, klar, Sie können einfach zu Lokad gehen und sagen: “Hey, wir kaufen es von Ihnen”, und sie werden sich um Sie kümmern. Aber sagen wir, Sie haben ein anderes Unternehmen, das dies für Sie tut, oder Sie haben Ihre eigene Abteilung, die dies tut, was sollten Sie tun, um bessere Abläufe zu erzielen?
Also, Sie könnten jetzt interessiert sein und sagen: “Oh, es gibt diese ganze andere Sache und Sie wissen, 20% bessere Betriebskosten klingen fantastisch. Wie bekomme ich das?” Das erste, was Sie tun müssen, ist zu fragen: “Was ist unser Prozess? Ist dies ein Vorhersage- und Optimierungsprozess?” Aber dann auch zweitens: “Welche Freiheiten haben wir uns genommen, um das reale System, mit dem wir tatsächlich arbeiten, zu modellieren? Wo machen wir Annäherungen?”
Und daher sollten Sie für beides tatsächlich verfolgen, um festzustellen, wo die Diskrepanz liegt, sagen: “Okay, schauen Sie, Ihr Optimierungsmodell hatte eine Zielfunktion. Es sagte, ich bevorzuge diese Lösung gegenüber dieser anderen Lösung, weil meine Zielfunktion, die die reale KPI approximieren soll, für diese Lösung besser ist als für die andere. Sagen Sie mir jetzt, für die optimale Lösung, was ist meine erwartete KPI?”
Und verfolgen Sie das, verfolgen Sie das und vergleichen Sie es mit Ihren tatsächlichen Lösungen und Ergebnissen in Ihrem System, die Sie tatsächlich erhalten. Wenn Sie Kosten minimieren, verfolgen Sie die Kosten und betrachten Sie den Unterschied zwischen dem, was das MIP dachte, was die Kosten sein würden, und dem, was Ihre tatsächlichen Kosten tatsächlich sind. Oder wissen Sie, wenn Sie den Gewinn maximieren, nun, dann verfolgen Sie das. Aber der Punkt hier ist folgender: Verfolgen Sie es, betrachten Sie den Unterschied zwischen dem, was zur Entscheidungsfindung verwendet wurde, und dem, was dann tatsächlich realisiert wird.
Und es gibt zwei Quellen für jede Diskrepanz. Die erste ist, dass Sie gezwungen waren, Ihr System in einen Modellierungsrahmen zu zwängen, der zu restriktiv war. Das ist schlecht. Oder die andere ist, dass Sie einfach völlig ignoriert haben, dass es Unsicherheit gibt, und daher kommt die Diskrepanz. Wenn Sie dort eine Diskrepanz von mehr als 5% sehen, müssen Sie mit einem von uns sprechen.
Joannes Vermorel: Und ich würde Ihrer Methode noch etwas hinzufügen, und ich stimme Ihrem Gedankengang zu, den Sie gerade skizziert haben, ich würde sogar etwas hinzufügen, das ich normalerweise sogar vor diesem Prozess empfehle. Also etwas, das ganz am Anfang steht, ist, weil es das Problem mit den falschen Werkzeugen gab, aber ich würde sagen, sogar davor gibt es sogar das Problem, die falschen Konzepte, die falschen Ideen zu haben.
Nur um Ihnen ein Beispiel zu geben, die Vorstellung von Machbarkeit, die in der klassischen Optimierungsliteratur zu finden ist. Die Leute würden sagen: “Oh, es gibt eine Lösung, die machbar oder nicht machbar ist.” Okay, lassen Sie uns ein konkretes Beispiel haben. Ist es etwas, das wirklich so schwarz-weiß ist?
Nur um ein Beispiel zu geben, wir sind in einem Lager und wir geben routinemäßig Bestellungen an Lieferanten weiter. Und das Lager hat eine begrenzte Kapazität für den Wareneingang. An einem beliebigen Tag kann es zum Beispiel maximal 1.000 Einheiten aufnehmen. Darüber hinaus geht es nicht. Und es gibt Dinge, die sich einfach vor dem Lager ansammeln, weil die Leute die Kartons nicht hineinbringen können und so weiter.
Das Problem ist, sagen wir, Sie geben Bestellungen an Übersee-Lieferanten weiter. Sie kontrollieren nicht genau die Liefertermine. Sie wissen, dass Sie, wenn Sie die Dinge arrangieren, im Durchschnitt Ihren Einschränkungen gerecht werden sollten. Aber trotzdem können Sie Pech haben und dann gab es eine Bestellung, die verschoben wurde, eine andere, die etwas schneller kam, und dann haben Sie plötzlich einen Montag, an dem Sie 2.000 Einheiten bekommen. Aber diese Bestellungen wurden vor einem Monat gekauft.
Hier sehen Sie also eine Lösung, bei der für jede Entscheidung, die Sie treffen, eine Wahrscheinlichkeit besteht, dass Sie in eine nicht realisierbare Situation geraten. Es liegt nicht vollständig in Ihrer Kontrolle. Das ist wiederum das Problem bei falschen Konzepten, dass es sehr gefährlich ist, wenn Sie die Situation mit veralteten Konzepten oder zu starren oder unangemessenen Konzepten analysieren. Das Problem dabei ist, dass Sie nicht einmal in die intellektuelle Stimmung kommen können, die es Ihnen ermöglicht, zu schätzen, was Ihnen das bessere Werkzeug tatsächlich bringen wird.
Also stecken Sie fest in machbar, nicht machbar. Nun, sobald Sie verstehen, dass die Machbarkeit nicht vollständig von Ihnen abhängt, gibt es natürlich Dinge, die kollidieren werden. Wenn Sie Lieferanten aus derselben Region, am selben Tag, in derselben Menge mit denselben Häfen usw. bestellen, ist die Wahrscheinlichkeit, dass alles genau am selben Tag bei Ihnen ankommt, ziemlich hoch. Sie würden sich verteilen, aber auch dort gibt es ein gewisses Risiko.
Und das passiert in vielen, vielen Situationen. Und das ist ein Beispiel. Hier sehen wir, dass das, was als selbstverständlich angesehen wird, Machbarkeit, eine machbare Lösung, eine nicht machbare Lösung, nicht genau so ist. Das Konzept ist ein wenig daneben, verstehen Sie?
Ein anderer Ansatz wäre der Service Level. Die Leute würden in Bezug auf den Service Level denken, ja, aber entspricht das wirklich dem, was die Menschen wahrnehmen? Das ist typischerweise der Punkt, an dem ich mich mit der Diskussion über die Servicequalität auseinandersetze. Und die Servicequalität kann die Möglichkeit der Substitutionskannibalisierung oder sogar die Bereitschaft der Menschen zur Verschiebung beinhalten. Und plötzlich haben wir etwas ganz anderes.
Und wenn Sie mit den Konzepten, die Sie aus dieser Welt haben, in der Unsicherheit nicht existiert, direkt zum Problem gehen, wo Ihr Optimierer immer klassisch ist, also nicht stochastisch, dann ist meine Meinung, dass der von Ihnen vorgeschlagene Weg höchstwahrscheinlich unverständlich sein wird. Deshalb ermutige ich meine potenziellen Kunden in der Regel dazu, innezuhalten und wirklich eine kurze Besprechung durchzuführen und die Welt mit verschiedenen Blickwinkeln zu betrachten und sich einfach die Zeit zu nehmen, diese Dinge mit diesem Bauchgefühl zu betrachten, bevor sie in die technischen Details springen, die sehr ablenkend sein können, weil sie ein wenig technisch sind, plus es ist Software, plus es ist ein wenig Mathematik, plus es ist usw., usw. Und das kann eine große Ablenkung sein, insbesondere wenn Sie konkurrierende Anbieter haben, die Tonnen von Unsinn in den Mix werfen wie: “Oh, Sie möchten das alles machen? Wissen Sie was, ich habe die Antwort für Sie, LLMs. Und wissen Sie was, Sie hatten diese Unsicherheit, aber wir haben LLMs, Large Language Models. Sie werden nicht glauben, wie gut diese Prognosen sein werden. Und die Optimierung mit LLMs ist so gut.”
Ist das so? Offensichtlich, wenn die Leute denken: “Okay, ich bin einfach…” Ja, ich meine, zumindest bei Lokad, wenn wir mit potenziellen Kunden sprechen, ist das Problem, dass wir nie alleine mit dem potenziellen Kunden sprechen. Es gibt etwa ein halbes Dutzend anderer Anbieter, die auch ihre Sachen anpreisen, und häufig preisen sie eine Menge Unsinn an. Und so sind die potenziellen Kunden einfach überwältigt von all diesen glänzenden Dingen und diesen abwegigen Behauptungen.
Conor Doherty: Nun, mir fällt auf, dass Sie beide im Grunde genommen eines der Hauptprobleme skizziert haben, um Menschen von stochastischer Optimierung und jeder anderen Art von Black-Box-Technologie zu überzeugen. Es könnte sich um probabilistische Prognosen oder alles, was Mathematik beinhaltet, handeln. Es gibt eine gewisse Einstiegshürde. Und daher, Meinolf, wie versuchen Sie in Ihrer Erfahrung, weil Sie sehr gut im Unterrichten sind, die Menschen dazu zu bringen, sich mit der Art von Unsicherheit, über die wir eine Stunde lang gesprochen haben, wohlzufühlen?
Meinolf Sellman: Es könnte gerade jetzt eine kognitive Diskrepanz beim Publikum geben, bei der sie denken: “Okay, Sie haben uns gesagt, dass die Fluggesellschaften am Tag des Betriebs Geld verlieren, aber aus irgendeinem Grund haben sie diese Technologie seit Jahrzehnten übernommen. Warum zum Teufel verwenden sie nicht die Dinge, über die Lokad und InsideOpt sprechen?” Und der Grund ist genau das, worauf Sie anspielen.
Wenn Sie stochastische Optimierung für etwas wie eine Fluggesellschaft durchführen möchten, würden Sie das Problem so vergrößern, dass Sie es einfach nicht mehr lösen können. Die Leute, die in der Luftfahrtindustrie arbeiten und Optimierung dafür durchführen, sind sehr versiert und sie kennen natürlich sowohl die stochastische Optimierung als auch die traditionelle Optimierung, die jedoch immer auf MIP basierte.
Ich möchte hier nicht zu technisch werden, aber im Wesentlichen gibt es zwei Möglichkeiten, wie Sie nach etwas suchen können. Eine davon ist zu sagen: “Oh, ich habe etwas Gutes gefunden. Mal sehen, ob ich das verbessern kann.” Und die andere Möglichkeit besteht darin zu sagen: “Ich werde hier niemals etwas finden.” MIP funktioniert so, dass es sagt: “Oh, ich muss hier nicht suchen. Es kann hier nicht sein,” und sucht dann an anderer Stelle.
Wenn Ihr Suchraum jedoch sehr groß ist und wenn diese ganze Sache, die Ihnen sagt: “Sie müssen hier nicht suchen,” nicht sehr gut funktioniert, dann suchen Sie überall und es wird viel effektiver, dorthin zu gehen, wo es bereits vielversprechend aussieht, um es so auszudrücken.
Wenn Sie also stochastische Optimierung mit gemischt-ganzzahliger Programmierung durchführen möchten, die auf diese Weise funktioniert, dass Sie sagen: “Oh, ich weiß, dass dort nichts sein kann,” werden Ihre sogenannten Dualgrenzen niemals gut genug sein, um den Suchraum so weit zu reduzieren, dass Sie sich die Suche tatsächlich leisten können. Und daran sind die Leute seit 20-25 Jahren gescheitert.
Und jetzt gibt es diese neue Art, Dinge zu tun, die im Wesentlichen auf einer KI-basierten Suche beruht. Dabei spielt es keine Rolle, ob ich eine Art Qualitätsbegrenzung für die Lösung erhalte, sondern ich versichere Ihnen, dass ich meine gesamte Zeit darauf verwende, die bestmögliche Lösung zu finden, die ich in der zur Verfügung stehenden Zeit finden kann. Es ist sehr pragmatisch und praktisch und das gibt es jetzt.
In diesem Rahmen befreien Sie sich plötzlich auch von allen anderen Fesseln, mit denen Sie zuvor umgehen mussten, wie zum Beispiel der Linearisierung und Binarisierung von allem. All diese Dinge sind verschwunden. Sie können nicht differenzierbare, nicht konvexe Optimierung mit einem Tool wie InsideOpt Seeker durchführen und diese Probleme zu modellieren ist eigentlich kein so großes Problem mehr.
Es gibt noch ein paar andere Vorteile, die Sie daraus ziehen, wie zum Beispiel die Parallelisierung der gemischt-ganzzahligen Programmierung. Dieser Branch-and-Bound-Ansatz ist sehr schwierig durchzuführen. Die Geschwindigkeitssteigerungen sind begrenzt. Sie haben Glück, wenn Sie eine fünffache Geschwindigkeitssteigerung auf einer ziemlich großen Maschine erreichen. Diese KI-basierte Suche profitiert wirklich davon, 40-100 Kerne für ein Problem einzusetzen.
Und so geht es auch mit der Entwicklung der Hardware, dass dies möglicherweise die bessere Technologie ist, die verwendet werden kann. Aber das Fazit ist, dass Sie durch die Verwendung einer anderen Art der Suche in diesen riesigen Räumen den Benutzern ermöglichen, das reale System viel komfortabler zu modellieren, anstatt sich mit einer groben Annäherung daran herumschlagen zu müssen.
Und gleichzeitig können Sie Dinge wie die Mehrzieloptimierung behandeln. Es geht selten nur um einen KPI, es gibt mehrere. Sie können Dinge wie “Oh, ich möchte diese Regel hauptsächlich hier befolgen, aber es ist in Ordnung, wenn sie ab und zu missachtet wird” behandeln. Es ist also in Ordnung, wenn es ein Szenario gibt, in dem diese Sichtbarkeit nicht gilt. Sie können das sehr einfach modellieren.
Und natürlich können Sie auch stochastische Optimierung durchführen, nicht nur im Sinne der Optimierung erwarteter Erträge, sondern Sie können sogar aktiv das Risiko optimieren, das mit Ihren Lösungen einhergeht, einschränken und minimieren. Und das ist der Paradigmenwechsel. Das ist es, was Lokad und InsideOpt antreibt, zu sagen: “Hey, schaut mal, es gibt ein völlig neues Paradigma, dem wir folgen können, das uns ermöglicht, all diese Dinge zu tun, von denen in den letzten drei Jahrzehnten noch nie die Rede war.”
Conor Doherty: Joannes, dieselbe Frage.
Joannes Vermorel: Danke. Ja, und ich möchte auch darauf hinweisen, dass in den frühen 2000er Jahren, als ich mein Promotionsstudium begonnen habe, das ich nie abgeschlossen habe, die interessante Sache ist, dass sich die Überzeugung der Machine-Learning-Community und der Optimierungscommunity über die grundlegenden Probleme der Optimierung als völlig falsch herausgestellt hat.
Als ich mein Promotionsstudium gemacht habe, war die Überzeugung der Fluch der Dimensionalität. Wenn Sie ein hochdimensionales Problem haben, können Sie nicht optimieren. Und jetzt haben wir es mit Deep-Learning-Modellen zu tun, die Milliarden oder sogar Billionen von Parametern haben. Also ja, offensichtlich können wir Probleme optimieren, kein Problem.
Dann dachten sie, wenn es nicht konvex ist, kann man nichts tun. Es stellt sich heraus, dass man tatsächlich viele Dinge tun kann, auch wenn es nicht konvex ist. Und tatsächlich haben wir keinerlei Beweis, aber wenn Sie etwas haben, das nach anderen Kriterien ziemlich gut und nützlich ist, spielt es keine Rolle, dass Sie nicht beweisen können, dass es optimal ist, solange Sie andere Möglichkeiten haben, über die Lösung nachzudenken und zu sagen: Nun, ich kann nicht über die Optimalität nachdenken, aber ich kann immer noch darüber nachdenken, dass es eine ausgezeichnete Lösung ist, auch wenn ich keinen mathematischen Beweis habe.
Und dann gab es all diese Dinge, bei denen auch die Idee, dass ich lange Zeit, als ich die stochastische Optimierung betrachtet habe, die Leute sagen würden: “Oh, das war es, was du erwähnt hast, dass man die Dimension erweitert. Du sagst also, du wirst tausend Szenarien aufschreiben und diese tausend Szenarien als nur eine Situation betrachten, die du auf einmal optimieren möchtest.”
Es ist nur eine Makroerweiterung. Sie nehmen einfach Ihr Problem, erweitern es makro und erhalten ein Problem, das tausendmal größer ist. Und dann sagen Sie: “Okay, jetzt bin ich wieder am Anfang. Ich kann das tatsächlich optimieren.” Aber indem Sie das tun, hatten Sie bereits mit den alten Branch-and-Bound-Paradigmen eine schreckliche Skalierbarkeit.
Wenn Ihr erster Schritt darin besteht, Ihr Problem um den Faktor 1.000 zu erweitern, wird es absolut dramatisch langsam. Und was die Deep-Learning-Community so überrascht hat, war die unglaubliche Effizienz des stochastischen Gradientenabstiegs, bei dem Sie einfach Situationen beobachten und jedes Mal, wenn Sie etwas beobachten, die Parameter ein wenig anpassen können.
Und es gab viele Erkenntnisse. Und das Interessante, was ich in den letzten zwei Jahrzehnten gesehen habe, ist, dass maschinelles Lernen und Optimierung parallel voranschreiten, hauptsächlich durch die Zerstörung vorheriger Überzeugungen. Das war ein sehr interessanter Prozess.
Die meisten Durchbrüche im Deep Learning kamen durch bessere Optimierungswerkzeuge, bessere Nutzung von Linearalgebra und GPUs, spezielle Arten von Computertechnik und mathematische Optimierung. Immer mehr verwendet Techniken aus dem maschinellen Lernen, bei denen Sie nicht zufällig suchen möchten.
Es gibt Situationen, in denen Sie sagen: “Nun, diese Dinge hier kann ich nichts beweisen, aber es sieht sehr schlecht aus.” Also, und es sieht einfach schlecht aus, diese ganze Nachbarschaft ist wie Mist, also muss ich woanders suchen. Und auch andere Überlegungen wie “Ich habe bereits viel Zeit in diesem Bereich verbracht, also sollte ich vielleicht woanders suchen, auch wenn es allgemein gesehen ein guter Bereich ist.”
Und das ist diese Art von Optimierungstechnik, die sehr stark auf maschinelles Lernen ausgerichtet ist. Meine Meinung ist, dass es vielleicht in 20 Jahren eine Domäne geben wird, die sich vereint hat, die wie maschinelles Lernen und Optimierung ist und bei der man die beiden nicht wirklich unterscheidet.
Es ist eine der Dinge, die ich seit zwei Jahrzehnten im Blick habe, und jedes Jahr, das vergeht, sehe ich diese allmähliche Konvergenz. Und es ist sehr faszinierend, weil ich das Gefühl habe, dass noch immer Konzepte fehlen.
Meinolf Sellman: Ja, und ich möchte mich auf eine Sache konzentrieren, die du da gesagt hast. Maschinelles Lernen ist großartig, wenn man wiederholte Spiele hat. Es ist wie das Kartenzählen beim Blackjack. Man kann nicht garantieren, dass man gewinnt, es besteht immer noch die Möglichkeit, dass die Vorhersage falsch ist, aber wenn man dieses Spiel wiederholt spielt, hat man plötzlich einen großen Vorteil.
Und deshalb habe ich vorhin gesagt: “Schau dir deine operativen Ergebnisse, deinen Gewinn, deine Kosten oder was auch immer du für einen bestimmten Zeitraum machst, an.” Denn an einem beliebigen Tag kann die Lösung, die du ausgeführt hast, falsch sein. Es ist ein bisschen wie jemand, der sagt: “Oh, ich werde diesen Würfel werfen, und wenn er eine Vier zeigt, verlierst du und musst mir einen Dollar bezahlen, um zu spielen. Aber wenn es alles außer einer Vier ist, gebe ich dir eine Million Dollar.” Und dann gibst du ihnen den Dollar und wirfst den Würfel und es zeigt eine Vier. Es war die richtige Entscheidung, das zu tun, oder? Denn wenn man dieses Spiel wiederholt mit dieser Strategie spielt, weil der erwartete Wert natürlich so hoch ist und der Verlust in jeder Hinsicht sehr machbar ist, hat man plötzlich einen echten Vorteil. Und das ist sozusagen das Spiel, wenn man maschinelles Lernen in der Optimierung einsetzt. Das ist genau dieses Paradigma der KI-basierten Suche. Wir nennen es hyperreaktive Suche. Ich weiß nicht, wie ihr es bei Lokad nennt, aber das ist genau diese Idee, oder?
Kann ich, für eure Probleme, das ist sozusagen das, was InsideOpt Seeker antreibt. Das ist das, was der Solver für euch tun wird, sobald ihr wisst, was euer Modell ist und welche Probleme ihr löst. Und was, jetzt jeden Tag, habt ihr diese operativen Probleme, die ihr entscheiden müsst. Was werde ich heute rösten? Wie viel Inventar werde ich heute umlagern und wohin? Und ihr habt diese Instanzen, die ihr im Laufe vieler verschiedener Wochen und Produktionstage durchführen müsst.
Dann geht ihr hin und fragt den Solver: “Hey, schau dir mal deine Strategien an, wie du diesen Raum tatsächlich durchsuchst. Hättest du bessere Lösungen gefunden, wenn du anders gesucht hättest?” Und dann wird er sich genau die Laufzeitmerkmale ansehen, wie das von dir erwähnte, Joannes, wie zum Beispiel: “Oh, wie lange ist es her, dass ich an einem anderen Ort gesucht habe?” Es scheint, als hätte ich diese ganze Idee hier gründlich durchsucht. Mal sehen, ob ich etwas anderes tun kann.
Und andere ähnliche Dinge, oder? Und diese Laufzeitmerkmale beeinflussen dann andere Entscheidungen, wie zum Beispiel, wie viele Dinge bin ich bereit gleichzeitig zu ändern, richtig? Sollte ich tatsächlich eine Untersuchung durchführen? Wenn es erst vor kurzem ist, dass ich zu einem Suchraum gekommen bin, könnte es eine sehr gute Idee sein, sehr gierig zu sein, um zu sagen: “Hey, jede Verbesserung, die ich jetzt machen kann, werde ich einfach nehmen, um eine gute Lösung in diesem Raum zu finden.”
Aber nach einer Weile, wenn ihr schon eine Weile dabei seid, werdet ihr sagen: “Nun, ich muss meinen Horizont ein wenig erweitern, weil ich möglicherweise in etwas stecke, das nur lokal optimal ist, aber global gesehen hätte ich andere Variablen viel besser setzen können, so dass ich insgesamt etwas Besseres hätte tun können.” Und das ist gerade der Paradigmenwechsel, oder? Es geht weg von diesem ganzen Denken: “Kannst du schnell erkennen, dass hier nichts ist?” zu “Kann ich lernen, besser zu suchen?” Und das ist die Revolution.
Joannes Vermorel: Um auf die KI-Suche einzugehen. Ja, absolut. Und besonders bei der Art von Problemen, die Lokad für unsere Kunden löst, können die meisten Lieferketten umfassend gierig angegangen werden, nicht komplett, aber umfassend. Und dafür gibt es einige darwinistische Gründe. Wenn es Lieferketten-Situationen gäbe, die wirklich, würde ich sagen, dem gierigen Ansatz entgegenstehen, wären sie bereits ausgeschieden, eliminiert worden, weil Unternehmen nicht den Luxus hatten, super ausgeklügelte Optimierungswerkzeuge zu haben.
Also mussten sie, und das war oft eine Designüberlegung, die Frage stellen: “Kann ich meine Lieferkette und meine Prozesse so einrichten, dass ich mich in die richtige Richtung bewegen kann und trotzdem in Ordnung bin?” Das war typischerweise das Leitprinzip auf Designebene. Und dann stellt man tatsächlich fest, dass man, wenn man ins Detail geht, stecken bleiben kann, auch wenn man sich in die richtige Richtung bewegt.
Typischerweise würde sich Lokad also umfassend auf die gierige Perspektive verlassen, auch wenn man bis zum Ende mit Gradienten geht, wenn man sie hat. Und dann, tatsächlich, die lokalen Anpassungen vornehmen, wenn man in die Endphase kommt, in der man die Mikroanpassungen vornehmen möchte und vielleicht etwas widerstandsfähiger sein möchte. Wenn man also eine Anpassung vornehmen kann, die nicht viel kostet, aber einem viel mehr Spielraum in den Operationen gibt, wäre das nur, um es für das Publikum konkreter zu machen.
Nehmen wir zum Beispiel an, ihr betreibt ein Lager. Ihr denkt, dass es eine 0,1%ige Chance gibt, dass euch die Verpackungskartons ausgehen, um eure Sachen zu versenden. Es mag wie ein Ereignis mit geringer Wahrscheinlichkeit erscheinen, aber andererseits fühlt es sich sehr dumm an, das Lager einmal in ein paar Jahren zu schließen, nur weil euch der supergünstige Karton ausgeht. Also würdet ihr sagen: “Okay, es ist so wenig, dass wir ein paar Monate extra Kartons haben sollten.”
Weil sie gefaltet sind, nehmen sie überhaupt keinen Platz ein, sie sind supergünstig. Das sind die Arten von Dingen, bei denen eine kleine zusätzliche Optimierung sagen würde, die Leute würden sagen: “Oh, wir haben eine dreitägige Vorlaufzeit für diese Kartons. Wir haben bereits einen Monat auf Lager.” Die Leute würden sagen: “Oh, das reicht aus. Wir haben genug.” Und dann macht ihr die Simulation und sagt: “Wisst ihr was? Ihr habt immer noch dieses 0,1%ige Risiko. Es ist ziemlich dumm. Ihr solltet lieber drei Monate haben.”
Und sagt: “Okay, es ist sehr günstig, aber es fühlt sich wirklich viel an.” Aber sagt: “Nun ja, es ist supergünstig. Es nimmt nicht so viel Platz ein. Und warum riskieren?” Das sind die Arten von Dingen, die etwas gegenintuitiv sind, bei denen man realisieren würde, dass es, ja, dieses Ding passiert nur einmal in ein paar Jahren. Aber dann gibt es viele Dinge, die nur einmal in ein paar Jahren passieren.
Und genau da ist es wichtig, eine gute Optimierung zu haben, die euch bei diesen Dingen unterstützt, die so selten sind, dass es für den menschlichen Verstand so wirkt, als wäre es ein anderes Leben gewesen. Ich meine, Menschen wechseln. Sie bleiben selten zwei Jahrzehnte lang im selben Job. Also wahrscheinlich hat der Lagerleiter etwas, das einmal in drei Jahren passiert, noch nie gesehen. Die Teams, die meisten Leute erinnern sich nicht einmal daran, das Ding gesehen zu haben.
Es gibt also eine Grenze dafür, was man wahrnehmen kann, wenn es unterhalb der Wahrnehmungsschwelle liegt, weil es zu selten ist. Und dennoch ist es extrem. Es gibt so viele verschiedene Dinge, die, wenn man sie zusammenfügt, erkennt man, dass es nicht nur 0,1% plus eine andere Sache ist, die bei 0 liegt, plus eine andere Sache. Und man fügt Dutzende und Dutzende und Dutzende hinzu, und am Ende des Tages hat man etwas, wo jeden Monat eines dieser Probleme auftritt, das hätte verhindert werden können, wenn man das Risiko wirklich berücksichtigt hätte.
Aber es ist ein wenig gegenintuitiv, weil man ein wenig mehr in allen möglichen Bereichen ausgibt. Warum das Extra? Nun, das Extra ist, weil, nun ja, selten, aber fast sicher, gerät man in Schwierigkeiten, wenn man es nicht hat.
Meinolf Sellman: Ja, und das ist tatsächlich die Falle, in die man gerät, wenn man eine nachweislich optimale Lösung hat. Es klingt so, als würde man sagen: “Okay, schaut mal, das ist meine nachweislich optimale Lösung, und ich habe gute Prognosen.” Aber wenn die Prognosen leicht daneben liegen, ist diese nachweislich optimale Lösung, weil sie den letzten Cent aus der Lösung herausgepresst hat, extrem brüchig. Und links und rechts von dieser Prognose geht die Leistung nach unten und ist miserabel.
Und ihr wollt eine Technologie, die es euch ermöglicht zu sagen: “Ja, euer erwarteter Gewinn ist um 80 Cent geringer, aber euer Risiko, das Lager schließen zu müssen, ist um 75% reduziert. Guter Deal, oder?” Es ist ein guter Deal. Und genau das sind die Art von Kompromissen, die ihr mit Hilfe der Technologie finden wollt, denn es ist sehr, sehr schwierig für euch zu sagen: “Okay, schaut mal, ich möchte das eine einschränken und das andere optimieren”, denn dann geratet ihr in eine andere Trade-off Falle.
Ihr wollt sagen können: “Schaut mal, ich habe all diese Bedenken. Versucht einen guten Kompromiss zu finden. Findet mir die günstigste Versicherung gegen ein Ereignis wie dieses und jenes.” Und das ist sozusagen, ihr wisst schon, vielleicht schließt sich der Kreis damit, wie wir angefangen haben, wie schwer es sein kann, die Entscheidungsfindung und die Unsicherheit zu verstehen.
Aber das ist im Wesentlichen, worum es geht. Der Irrtum besteht darin zu glauben, dass eine Lösung, die optimal für eine vorhergesagte Zukunft ist, wahrscheinlich auch für leicht abgeleitete zukünftige Szenarien gut funktionieren wird. Und das ist einfach nicht wahr. Ihr müsst aktiv nach einem großartigen Kompromiss-Operationsplan suchen, der gegen eine große Wahrscheinlichkeitsmasse von zukünftigen Ereignissen funktioniert, die tatsächlich eintreten können. Und ihr wollt es so haben, dass es euer Risiko und eure erwarteten Erträge vernünftig abwägt.
Conor Doherty: Korrigiert mich, wenn ich falsch liege, aber das ultimative Ziel der stochastischen Optimierung wäre es dann, den optimalen Kompromiss oder die optimale Entscheidung zu finden, der alle Einschränkungen und Trade-offs ausbalanciert, die man treffen muss. Und das ist nicht die perfekte Entscheidung, aber es wäre der beste Kompromiss, um alle Entscheidungen oder alle separaten Probleme zu erfüllen, oder?
Meinolf Sellman: Richtig. Wir könnten das mathematisch machen, aber ich möchte die Leute nicht in diese Richtung führen. Der Punkt ist folgender: Hättest du genau gewusst, was passieren würde, gäbe es oft eine bessere Lösung, die du hättest ausführen können. Aber in Abwesenheit des perfekten Wissens über die Zukunft, und ich meine wirklich perfektes Wissen, nicht nur, weißt du, 99,9% perfektes Wissen, in Abwesenheit dessen musst du einen Kompromiss ausführen, der im Grunde genommen für alle möglichen Dinge, die passieren könnten, gut ist.
Und das ist genau das, was die stochastische Optimierung für dich tut. Und dadurch entfernt sie die Fragilität. Wir könnten sagen, es ist robuste Optimierung, aber das ist ein eigener technischer Begriff, den wir nicht verwenden können. Aber das ist gemeint, oder? Du möchtest die Zerbrechlichkeit entfernen, du möchtest die Fragilität in deinen Abläufen entfernen. Sehr zuverlässige, kontinuierliche, wiederholbare Ergebnisse haben. Das ist es, was dir die stochastische Optimierung geben wird. Und gleichzeitig werden deine erwarteten Gewinne tatsächlich über das hinaus steigen, was du für möglich gehalten hast.
Denn wenn du dich nur auf die Leistung der Kreuzvalidierung und die nachweisbare Optimalität verlässt, verpasst du völlig den Punkt. Es gibt das, was du denkst, ist der Preis dafür, dass du die Zukunft nicht perfekt kennst, der Preis dafür, dass du in der Optimierung annimmst, dass du die Zukunft perfekt kennst. Das ist es, was es zerbrechlich macht, dass du annimmst, dass diese Prognose zu 100% korrekt war. Und so funktioniert die traditionelle Optimierungstechnologie, und du musst sie verwerfen und mit moderner Technologie arbeiten, um diese 20%, leicht 20% der Betriebskosten, die du reduzieren kannst, zu nutzen.
Conor Doherty: Nun, vielen Dank. Ich denke, wir kommen langsam zum Ende. Joannes, ich gebe dir einen letzten Kommentar und dann überlasse ich es Meinolf, das Ganze abzuschließen. Möchtest du noch etwas hinzufügen?
Joannes Vermorel: Ich meine, ja, das Faszinierende ist, dass die beste Supply Chain, wie sie aussieht, und die besten, ich würde sagen, risikobereinigten Entscheidungen diejenigen sind, bei denen das Unternehmen sanft vor sich hin summt, wo es keine absolut kritische katastrophale Entscheidung gibt, die getroffen wird und alles in die Luft jagt.
Und das ist es, was die Leute erwarten würden, dass der genialste Supply-Chain-Plan aller Zeiten dieses eine Produkt identifiziert, das vom Markt völlig ignoriert wurde, und sagen würde: “Wisst ihr was, wir müssen uns voll und ganz auf dieses eine Produkt konzentrieren, das super-nischig war und schwuppdiwupp eine Million Einheiten verkaufen, während niemand auch nur hingesehen hat.” Ich sage, das ist Magie. Nein, ich meine, vielleicht gibt es Steve-Jobs-artige Unternehmer, die das können, aber es ist fast unmöglich.
Also die Idee, dass du die Zukunft ergreifen kannst, den goldenen Nugget, die Bitcoin-ähnliche Gelegenheit identifizieren und voll darauf setzen und ein Vermögen machen kannst, ist sehr lächerlich. Wie es aussieht, würde ich sagen, ist eine ausgezeichnete Supply-Chain-Verwaltung, dass sie sanft vor sich hin summt. Ihr trefft risikobewusste Entscheidungen, so dass es, wenn es schlecht läuft, tatsächlich sehr moderat schlecht ist. Wenn es gut läuft, ist es die meiste Zeit sehr gut, also sehr solide profitabel. Wenn es schlecht läuft, ist es begrenzt und nicht schrecklich.
Und wenn du eine Entscheidung überdenkst, gehst du zurück in die Zeit und schaust sie dir an, ja, wenn ich es gewusst hätte, hätte ich es anders gemacht. Aber wenn ich die ehrliche Übung mache, um wieder in die Dinge zurückzukehren, die ich zu der Zeit wusste, sage ich, ja, es war damals eine vernünftige Entscheidung. Und lass dich nicht verwirren, lass nicht zu, dass die Nachsicht dein Urteil darüber beeinflusst, denn das ist sehr schlecht.
Und ich wusste zum Beispiel, dass einige unserer Kunden das nicht mehr tun, aber in der Luft- und Raumfahrt würden sie zum Beispiel nach jedem einzelnen AOG (Flugzeug am Boden) Vorfall, also wenn ein Teil fehlt und das Flugzeug nicht mehr fliegen kann, eine ganze postmortale Untersuchung durchführen. Aber die Realität war, wenn du 300.000 SKUs auf Lager haben musst, um das Flugzeug die ganze Zeit fliegen zu lassen, meine ich, es ist in Ordnung, Teile nicht immer sofort verfügbar zu haben, besonders wenn du einige Teile hast, die einen Preis von einer halben Million Dollar und mehr pro Einheit haben.
Also haben wir untersucht, dass zum Beispiel diese AOGs genau wie erwartet gemäß der Risikostruktur ihrer Bestände waren. Es gab also keinen Grund, irgendwelche Untersuchungen durchzuführen. Und das wäre mein abschließender Gedanke, dass der wahrscheinlich schwierigste Verkaufsargument für stochastische Optimierung ist, dass es ziemlich unbeeindruckend ist. Du weißt schon, es ist einfach etwas, das sanft vor sich hin summt. Die Probleme sind viel weniger schlimm, die Erfolge sind etwas weniger extrem, aber viel häufiger.
Aber was erinnerst du dich? Erinnerst du dich an eine Fußballmannschaft, die konsequent 60-70% ihrer Spiele in den letzten 30 Jahren gewinnt? Oder erinnerst du dich an dieses eine Team, das alle Spiele verliert, aber in einer Reihe 10 Spiele gegen die angesehensten Teams gewinnt? Du würdest natürlich diese absolut extreme Erfolgsserie in Erinnerung behalten und sagen: “Oh, das war unglaublich.” Und du würdest die Art von langweiliger Erfolgsbilanz komplett vergessen, wo es im Durchschnitt einfach ausgezeichnet ist, aber eben nur der Durchschnitt, also erinnerst du dich nicht daran.
Siehst du, das ist meine Art von Vibe. Und ich denke, es gehört dazu, zu akzeptieren, dass du aus stochastischer Optimierung sanfte, unbeeindruckende Entscheidungen bekommst, die sich im Durchschnitt als ziemlich gut herausstellen. Wenn sie schlecht sind, sind sie etwas schlecht, nichts, du wirst nicht dein Hemd verlieren. Es gibt viel Schadensbegrenzung.
Und das Lustige ist, dass wir bei Lokad, wenn wir mit unseren Kunden sprechen, sehr häufig wenig zu sagen haben, wenn wir seit einigen Jahren in Produktion sind. Das Schlimmste, ich meine, nicht das Schlimmste, aber das beste Kompliment auf der anderen Seite ist, weißt du was, du bist so ereignislos, dass wir die Supply Chain in unserer Liste der Anliegen nicht mehr so hoch priorisieren. Es ist so, als hättest du Zugang zu fließendem Wasser, weißt du, es ist ereignislos, also musst du nicht so viel Aufmerksamkeit darauf richten, es funktioniert einfach so. Und das ist in Ordnung, weißt du, das ist, wir sind nicht so gut, du weißt schon, offensichtlich sind Supply Chains noch nicht so ereignislos wie die Wasserversorgung, aber es gibt diese Art von Vibe.
Conor Doherty: Nun, vielen Dank, Joannes. Meinolf, wie üblich geben wir dem Gast das Schlusswort. Also, das Wort gehört Ihnen, und dann schließen wir bitte.
Meinolf Sellman: Ja, nun, nochmals vielen Dank, Conor und Joannes, dass ihr mich eingeladen habt. Um das zu ergänzen, was Joannes gesagt hat, stellen wir häufig fest, dass unsere operativen Teams überrascht sind, während ihre Kunden nicht überrascht sind. Und das ist genau das, was man möchte. Die operativen Teams sind überrascht, dass plötzlich alles so reibungslos läuft, wo es früher immer, wissen Sie, einmal pro Woche einen Tag des Grauens gab, und plötzlich sind es zwei Monate und man denkt sich, das funktioniert einfach und es gibt keine Verrücktheiten, nichts.
Aber was noch wichtiger ist, ist, dass ihre Kunden nicht mehr überrascht sind, weil sie plötzlich ohne Service oder so etwas dastehen. Und dafür ist Ihr Unternehmen da, und deshalb sollten Sie diese Art von Technologie verwenden, um Ihre Operationen zu führen, weil Sie Ihre Kunden nicht schlecht überraschen wollen. Und dann können Sie einen sehr langweiligen Margarita auf einer schönen Insel trinken und Ihre durchschnittlichen Erträge genießen, die mit sehr geringer Varianz einhergehen.
Conor Doherty: Nun, meine Herren, ich habe keine weiteren Fragen. Joannes, vielen Dank für Ihre Zeit. Meinolf, es war mir eine absolute Freude, und vielen Dank, dass Sie dabei waren. Und vielen Dank an alle, die zugeschaut haben. Wir hoffen, wir sehen uns beim nächsten Mal.