Einer der Forschungsschwerpunkte von Lokad besteht darin, etwas Einfaches (und Grundlegendes) neu zu betrachten und zu versuchen, es ein wenig besser (und ein wenig einfacher) zu machen. Dieser Ansatz ist im Grunde genau das Gegenteil der meisten Forschungspapiere, die meist komplexere Versionen früherer Arbeiten darstellen. Einer der F&E-Ingenieure von Lokad, Antonio Cifonelli, wandte diesen Ansatz in seiner Doktorarbeit an, indem er das ehrwürdige Modell des exponentiellen Glättens überarbeitete, um es erklärbarer zu machen.

Zwei Abbildungen aus einer Doktorarbeit über Probabilistisches exponentielles Glätten für Explainable AI im supply chain-Bereich.

Erklärbarkeit als Eigenschaft eines Modells wird häufig missverstanden, sowohl in ihrer Natur als auch in ihrer Intention – zumindest was supply chains angeht. Ein erklärbares Modell zu haben, bedeutet nicht, Ergebnisse zu erzielen, die von einem menschlichen Verstand leicht verstanden oder validiert werden können. Das wäre sehr fehlerhaft, denn bereits ein halbes Dutzend Fließkommaoperationen genügen oft, um die meisten Menschen zu verwirren, selbst diejenigen, die sich im Umgang mit Zahlen sicher fühlen. Der menschliche Verstand ist schlichtweg (natürlich) nicht besonders geübt in grundlegender Arithmetik; schließlich war dies der erste Bereich, der in den 1950er Jahren von Maschinen übernommen wurde. Zudem soll Erklärbarkeit das Modell nicht vertrauenswürdig machen – naja, nicht ganz. Es gibt verlässlichere Instrumente (backtesting, cross-validation etc.), um zu beurteilen, ob einem Modell zu trauen ist oder nicht. Die Fähigkeit, eine Erzählung über das Modell und seine Ergebnisse zu entwickeln, sollte nicht als ausreichender Grund für Vertrauen angesehen werden.

Aus der Perspektive von Lokad besteht der Sinn von Erklärbarkeit darin, die Möglichkeit zu bewahren, den supply chain mittels einer Variante des Modells zu steuern, wenn eine Störung das ursprüngliche Modell ungültig macht. Supply chain Störungen sind vielfältig: Kriege, Zölle, Lockdowns, Insolvenzen, Stürme, Rechtsstreitigkeiten usw. Tritt eine Störung auf, wird das prädiktive Modell in subtiler, aber wesentlicher Hinsicht ungültig. Das bedeutet jedoch nicht, dass alle vom Modell erfassten Muster irrelevant werden. So kann beispielsweise das Saisonalitäts- Profil des Modells völlig unberührt bleiben.

Daher sollte ein erklärbares Modell Möglichkeiten bieten, einem Supply Chain Scientist Änderungen, Anpassungen oder Verzerrungen am ursprünglichen Modell vorzunehmen, um eine Variante zu erhalten, die die Störung angemessen widerspiegelt. Natürlich werden diese Änderungen als grobe Schätzungen – heuristisch bedingt – erwartet, da präzise Daten noch nicht vorliegen. Dennoch gilt, wie das von Lokad verfolgte Mantra besagt: Es ist besser, annähernd richtig zu liegen, als exakt falsch.

Für weitere Details dazu, wie erklärbare Modelle aussehen könnten, siehe unten das Doktorarbeitsmanuskript von Dr Cifonelli.

Author: Antonio Cifonelli

Date: December 2023

Abstract:

Die Schlüsselrolle, die KI bei der Verbesserung von Geschäftsabläufen spielen könnte, ist schon lange bekannt (zumindest seit 2017), doch der Durchdringungsprozess dieser neuen Technologie hat innerhalb von Unternehmen gewisse Hindernisse, insbesondere bei den Implementierungskosten, zutage gefördert. Unternehmen hängen an ihren alten Systemen, weil der Energie- und Kostenaufwand für einen Wechsel enorm ist. Im Durchschnitt dauert es 2,8 Jahre vom Lieferantenauswahlprozess bis zur vollständigen Implementierung einer neuen Lösung. Bei der Entwicklung eines neuen Modells sind drei grundlegende Punkte zu beachten: das Auseinanderklaffen der Erwartungen, das Bedürfnis nach Verständnis und Erklärung sowie Leistungs- und Zuverlässigkeitsfragen. Im Falle von Modellen, die sich mit supply chain-Daten befassen, gibt es zusätzlich fünf spezifische Herausforderungen:

  • Umgang mit Unsicherheit. Genauigkeit ist nicht alles. Entscheidungsträger suchen nach Möglichkeiten, das mit jeder Entscheidung verbundene Risiko angesichts von Unsicherheit zu minimieren. Es wäre vorteilhaft, eine exakte Prognose zu erstellen; eine einigermaßen genaue Prognose zu erhalten und deren Grenzen zu berechnen, ist jedoch realistisch und angemessen.
  • Umgang mit ganzzahligen und positiven Daten. Die meisten im Einzelhandel verkauften Artikel können nicht in Untereinheiten verkauft werden – etwa eine Konserve, ein Ersatzteil oder ein T-Shirt. Dieser einfache Aspekt des Verkaufs führt zu einer Vorgabe, die jedes Verfahren oder Modell erfüllen muss: Das Ergebnis muss eine positive ganze Zahl sein.
  • Beobachtbarkeit. Die Kundennachfrage kann nicht direkt gemessen werden; es können lediglich die Verkäufe aufgezeichnet und als Stellvertreter für die Nachfrage herangezogen werden.
  • Knappheit und Sparsamkeit. Verkäufe sind unstetige Größen: Ein Produkt kann in einer Woche gut abgesetzt werden und in der folgenden Woche überhaupt nicht. Durch die tägliche Erfassung der Verkäufe wird ein ganzes Jahr auf lediglich 365 (oder 366) Datenpunkte verdichtet. Zudem wird ein Großteil dieser Punkte den Wert null aufweisen.
  • Just-in-time-Optimierung. Prognosen sind eine Schlüsselkomponente, stellen aber nur ein Element in einer Prozesskette dar, die die Entscheidungsfindung unterstützt. Zeit ist eine kostbare Ressource, die nicht ausschließlich einer einzigen Funktion gewidmet werden kann. Der Entscheidungsprozess und die damit verbundenen Anpassungen müssen daher in einem begrenzten Zeitrahmen erfolgen und so flexibel gestaltet sein, dass sie bei Bedarf unterbrochen und neu gestartet werden können, um unerwartete Ereignisse oder notwendige Anpassungen zu integrieren.

Diese Dissertation passt in diesen Kontext und ist das Ergebnis der im Herzen von Lokad durchgeführten Arbeit – einem in Paris ansässigen Softwareunternehmen, das die Lücke zwischen Technologie und supply chain überbrücken will. Die Doktorarbeit wurde von Lokad in Zusammenarbeit mit der ANRT im Rahmen eines CIFRE-Vertrags finanziert. Die vorgeschlagene Arbeit zielt darauf ab, einen guten Kompromiss zwischen neuen Technologien und den Erwartungen der Wirtschaft zu finden, indem sie die oben dargestellten Aspekte berücksichtigt. Wir haben begonnen, Prognosen mithilfe grundlegender Methoden – der Familie des exponentiellen Glättens – zu erstellen, die einfach zu implementieren und äußerst schnell in der Ausführung sind. Da sie in der Industrie weit verbreitet sind, haben sie bereits das Vertrauen der Anwender gewonnen. Zudem sind sie leicht zu verstehen und einem unkundigen Publikum erklärbar. Durch den Einsatz fortschrittlicherer KI-Techniken können einige der Einschränkungen der verwendeten Modelle überwunden werden. Cross-Learning erwies sich als ein relevanter Ansatz, um nützliche Informationen zu extrapolieren, wenn die Anzahl verfügbarer Daten sehr begrenzt war. Da die übliche Annahme einer Gaußschen Verteilung für diskrete Verkaufsdaten nicht geeignet ist, schlugen wir vor, ein Modell zu verwenden, das entweder mit einer Poisson-Verteilung oder mit einer negativen Binomialverteilung verknüpft ist – was der Natur der Phänomene, die wir modellieren und vorhersagen möchten, besser entspricht. Zudem schlugen wir vor, Simulationen einzusetzen, um mit Unsicherheit umzugehen. Mithilfe von Monte-Carlo-Simulationen werden zahlreiche Szenarien erzeugt, stichprobenartig ausgewertet und anhand einer Verteilung modelliert. Aus dieser Verteilung lassen sich Konfidenzintervalle unterschiedlicher, angepasster Größe ableiten. Anhand realer Firmendaten verglichen wir unseren Ansatz mit modernen Methoden wie dem Deep Auto-Regressive (DeepAR) Modell, dem Deep State Space (DeepSSMs) Modell und dem Neural Basis Expansion Analysis (N-Beats) Modell. Daraus leiteten wir ein neues Modell basierend auf der Holt-Winter-Methode ab. Diese Modelle wurden in Lokads Arbeitsablauf implementiert.

Jury:

Die Verteidigung fand vor einer Jury statt, die sich zusammensetzte aus:

  • M. Massih-Reza AMINI, Professor an der Université Grenoble, Alpes, Gutachter.
  • M.me Mireille BATTON-HUBERT, Professorin an der École des Mines de Saint-Étienne, Gutachterin.
  • M.me Samia AINOUZ, Professorin an der INSA Rouen, Normandie, Prüferin.
  • M. Stéphane CANU, Professor an der INSA-Rouen, Normandie, Dissertationsbetreuer.
  • M.me Sylvie LE HÉGARAT-MASCLE, Professorin an Paris-Saclay, Prüferin.
  • M. Joannes VERMOREL, CEO von Lokad, geladenes Mitglied.

Download the thesis (PDF)