Prognosen mit Deep Learning (2018)

Die prädiktive Modellierung bei Lokad erfolgt heute über differenzierbares Programmieren statt über Deep Learning. Differenzierbares Programmieren ist ein Nachfahre des Deep Learning und besser für Supply-Chain-Herausforderungen geeignet. Insbesondere lässt es sich besser whiteboxen als Deep Learning.

Von probabilistischen Prognosen zu Deep Learning

Das Design dieser Engine basierte auf einer damals noch relativ jungen Richtung des Machine Learning namens Deep Learning. Für Supply Chains können große Verbesserungen der Prognosegenauigkeit ebenso große wirtschaftliche Erträge liefern: mehr Kunden bedienen, schneller bedienen und dabei weniger Bestandsrisiken tragen. Rund 18 Monate zuvor hatte Lokad bereits seine 4. Generation der Prognosetechnologie angekündigt. Diese Generation war die erste, die echte probabilistische Prognosen lieferte. Probabilistische Prognosen sind für Supply Chains entscheidend, weil sich die Kosten auf die statistischen Extreme konzentrieren, wenn die Nachfrage unerwartet hoch oder niedrig ausfällt. Klassische Prognosemethoden, die nur Median- oder Durchschnittsprognosen liefern, sind gegenüber diesem Problem weitgehend blind. Infolgedessen erzielen diese Methoden meist unzureichende wirtschaftliche Ergebnisse. Die fünfte Generation verleugnete diese Herkunft nicht, sondern baute auf probabilistischen Prognosen und auf den Erfahrungen der vorherigen Generation auf.

Teilweise zufällig erwies sich Deep Learning von seinem Aufbau her als stark mit probabilistischen Prognosen kompatibel. Diese Ausrichtung kam ursprünglich nicht aus der Supply Chain, doch die Passung ist bemerkenswert. Deep-Learning-Methoden bevorzugen probabilistische und bayesianische Optimierungsperspektiven und nutzen Metriken wie Kreuzentropie, die genau jene großen Gradienten erzeugen, die für den stochastischen Gradientenabstieg nötig sind, also für das algorithmische Rückgrat des modernen Deep Learning.

Gerade in Supply Chains passen die mathematischen Grundlagen des Deep Learning erstaunlich gut zu den tatsächlichen Geschäftsanforderungen.

Jenseits des Hypes um künstliche Intelligenz

Künstliche Intelligenz, in der Praxis meist durch Deep Learning getrieben, war das große Buzzword des Jahres 2017. Die Versprechen waren ambitioniert, faszinierend und oft vage. Aus Sicht von Lokad blieben die meisten KI-Angebote für Unternehmen weit hinter den Erwartungen zurück. Nur sehr wenige Unternehmen konnten ein erstklassiges Deep-Learning-Team aufbauen und zugleich die nötigen Mittel bereitstellen, um eine Supply-Chain-Herausforderung von Grund auf zu lösen.

Mit dieser Version machte Lokad KI-taugliche Prognosetechnologie für jedes einigermaßen digitalisierte Unternehmen zugänglich. Das System stützte sich weiterhin auf historische Supply-Chain-Daten, die Lokad bereitgestellt werden mussten, verlangte von den Kunden jedoch keinerlei Deep-Learning-Expertise. Im Gegensatz zu vielen Enterprise-KI-Angeboten war Lokad nicht auf manuelles Feature Engineering angewiesen. Für bestehende Lokad-Kunden sollte der Übergang von der früheren probabilistischen Engine zum Deep Learning nahtlos sein.

Damit gehörte Lokad zu den ersten Softwareanbietern, die eine schlüsselfertige KI-taugliche Prognosetechnologie bereitstellten, die sowohl für kleine E-Commerce-Unternehmen als auch für große Supply-Chain-Netzwerke mit Tausenden Standorten und Millionen von SKUs einsetzbar war.

Das Zeitalter des GPU-Computing

Deep Learning blieb lange eher ein Nischenthema, bis die Community ihre Softwarebausteine so weiterentwickelte, dass GPUs (graphic processing units) effizient genutzt werden konnten. Diese GPUs unterscheiden sich stark von CPUs (central processing units), die noch immer den Großteil moderner Anwendungen antreiben, mit der auffälligen Ausnahme von Computerspielen, die beide intensiv nutzen. Mit der vollständigen Neufassung unserer Prognose-Engine für diese fünfte Iteration modernisierte Lokad auch seine Low-Level-Infrastruktur erheblich. Die Plattform nutzt seitdem sowohl GPUs als auch CPUs. Lokad setzt dafür auf GPU-gestützte Maschinen auf Microsoft Azure, der Cloud-Plattform hinter Lokad. Durch die enorme Rechenleistung der GPUs werden Prognosen nicht nur präziser, sondern auch wesentlich schneller. Bei hinreichend großen Datensätzen waren Prognosen typischerweise etwa drei- bis sechsmal schneller verfügbar.

Bei sehr kleinen Datensätzen konnte diese Engine der fünften Generation dagegen etwas langsamer sein und einige Minuten mehr benötigen, was in der Praxis kaum eine Rolle spielte.

Produkteinführungen und Promotionen

Die Engine der fünften Generation brachte deutliche Fortschritte bei einigen der schwierigsten Prognosesituationen, insbesondere bei Produkteinführungen und Promotionen. Aus Sicht von Lokad waren Produkteinführungen zwar schwierig, aber immer noch etwas einfacher als Promotionen. Der Hauptgrund dafür liegt in der Datenqualität: Promotionsdaten sind meist verrauschter und weniger zuverlässig als Launch-Daten, zumindest solange keine belastbaren Qualitätsprozesse etabliert wurden.

Für Modemarken war Deep Learning besonders vielversprechend, weil Produkteinführungen dort den Vertrieb dominieren und Farb- sowie Größenvarianten die Zahl der zu prognostizierenden SKUs massiv erhöhen.

Our Prognose FAQ

Welche Prognosemodelle verwenden Sie?

Unsere Deep-Prognose-Engine beruhte auf einem einzigen Modell, das nach den Prinzipien des Deep Learning aufgebaut war. Im Gegensatz zu klassischen statistischen Modellen verfügte es über Dutzende Millionen trainierbarer Parameter, also ungefähr 1.000-mal mehr als unser zuvor komplexestes nicht-deepes Machine-Learning-Modell. Deep Learning übertraf ältere Ansätze wie Random Forests oder Gradient-Boosted Trees deutlich. Diese Methoden waren bereits den klassischen Zeitreihenverfahren wie Box-Jenkins, ARIMA, Holt-Winters oder exponentieller Glättung überlegen.

Lernen Sie aus Prognosefehlern?

Ja. Der statistische Trainingsprozess, der das Deep-Learning-Modell erzeugt, nutzt sämtliche historischen Daten, die Lokad vorliegen. Diese Historie wird über Backtesting ausgewertet. Je mehr Historie vorhanden ist, desto mehr Gelegenheiten hat das Modell, aus seinen eigenen Fehlern zu lernen.

Verarbeitet Ihre Engine Saisonalität, Trends und Wochentagseffekte?

Ja. Die Engine verarbeitet gängige Zyklen ebenso wie Quasi-Zyklen, deren geschäftliche Bedeutung oft unterschätzt wird. Das Deep-Learning-Modell nutzt einen Multi-Zeitreihen-Ansatz, um Zyklen über verwandte Produkte hinweg zu erfassen und zugleich jede Prognose auf den einzelnen Artikel zuzuschneiden. Zwei Produkte können dieselbe Saisonalität teilen und trotzdem unterschiedliche Wochentagsmuster zeigen; das Modell kann diese Unterschiede erfassen. Deep Learning hilft auch dabei, die Variabilität der Saisonalität selbst abzubilden, etwa wenn eine Saison wegen des Wetters früher oder später beginnt.

Welche Daten benötigen Sie?

Mindestens benötigt die Engine eine tägliche Nachfragehistorie. Eine aufgeschlüsselte Auftragshistorie ist noch besser. Grundsätzlich gilt: Je länger die Historie, desto besser die Ergebnisse. Mit weniger als zwei Jahren Historie ist es schwierig, Saisonalität zu erkennen; drei Jahre sind gut, fünf Jahre sind ausgezeichnet. Für die Prognose von Lieferzeiten benötigt die Engine üblicherweise Bestellungen mit Bestell- und Lieferdatum. Produkt- oder SKU-Attribute verfeinern die Prognosen ebenfalls deutlich. Bestandsniveaus sind ebenfalls hilfreich, weil Lokad damit eine erste aussagekräftige Bestandsanalyse erstellen kann.

Können Sie mein Excel-Blatt prognostizieren?

Als Faustregel gilt: Wenn alle Daten in ein einziges Excel-Blatt passen, kann meist weder Lokad noch sonst jemand besonders viel Sinnvolles daraus machen. Tabellendaten sind oft nach Woche oder Monat aggregiert, wodurch zu viel Signal verloren geht. Außerdem fehlen meist die Kategorien und Hierarchien, die notwendig sind, um Produktverhalten sauber zu verstehen. Die Prognose-Engine von Lokad profitiert vom vollen Reichtum der verfügbaren Daten, und eine winzige Stichprobe liefert selten aussagekräftige Ergebnisse.

Wie gehen Sie mit Fehlbeständen und Promotionen um?

Sowohl Fehlbestände als auch Promotionen verzerren historische Verkaufsdaten. Da das Ziel darin besteht, Nachfrage und nicht Verkäufe zu prognostizieren, muss dieser Bias explizit behandelt werden. Ein häufiger, aber fehlerhafter Ansatz besteht darin, die Historie umzuschreiben, Lücken zu füllen und Spitzen abzuschneiden. Wir vermeiden das, weil damit im Grunde Prognosen wieder in die Prognose-Engine eingespeist würden, was erhebliche Overfitting-Risiken erzeugt. Stattdessen unterstützt Lokad native Kennzeichnungen, die anzeigen, wann Nachfrage zensiert oder künstlich aufgebläht wurde.

Prognostizieren Sie neue Produkte?

Ja. Um neue Produkte zu prognostizieren, benötigt die Engine die Einführungsdaten älterer vergleichbarer Produkte sowie deren historische Nachfrage zum Einführungszeitpunkt. Produktkategorien und Hierarchien sind ebenfalls hilfreich. Die Engine identifiziert ältere Produkte, die mit den neuen vergleichbar sind. Da für neue Artikel noch keine Nachfrage beobachtet wurde, beruhen die ersten Prognosen vollständig auf den zugeordneten Attributen.

Nutzen Sie externe Daten zur Verfeinerung der Prognosen?

Ja, sofern diese Daten verfügbar und verlässlich sind. Lokad kann beispielsweise Wettbewerber-Preisdaten nutzen, die von spezialisierten Drittanbietern erhoben werden, sowie Web-Traffic-Daten. In der Praxis ist der größte Engpass nicht die Prognose-Engine selbst, sondern der Aufwand, rund um diese externen Quellen eine hochwertige Datenpipeline aufzubauen und dauerhaft zu betreiben.