Login Kontakt

Deep Learning für Prognosen

Die prädiktive Modellierung bei Lokad erfolgt heute über differenzierbares Programmieren statt über Deep Learning. Differenzierbares Programmieren ist ein Nachfahre des Deep Learning und besser für Supply-Chain-Herausforderungen geeignet. Insbesondere lässt es sich besser whiteboxen als Deep Learning.

Von probabilistischen Prognosen zu Deep Learning

Illustration von Deep Learning unter der Oberfläche von Nachfragemustern

Rund 18 Monate vor dieser fünften Generation führte Lokad seine vierte Generation der Prognosetechnologie ein, die erste mit echten probabilistischen Prognosen. Das war entscheidend, weil sich Supply-Chain-Kosten auf statistische Extreme konzentrieren, also auf Situationen, in denen die Nachfrage viel höher oder niedriger ausfällt als erwartet. Klassische tägliche, wöchentliche oder monatliche Prognosen konzentrieren sich auf Mittelwerte oder Mediane und verfehlen diese Extreme weitgehend. Dadurch liefern sie häufig unzureichende finanzielle Ergebnisse.

Die fünfte Generation verließ diese Grundlage nicht. Im Gegenteil, sie übernahm die probabilistische Prognose und baute auf den Erfahrungen der vorherigen Generation auf. Ihr Design basierte auf einer damals noch relativ neuen Machine-Learning-Richtung: Deep Learning. In der Supply Chain bedeutet eine bessere Prognosegenauigkeit unmittelbar besseren Service, schnellere Ausführung und geringere Bestandsrisiken.

Teilweise zufällig erwies sich Deep Learning von seinem Aufbau her als stark mit probabilistischen Prognosen kompatibel. Diese Ausrichtung kam ursprünglich nicht aus der Supply Chain, doch die Passung ist bemerkenswert. Deep-Learning-Methoden bevorzugen probabilistische und bayesianische Optimierungsperspektiven und nutzen Metriken wie Kreuzentropie, die genau jene großen Gradienten erzeugen, die für den stochastischen Gradientenabstieg nötig sind, also für das algorithmische Rückgrat des modernen Deep Learning.

Gerade in Supply Chains passen die mathematischen Grundlagen des Deep Learning erstaunlich gut zu den tatsächlichen Geschäftsanforderungen.

Jenseits des Hypes um künstliche Intelligenz

Künstliche Intelligenz, in der Praxis meist durch Deep Learning getrieben, war das große Buzzword des Jahres 2017. Die Versprechen waren ambitioniert, faszinierend und oft vage. Aus Sicht von Lokad blieben die meisten KI-Angebote für Unternehmen weit hinter den Erwartungen zurück. Nur sehr wenige Unternehmen konnten ein erstklassiges Deep-Learning-Team aufbauen und zugleich die nötigen Mittel bereitstellen, um eine Supply-Chain-Herausforderung von Grund auf zu lösen.

Mit dieser Version machte Lokad KI-taugliche Prognosetechnologie für jedes einigermaßen digitalisierte Unternehmen zugänglich. Das System stützte sich weiterhin auf historische Supply-Chain-Daten, die Lokad bereitgestellt werden mussten, verlangte von den Kunden jedoch keinerlei Deep-Learning-Expertise. Im Gegensatz zu vielen Enterprise-KI-Angeboten war Lokad nicht auf manuelles Feature Engineering angewiesen. Für bestehende Lokad-Kunden sollte der Übergang von der früheren probabilistischen Engine zum Deep Learning nahtlos sein.

Damit gehörte Lokad zu den ersten Softwareanbietern, die eine schlüsselfertige KI-taugliche Prognosetechnologie bereitstellten, die sowohl für kleine E-Commerce-Unternehmen als auch für große Supply-Chain-Netzwerke mit Tausenden Standorten und Millionen von SKUs einsetzbar war.

Das Zeitalter des GPU-Computing

Grafikprozessoren zur Beschleunigung großer Prognoseberechnungen Deep Learning blieb lange ein Nischenthema, bis seine Softwaregrundlagen so überarbeitet wurden, dass GPUs, also Grafikprozessoren, genutzt werden konnten. GPUs unterscheiden sich deutlich von CPUs, den klassischen Hauptprozessoren, die noch immer den Großteil heutiger Software antreiben. Historisch gehörten Computerspiele zu den wenigen Massenanwendungen, die stark auf beide Prozessortypen setzten. Mit dieser Prognose-Engine der fünften Generation modernisierte Lokad auch seine Low-Level-Infrastruktur, damit die Plattform beide Prozessortypen nutzen konnte. Lokad begann, GPU-fähige Maschinen auf Microsoft Azure zu verwenden. Dank der enormen Rechenleistung der GPUs wurden Prognosen nicht nur präziser, sondern auch erheblich schneller. Bei größeren Datensätzen lieferte ein GPU-Cluster typischerweise Ergebnisse, die drei- bis sechsmal schneller waren.

Bei sehr kleinen Datensätzen konnte diese Engine der fünften Generation dagegen etwas langsamer sein und einige Minuten mehr benötigen, was in der Praxis kaum eine Rolle spielte.

Produkteinführungen und Promotionen

Die Engine der fünften Generation brachte deutliche Fortschritte bei einigen der schwierigsten Prognosesituationen, insbesondere bei Produkteinführungen und Promotionen. Aus Sicht von Lokad waren Produkteinführungen zwar schwierig, aber immer noch etwas einfacher als Promotionen. Der Hauptgrund dafür liegt in der Datenqualität: Promotionsdaten sind meist verrauschter und weniger zuverlässig als Launch-Daten, zumindest solange keine belastbaren Qualitätsprozesse etabliert wurden.

Für Modemarken war Deep Learning besonders vielversprechend, weil Produkteinführungen dort den Vertrieb dominieren und Farb- sowie Größenvarianten die Zahl der zu prognostizierenden SKUs massiv erhöhen.

Prognose-FAQ

Welche Prognosemodelle verwenden Sie?

Unsere Deep-Forecasting-Engine beruhte auf einem einzigen Modell, das nach den Prinzipien des Deep Learning aufgebaut war. Im Gegensatz zu klassischen statistischen Modellen verfügte es über Dutzende Millionen trainierbarer Parameter, also ungefähr 1.000-mal mehr als unser zuvor komplexestes nicht-deepes Machine-Learning-Modell. Deep Learning übertraf ältere Ansätze wie Random Forests oder Gradient-Boosted Trees deutlich. Diese Methoden waren bereits den klassischen Zeitreihenverfahren wie Box-Jenkins, ARIMA, Holt-Winters oder exponentieller Glättung überlegen.

Lernen Sie aus Prognosefehlern?

Ja. Der statistische Trainingsprozess, der das Deep-Learning-Modell erzeugt, nutzt sämtliche historischen Daten, die Lokad vorliegen. Diese Historie wird über Backtesting ausgewertet. Je mehr Historie vorhanden ist, desto mehr Gelegenheiten hat das Modell, aus seinen eigenen Fehlern zu lernen.

Ja. Die Engine verarbeitet gängige Zyklen ebenso wie Quasi-Zyklen, deren geschäftliche Bedeutung oft unterschätzt wird. Das Deep-Learning-Modell nutzt einen Multi-Zeitreihen-Ansatz, um Zyklen über verwandte Produkte hinweg zu erfassen und zugleich jede Prognose auf den einzelnen Artikel zuzuschneiden. Zwei Produkte können dieselbe Saisonalität teilen und trotzdem unterschiedliche Wochentagsmuster zeigen; das Modell kann diese Unterschiede erfassen. Deep Learning hilft auch dabei, die Variabilität der Saisonalität selbst abzubilden, etwa wenn eine Saison wegen des Wetters früher oder später beginnt.

Welche Daten benötigen Sie?

Mindestens benötigt die Engine eine tägliche Nachfragehistorie. Eine aufgeschlüsselte Auftragshistorie ist noch besser. Grundsätzlich gilt: Je länger die Historie, desto besser die Ergebnisse. Mit weniger als zwei Jahren Historie ist es schwierig, Saisonalität zu erkennen; drei Jahre sind gut, fünf Jahre sind ausgezeichnet. Für die Prognose von Lieferzeiten benötigt die Engine üblicherweise Bestellungen mit Bestell- und Lieferdatum. Produkt- oder SKU-Attribute verfeinern die Prognosen ebenfalls deutlich. Bestandsniveaus sind ebenfalls hilfreich, weil Lokad damit eine erste aussagekräftige Bestandsanalyse erstellen kann.

Können Sie mein Excel-Blatt prognostizieren?

Als Faustregel gilt: Wenn alle Daten in ein einziges Excel-Blatt passen, kann meist weder Lokad noch sonst jemand besonders viel Sinnvolles daraus machen. Tabellendaten sind oft nach Woche oder Monat aggregiert, wodurch zu viel Signal verloren geht. Außerdem fehlen meist die Kategorien und Hierarchien, die notwendig sind, um Produktverhalten sauber zu verstehen. Die Prognose-Engine von Lokad profitiert vom vollen Reichtum der verfügbaren Daten, und eine winzige Stichprobe liefert selten aussagekräftige Ergebnisse.

Wie gehen Sie mit Fehlbeständen und Promotionen um?

Sowohl Fehlbestände als auch Promotionen verzerren historische Verkaufsdaten. Da das Ziel darin besteht, Nachfrage und nicht Verkäufe zu prognostizieren, muss dieser Bias explizit behandelt werden. Ein häufiger, aber fehlerhafter Ansatz besteht darin, die Historie umzuschreiben, Lücken zu füllen und Spitzen abzuschneiden. Wir vermeiden das, weil damit im Grunde Prognosen wieder in die Prognose-Engine eingespeist würden, was erhebliche Overfitting-Risiken erzeugt. Stattdessen unterstützt Lokad native Kennzeichnungen, die anzeigen, wann Nachfrage zensiert oder künstlich aufgebläht wurde.

Prognostizieren Sie neue Produkte?

Ja. Um neue Produkte zu prognostizieren, benötigt die Engine die Einführungsdaten älterer vergleichbarer Produkte sowie deren historische Nachfrage zum Einführungszeitpunkt. Produktkategorien und Hierarchien sind ebenfalls hilfreich. Die Engine identifiziert ältere Produkte, die mit den neuen vergleichbar sind. Da für neue Artikel noch keine Nachfrage beobachtet wurde, beruhen die ersten Prognosen vollständig auf den zugeordneten Attributen.

Nutzen Sie externe Daten zur Verfeinerung der Prognosen?

Ja, sofern diese Daten verfügbar und verlässlich sind. Lokad kann beispielsweise Wettbewerber-Preisdaten nutzen, die von spezialisierten Drittanbietern erhoben werden, sowie Web-Traffic-Daten. In der Praxis ist der größte Engpass nicht die Prognose-Engine selbst, sondern der Aufwand, rund um diese externen Quellen eine hochwertige Datenpipeline aufzubauen und dauerhaft zu betreiben.

Ask Lokad