Prognose via Deep Learning (2018)

Als Teil unseres Kernversprechens, die genauesten Prognosen zu liefern, die die Technologie hervorbringen kann, sind wir stolz darauf, dass unsere 5. Generation der Prognose-Engine jetzt bei Lokad live ist. Diese Engine bringt die größte Genauigkeitsverbesserung, die wir jemals in einer einzigen Veröffentlichung erreichen konnten.

Von der probabilistischen Prognose zur Deep-Learning-Prognose

power-clouds
Das Design der Engine basiert auf einer relativ neuen Art des Machine Learning namens Deep Learning. Für Lieferketten können große Verbesserungen der Prognosegenauigkeit zu ebenso großen Renditen führen, mehr Kunden bedienen, sie schneller bedienen und dabei weniger Inventarrisiken eingehen. Vor etwa 18 Monaten haben wir die 4. Generation unserer Prognosetechnologie angekündigt. Die 4. Generation war die erste, die echte probabilistische Prognosen lieferte. Probabilistische Prognosen sind in Lieferketten unerlässlich, da die Kosten auf den statistischen Extremen konzentriert sind, wenn die Nachfrage unerwartet hoch oder niedrig ist. Im Gegensatz dazu sind traditionelle Prognosemethoden - wie traditionelle tägliche, wöchentliche oder monatliche Prognosen -, die sich nur auf die Lieferung von Median- oder Durchschnittsprognosen konzentrieren, blind für das Problem. Als Folge liefern diese Methoden in der Regel keine zufriedenstellenden Renditen für Unternehmen. Die 5. Generation leugnet ihre Herkunft nicht; sie umfasst auch probabilistische Prognosen und baut auf der Erfahrung auf, die mit der vorherigen Generation gewonnen wurde.

Es stellt sich teilweise durch Zufall heraus, dass Deep Learning von Design her stark auf probabilistische Prognosen ausgerichtet ist. Die Motivation für diese Perspektive war jedoch vollständig unabhängig von Lieferkettenproblemen. Deep-Learning-Algorithmen bevorzugen Optimierung auf der Grundlage einer probabilistischen / Bayes’schen Perspektive mit Metriken wie Kreuzentropie, da diese Metriken enorme Gradientenwerte liefern, die besonders für den stochastischen Gradientenabstieg geeignet sind, den “einen” Algorithmus, der Deep Learning möglich macht.

Im speziellen Fall von Lieferketten stellt sich heraus, dass die Grundlagen des Deep Learning vollständig mit den tatsächlichen Geschäftsanforderungen übereinstimmen!

Jenseits des Hypes der künstlichen Intelligenz

Künstliche Intelligenz - in der Praxis durch Deep Learning angetrieben - war das Buzzword des Jahres 2017. Die Ansprüche sind kühn, fesselnd und, nun ja, unscharf. Aus der Sicht von Lokad stellen wir fest, dass die Mehrheit dieser Enterprise-AI-Technologien nicht den Erwartungen entspricht. Nur wenige Unternehmen können über eine halbe Milliarde USD an Finanzierung sichern, wie Instacart, um ein erstklassiges Deep-Learning-Team zu versammeln, um erfolgreich eine Lieferketten-Herausforderung anzugehen.

Mit dieser Veröffentlichung macht Lokad AI-Grade-Prognosetechnologie für jedes vernünftig “digitalisierte” Unternehmen zugänglich. Offensichtlich wird das Ganze immer noch von historischen Lieferketten-Daten angetrieben, so dass die Daten für Lokad zugänglich sein müssen, aber unsere Technologie erfordert keinerlei Deep-Learning-Expertise. Im Gegensatz zu praktisch jeder einzelnen “Enterprise” AI-Technologie verlässt sich Lokad nicht auf manuelle Feature-Engineering. Soweit es unsere Kunden betrifft, wird das Upgrade von unseren bisherigen probabilistischen Prognosen auf Deep Learning nahtlos sein. Lokad ist das erste Software-Unternehmen, das eine schlüsselfertige AI-Grade-Prognosetechnologie bereitstellt, die sowohl für winzige 1-Mann-E-Commerce-Unternehmen zugänglich ist als auch für die größten Lieferketten-Netzwerke, die Tausende von Standorten und einer Million Produktreferenzen umfassen können.

Das Zeitalter des GPU-Computings

power-clouds
Deep Learning blieb bislang eher eine Nische, bis die Community ihre eigenen Software-Bausteine aufgerüstet hatte, um von GPUs (Grafikprozessoren) zu profitieren. Diese GPUs unterscheiden sich stark von CPUs (zentralen Prozessoren), die immer noch die meisten Apps antreiben, mit den bemerkenswerten Ausnahmen von Computerspielen, die intensiv sowohl auf CPUs als auch auf GPUs angewiesen sind. Zusammen mit der vollständigen Neuschreibung unseres Prognose-Engines für diese 5. Iteration haben wir auch die Low-Level-Infrastruktur von Lokad signifikant aufgerüstet. Tatsächlich nutzt die Lokad-Plattform jetzt GPUs sowie CPUs, um Unternehmen zu bedienen. Lokad nutzt jetzt die GPU-betriebenen Maschinen, die auf Microsoft Azure gemietet werden können, der Cloud-Computing-Plattform, die Lokad unterstützt. Durch die massive Rechenleistung der GPUs machen wir nicht nur unsere Prognosen genauer, sondern auch viel schneller. Durch ein Raster von GPUs erhalten wir jetzt die Prognosen etwa 3x bis 6x schneller, für jede Größe von Datensätzen (*).

(*) Für ultra-kleine Datensätze ist unser Prognose-Engine der 5. Generation tatsächlich langsamer und dauert ein paar Minuten länger - was in der Praxis jedoch weitgehend unerheblich ist.

Produktstarts und Promotionen

Unser Prognose-Engine der 5. Generation bringt erhebliche Verbesserungen in schwierigen Prognose-Situationen, insbesondere bei Produktstarts und Promotionen. Aus unserer Sicht sind Produktstarts, obwohl sehr schwierig, etwas einfacher als Prognosen für Promotionen. Der Unterschied in der Schwierigkeit wird durch die Qualität der historischen Daten bestimmt, die für Promotionen im Vergleich zu Produktstarts unvermeidlich niedriger ist. Die Promotion-Daten werden im Laufe der Zeit besser, sobald die entsprechenden Qualitätskontrollprozesse eingerichtet sind.

Insbesondere sehen wir Deep Learning als eine massive Chance für Modemarken, die mit Produktstarts kämpfen, die ihren Umsatz dominieren: Das Starten eines neuen Produkts ist nicht die Ausnahme, sondern die Regel. Dann, wenn Farb- und Größenvarianten die Anzahl der SKUs stark erhöhen, wird die Situation noch komplexer.

Unsere Prognose-FAQ

Welche Prognosemodelle verwenden Sie?

Unser Deep Forecasting Engine verwendet ein einziges Modell, das auf Deep-Learning-Prinzipien aufgebaut ist. Im Gegensatz zu klassischen statistischen Modellen ist es ein Modell, das zehn Millionen trainierbare Parameter aufweist, was etwa 1000-mal mehr Parameter sind als unser bisheriges, komplexestes, nicht-tiefes Machine-Learning-Modell. Deep Learning übertrifft ältere Machine-Learning-Ansätze (zufällige Wälder, Gradient-Boosted Trees) bei weitem. Es ist jedoch erwähnenswert, dass diese älteren Machine-Learning-Ansätze bereits alle Zeitreihen-Klassiker (Box-Jenkins, ARIMA, Holt-Winters, exponentielle Glättung usw.) übertroffen haben.

Lernen Sie aus Ihren Prognosefehlern?

Ja. Der statistische Schulungsprozess - der letztendlich das Deep-Learning-Modell generiert - nutzt alle historischen Daten, die Lokad zur Verfügung stehen. Die historischen Daten werden durch einen Prozess namens Backtesting genutzt. Je mehr historische Daten dem Modell zur Verfügung stehen, desto mehr Möglichkeiten hat das Modell, aus seinen eigenen Fehlern zu lernen.

Ja, der Prognose-Engine verarbeitet alle gängigen Zyklen und sogar die quasi-Zyklen, deren Bedeutung häufig unterschätzt wird. Was den Code betrifft, so nutzt das Deep-Learning-Modell intensiv einen Multi-Time-Series-Ansatz, um die Zyklen zu nutzen, die bei anderen Produkten beobachtet werden, um die Prognosegenauigkeit eines bestimmten Produkts zu verbessern. Natürlich können zwei Produkte dieselbe Saisonalität aufweisen, aber nicht das gleiche Wochentagsmuster. Das Modell ist in der Lage, dieses Muster zu erfassen. Einer der großen Vorteile von Deep Learning ist auch die Fähigkeit, die Variabilität der Saisonalität selbst richtig zu erfassen. Eine Saison kann tatsächlich früher oder später beginnen, je nach externen Variablen wie dem Wetter, und diese Variationen werden in unseren Prognosen erkannt und reflektiert.

Welche Daten benötigen Sie?

Wie bei unserer vorherigen Generation von Prognosetechnologie benötigt der Prognose-Engine zur Vorhersage der Nachfrage mindestens die tägliche historische Nachfrage, und eine disaggregierte Auftragsgeschichte ist noch besser. Was die Länge der Geschichte betrifft, so gilt: Je länger sie ist, desto besser. Während keine Saisonalität mit weniger als 2 Jahren Geschichte erkannt werden kann, halten wir 3 Jahre Geschichte für gut und 5 Jahre für ausgezeichnet. Um die Vorlaufzeiten vorherzusagen, benötigt der Engine in der Regel, dass die Bestellungen sowohl die Bestelldaten als auch die Lieferdaten enthalten. Die Angabe Ihrer Produkt- oder SKU-Attribute hilft auch, die Prognosen erheblich zu verfeinern. Darüber hinaus ist es auch sehr hilfreich für uns, wenn Sie Ihre Lagerbestände angeben, um eine erste aussagekräftige Lageranalyse zu erhalten.

Können Sie meine Excel-Tabelle prognostizieren?

Als Faustregel gilt: Wenn alle Ihre Daten in eine Excel-Tabelle passen, können wir in der Regel nicht viel für Sie tun, und um ehrlich zu sein, kann das auch niemand. Die Daten in Tabellenkalkulationen werden wahrscheinlich pro Woche oder pro Monat aggregiert, und die meisten historischen Informationen gehen durch eine solche Aggregation verloren. Außerdem enthält Ihre Tabelle in diesem Fall auch nicht viele Informationen über die Kategorien und Hierarchien, die für Ihre Produkte gelten. Unser Prognose-Engine nutzt alle verfügbaren Daten, und ein Test an einer winzigen Stichprobe wird keine zufriedenstellenden Ergebnisse liefern.

Was ist mit Lagerbeständen und Promotionen?

Sowohl Lagerbestände als auch Promotionen stellen Verzerrungen im historischen Verkauf dar. Da das Ziel darin besteht, die Nachfrage und nicht den Verkauf vorherzusagen, muss diese Verzerrung berücksichtigt werden. Eine häufige - aber falsche - Methode, um mit diesen Ereignissen umzugehen, besteht darin, die Geschichte umzuschreiben, um die Lücken zu füllen und die Spitzen abzuschneiden. Wir mögen diesen Ansatz jedoch nicht, weil er darin besteht, Prognosen an den Prognose-Engine zu liefern, was zu erheblichen Überanpassungsproblemen führen kann. Stattdessen unterstützt unser Engine nativ “Flags”, die anzeigen, wo die Nachfrage zensiert oder aufgeblasen wurde.

Können Sie neue Produkte prognostizieren?

Ja, das können wir. Um jedoch neue Produkte vorherzusagen, benötigt der Engine die Startdaten für die anderen “älteren” Produkte sowie deren historische Nachfrage zum Zeitpunkt des Starts. Es wird auch empfohlen, einige Ihrer Produktkategorien und/oder eine Produkt-Hierarchie anzugeben. Der Engine prognostiziert in der Tat neue Produkte, indem er die “älteren” Produkte automatisch erkennt, die als vergleichbar mit den neuen angesehen werden können. Da für die neuen Artikel noch keine Nachfrage beobachtet wurde, stützen sich die Prognosen vollständig auf die damit verbundenen Attribute.

Verwenden Sie externe Daten, um die Prognosen zu verfeinern?

Wir können wettbewerbsfähige Preisdaten verwenden, die in der Regel von Drittanbietern stammen, die sich beispielsweise auf Web-Scraping spezialisiert haben. Auch Web-Traffic-Daten können verwendet und möglicherweise erworben werden, um die historischen Daten zu bereichern und die statistische Genauigkeit weiter zu erhöhen. In der Praxis ist der größte Engpass bei der Verwendung externer Datenquellen nicht der Lokad-Prognose-Engine - die ziemlich leistungsfähig ist -, sondern die Einrichtung und Aufrechterhaltung einer hochwertigen Datenpipeline, die an diese externen Datenquellen angeschlossen ist.