Prognose mittels Deep Learning (2018)

Als Teil unseres grundlegenden Engagements, die genauesten Prognosen zu liefern, die die Technologie bieten kann, freuen wir uns, bekannt zu geben, dass unsere 5. Generation des Prognosemotors jetzt bei Lokad live ist. Dieser Motor bringt die größte Genauigkeitsverbesserung, die wir jemals in einer einzigen Version erreicht haben.

Von probabilistischer Prognose zu Deep Learning

power-clouds
Das Design des Motors basiert auf einer relativ neuen Art des maschinellen Lernens namens Deep Learning. Für Lieferketten können große Verbesserungen der Prognosegenauigkeit zu ebenso großen Gewinnen führen, indem mehr Kunden bedient werden, sie schneller bedient werden und gleichzeitig weniger Lagerbestandsrisiken bestehen. Vor etwa 18 Monaten haben wir die 4. Generation unserer Prognosetechnologie angekündigt. Die 4. Generation war die erste, die echte probabilistische Prognosen lieferte. Probabilistische Prognosen sind in Lieferketten unerlässlich, da die Kosten auf den statistischen Extremen konzentriert sind, wenn die Nachfrage unerwartet hoch oder niedrig ist. Im Gegensatz dazu sind traditionelle Prognosemethoden - wie traditionelle tägliche, wöchentliche oder monatliche Prognosen -, die sich nur auf die Bereitstellung von Median- oder Durchschnittsprognosen konzentrieren, blind für das Problem. Als Folge liefern diese Methoden in der Regel keine zufriedenstellenden Ergebnisse für Unternehmen. Die 5. Generation leugnet ihre Ursprünge nicht; sie umfasst auch probabilistische Prognosen und baut auf den Erfahrungen der vorherigen Generation auf.

Es stellt sich teilweise zufällig heraus, dass Deep Learning von Natur aus stark auf probabilistische Prognosen ausgerichtet ist. Die Motivation für diese Perspektive hatte jedoch nichts mit Lieferketten zu tun. Deep Learning-Algorithmen bevorzugen Optimierung auf der Grundlage einer probabilistischen / bayesschen Perspektive mit Metriken wie der Kreuzentropie, da diese Metriken enorme Gradientenwerte liefern, die besonders für den stochastischen Gradientenabstieg geeignet sind, den “einen” Algorithmus, der Deep Learning ermöglicht.

Im speziellen Fall von Lieferketten stellt sich heraus, dass die Grundlagen des Deep Learning vollständig mit den tatsächlichen Geschäftsanforderungen übereinstimmen!

Jenseits des Hypes der künstlichen Intelligenz

Künstliche Intelligenz - in der Praxis durch Deep Learning unterstützt - war das Schlagwort des Jahres 2017. Die Behauptungen sind kühn, fesselnd und nun ja, unklar. Aus der Sicht von Lokad stellen wir fest, dass die Mehrheit dieser Unternehmens-KI-Technologien nicht den Erwartungen gerecht wird. Nur sehr wenige Unternehmen können über eine halbe Milliarde US-Dollar an Finanzierung sichern, wie Instacart, um ein erstklassiges Deep Learning-Team zusammenzustellen und erfolgreich eine Herausforderung in der Lieferkette anzugehen.

Mit dieser Version macht Lokad AI-Grade-Prognosetechnologie für jedes vernünftig “digitalisierte” Unternehmen zugänglich. Natürlich wird das Ganze immer noch von historischen Lieferketten-Daten unterstützt, sodass die Daten für Lokad zugänglich sein müssen, aber unsere Technologie erfordert keinerlei Deep Learning-Expertise. Im Gegensatz zu praktisch jeder einzelnen “Unternehmens”-KI-Technologie verlässt sich Lokad nicht auf manuelle Feature-Engineering. Was unsere Kunden betrifft, wird der Wechsel von unseren bisherigen probabilistischen Prognosen zu Deep Learning nahtlos sein. Lokad ist das erste Softwareunternehmen, das eine schlüsselfertige AI-Grade-Prognosetechnologie bereitstellt, die sowohl für kleine 1-Mann-E-Commerce-Unternehmen zugänglich ist als auch für die größten Lieferkettennetzwerke, die Tausende von Standorten und eine Million Produktreferenzen umfassen können.

Das Zeitalter der GPU-Berechnung

power-clouds Deep Learning blieb bislang eher eine Nische, bis die Community ihre eigenen Software-Bausteine aufgerüstet hat, um von GPUs (Grafikprozessoren) zu profitieren. Diese GPUs unterscheiden sich stark von CPUs (Zentralprozessoren), die immer noch den Großteil der heutigen Apps antreiben, mit der bemerkenswerten Ausnahme von Computerspielen, die sowohl auf CPUs als auch auf GPUs angewiesen sind. Zusammen mit der vollständigen Neuschreibung unseres Prognosemodells für diese 5. Version haben wir auch die Low-Level-Infrastruktur von Lokad erheblich verbessert. Tatsächlich nutzt die Lokad-Plattform jetzt GPUs sowie CPUs, um Unternehmen zu bedienen. Lokad nutzt jetzt die GPU-betriebenen Maschinen, die auf Microsoft Azure gemietet werden können, der Cloud-Computing-Plattform, die Lokad unterstützt. Durch die enorme Rechenleistung der GPUs machen wir nicht nur unsere Prognosen genauer, sondern auch viel schneller. Durch ein Raster von GPUs erhalten wir jetzt die Prognosen in der Regel etwa 3x bis 6x schneller für beliebige Datensätze (*).

(*) Für ultrakleine Datensätze ist unser Prognosemodell der 5. Generation tatsächlich langsamer und dauert einige Minuten länger - was in der Praxis jedoch weitgehend unerheblich ist.

Produktstarts und Promotionen

Unser Prognosemodell der 5. Generation bringt erhebliche Verbesserungen in schwierigen Prognosesituationen, insbesondere bei Produktstarts und Promotionen. Aus unserer Sicht sind Produktstarts, obwohl sehr schwierig, etwas einfacher als Prognosen für Promotionen. Der Unterschied in der Schwierigkeit wird durch die Qualität der historischen Daten bestimmt, die für Promotionen im Vergleich zu Produktstarts zwangsläufig niedriger ist. Die Qualität der Promotion-Daten verbessert sich im Laufe der Zeit, sobald die entsprechenden Qualitätssicherungsprozesse implementiert sind.

Insbesondere sehen wir Deep Learning als eine enorme Chance für Modemarken, die mit Produktstarts konfrontiert sind, die ihren Umsatz dominieren: Das Starten eines neuen Produkts ist nicht die Ausnahme, sondern die Regel. Wenn dann Farb- und Größenvarianten die Anzahl der SKU-Nummern stark erhöhen, wird die Situation noch komplexer.

Unsere Prognose-FAQ

Welche Prognosemodelle verwenden Sie?

Unser tiefes Prognosemodell verwendet ein einziges Modell, das auf Deep Learning-Prinzipien basiert. Im Gegensatz zu klassischen statistischen Modellen handelt es sich um ein Modell mit zig Millionen trainierbaren Parametern, was etwa 1000-mal mehr Parameter sind als unser bisheriges, komplexestes nicht-tiefes maschinelles Lernmodell. Deep Learning übertrifft ältere maschinelle Lernansätze (Random Forests, Gradient Boosted Trees) bei weitem. Es ist jedoch erwähnenswert, dass diese älteren maschinellen Lernansätze bereits alle klassischen Zeitreihenmodelle (Box-Jenkins, ARIMA, Holt-Winters, exponentielle Glättung usw.) übertroffen haben.

Lernen Sie aus Ihren Prognosefehlern?

Ja. Der statistische Trainingsprozess - der letztendlich das Deep Learning-Modell generiert - nutzt alle historischen Daten, die Lokad zur Verfügung stehen. Die historischen Daten werden durch einen Prozess namens Backtesting genutzt. Je mehr historische Daten dem Modell zur Verfügung stehen, desto mehr Möglichkeiten hat das Modell, aus seinen eigenen Fehlern zu lernen.

Ja, das Prognosemodell berücksichtigt alle gängigen Zyklen und sogar die quasi-zyklischen Muster, deren Bedeutung häufig unterschätzt wird. Was den Code betrifft, verwendet das Deep Learning-Modell intensiv einen mehrfachen Zeitreihenansatz, um die beobachteten Zyklen in anderen Produkten zu nutzen und die Prognosegenauigkeit eines einzelnen Produkts zu verbessern. Natürlich können zwei Produkte dieselbe Saisonalität aufweisen, aber nicht das gleiche Wochentagsmuster. Das Modell ist in der Lage, dieses Muster zu erfassen. Ein weiterer großer Vorteil des Deep Learning besteht darin, dass es die Variabilität der Saisonalität selbst richtig erfassen kann. Eine Saison kann tatsächlich früher oder später beginnen, abhängig von externen Variablen wie dem Wetter, und diese Variationen werden in unseren Prognosen erkannt und widergespiegelt.

Welche Daten benötigen Sie?

Wie auch bei unserer vorherigen Generation von Prognosetechnologie benötigt das Prognosemodell zur Vorhersage der Nachfrage mindestens die tägliche historische Nachfrage, und eine disaggregierte Auftragsübersicht ist noch besser. Was die Länge der Historie betrifft, gilt: je länger, desto besser. Während mit weniger als 2 Jahren Historie keine Saisonalität erkannt werden kann, betrachten wir 3 Jahre Historie als gut und 5 Jahre als ausgezeichnet. Um die Vorlaufzeiten vorherzusagen, benötigt das Modell in der Regel Bestellungen, die sowohl die Bestelldaten als auch die Lieferdaten enthalten. Die Angabe Ihrer Produkt- oder SKU-Eigenschaften hilft auch erheblich, die Prognosen zu verfeinern. Darüber hinaus ist es für uns auch sehr hilfreich, Ihre Lagerbestände zu kennen, um eine erste aussagekräftige Lageranalyse durchzuführen.

Können Sie meine Excel-Tabelle prognostizieren?

Als Faustregel gilt: Wenn alle Ihre Daten in eine Excel-Tabelle passen, können wir in der Regel nicht viel für Sie tun, und ehrlich gesagt kann das auch niemand. Die Daten in Tabellenkalkulationen werden wahrscheinlich pro Woche oder pro Monat aggregiert, und die meisten historischen Informationen gehen durch eine solche Aggregation verloren. Darüber hinaus enthält Ihre Tabelle in diesem Fall auch nicht viele Informationen über die Kategorien und Hierarchien, die für Ihre Produkte gelten. Unser Prognosemodell nutzt alle verfügbaren Daten, und ein Test an einer winzigen Stichprobe führt nicht zu zufriedenstellenden Ergebnissen.

Wie gehen Sie mit Lagerbeständen und Promotionen um?

Sowohl Lagerbestände als auch Promotionen stellen eine Verzerrung in den historischen Verkäufen dar. Da das Ziel darin besteht, die Nachfrage und nicht den Umsatz vorherzusagen, muss diese Verzerrung berücksichtigt werden. Eine häufige - aber falsche - Methode, mit diesen Ereignissen umzugehen, besteht darin, die Historie umzuschreiben, um Lücken zu füllen und Spitzen abzuschneiden. Wir mögen diesen Ansatz jedoch nicht, da er darin besteht, Prognosen an das Prognosemodell zu liefern, was zu erheblichen Überanpassungsproblemen führen kann. Stattdessen unterstützt unser Modell nativ “Flags”, die anzeigen, wo die Nachfrage zensiert oder aufgebläht wurde.

Können Sie neue Produkte prognostizieren?

Ja, das können wir. Um jedoch neue Produkte vorherzusagen, benötigt das Modell die Starttermine für die anderen “älteren” Produkte sowie deren historische Nachfrage zum Zeitpunkt des Starts. Es wird auch empfohlen, einige Ihrer Produktkategorien und/oder eine Produkt-Hierarchie anzugeben. Das Modell prognostiziert in der Tat neue Produkte, indem es die “älteren” Produkte automatisch erkennt, die als vergleichbar mit den neuen angesehen werden können. Da für die neuen Artikel noch keine Nachfrage beobachtet wurde, beruhen die Prognosen vollständig auf den damit verbundenen Attributen.

Verwenden Sie externe Daten, um die Prognosen zu verfeinern?

Wir können Wettbewerbspreisdaten verwenden, die in der Regel von Drittanbietern stammen, die sich beispielsweise auf Web-Scraping spezialisiert haben. Auch Web-Traffic-Daten können verwendet und möglicherweise erworben werden, um die historischen Daten zu bereichern und die statistische Genauigkeit weiter zu verbessern. In der Praxis ist der größte Engpass bei der Verwendung externer Datenquellen nicht das Lokad-Prognosemodell - das ziemlich leistungsfähig ist -, sondern der Aufbau und die Aufrechterhaltung einer hochwertigen Datenpipeline, die an diese externen Datenquellen angeschlossen ist.