Lieblingsprognosemodelle
Welche Art von Prognosemodellen verwenden Sie intern? Diese Frage wird sowohl von Kunden als auch von Partnern von Lokad häufig gestellt.
Die Beantwortung dieser Frage ist für uns knifflig aus zwei Gründen:
- Unsere Technologie ist ein zentrales Gut. Daher haben wir nicht vor, alle Details preiszugeben (obwohl wir auch nicht gänzlich geheimniskrämerisch sind).
- Unsere Technologie ist komplex. Wir verwenden viele Modelle, und eine wesentliche Komponente ist genau die Modellauswahl.
Sofern ich nun nicht die genaue Liste der von Lokad verwendeten Modelle angeben möchte, werde ich stattdessen meine persönliche Liste von Lieblingsmodellen auflisten. Ich behaupte nicht, dass diese Modelle die vollständige Liste der bei Lokad eingesetzten Modelle darstellen, noch dass alle diese Modelle tatsächlich in der Produktion bei Lokad verwendet werden; dennoch sollte es Ihnen einige Einblicke in das geben, was wir bei Lokad tun.
Zunächst gibt es die schlichten alten Klassiker: autoregressive, gleitender Durchschnitt, (doppeltes, dreifaches) exponentielles Glätten, Box-Jenkins, Holt-Winters, ARMA, ARIMA … Diese Modelle handhaben typischerweise weder Mehrfachreihen noch Tags oder Ereignisse; dennoch ist Einfachheit in vielen Situationen König. Verwerfen Sie den gleitenden Durchschnitt nicht nur, weil er zu simpel aussieht, um gut zu sein.
Dann, für fortgeschrittene Modelle, spreche ich lieber von Ansätzen als von Modellen. Tatsächlich gilt: Je komplexer das Modell, desto mehr Spielraum bleibt dem Mathematiker, das Verhalten des Prognosemodells auf subtile Weise anzupassen.
Der bayessche Ansatz: Das Erstellen von Beziehungsgraphen ist besonders nützlich im Kontext von Lokad, wo wir Korrelationen zwischen time-series ausnutzen. Es ist auch nützlich, um mit tags und events umzugehen.
Der vast margin Ansatz: Support Vector Machines (SVM) sind heutzutage unglaublich populär geworden. Obwohl, was Zeitreihen betrifft, ist es eher die Support Vector Regression (SVR), die für uns am nützlichsten ist. Als kleiner Nachteil sind SVM und SVR typischerweise sehr teuer in Bezug auf rohe Rechenleistung.
Der Mischungs-/Boosting-Ansatz: Eine Vielzahl einfacher Prädiktoren zu mischen, um die Gesamtprognose zu verbessern, funktioniert gut. Die Kombination einer großen Anzahl einfacher Prädiktoren kann verwendet werden, um wirklich komplexe Verhaltensweisen abzubilden.
Der metaheuristische Ansatz: Genetischer Algorithmus, neuronale Netze, genetische Programmierung und andere evolutionäre/adaptive Ansätze. Diese Ansätze sind leistungsstark, aber auch berüchtigt für ihre inhärente Empfindlichkeit gegenüber vielen Feinabstimmungs-Parametern.
Als abschließender Hinweis: Unsere Technologie befindet sich immer noch in einer schnelllebigen Entwicklung. Neue Modelle werden nahezu jeden Monat in die Produktion eingeführt. Diese Liste ist nicht endgültig und Cloud Computing eröffnet tatsächlich viele Möglichkeiten, Modelle einzusetzen, die früher einfach zu teuer waren.