Die Arten von Prognosen: Klassifikation vs. Regression
Das Wort Prognose umfasst ein sehr breites Spektrum an Prozessen, Technologien und sogar Märkten. In der Vergangenheit haben wir die Welten der Prognosesoftware vorgestellt und dabei unterschieden zwischen:
- Deterministische Simulationssoftware
- Experten-Aggregationssoftware
- Statistische Prognosesoftware
Lokad fällt in die letzte Kategorie, da unsere Technologie rein statistisch ist. Dennoch deckt Lokad bei weitem nicht das gesamte statistische Spektrum ab. Es gibt zwei große Kategorien von Prognosen in der statistischen Prognose (*):
- Klassifikationsprognosen
- Regressionsprognosen
(*) Wir vereinfachen hier zur Klarheit, da die Feinheiten des statistischen Lernens weit über den Rahmen dieses bescheidenen Blogbeitrags hinausgehen.
Die Klassifikation versucht, (oder klassifiziert) Objekte nach ihren Eigenschaften zu trennen. Die folgende Abbildung von Tomasz Malisiewicz veranschaulicht eine Klassifikationsaufgabe, bei der versucht wird, Bilder eines Stuhls von Bildern eines Tisches zu trennen.
Abbildung von tombone’s Blog
Das Ergebnis einer Klassifikation ist binär (oder eher diskret): Objekte werden Klassen mit mehr oder weniger Vertrauen zugeordnet, d.h. höhere oder niedrigere Wahrscheinlichkeiten.
Auf der anderen Seite geben Regressionen in der Regel Kurven aus. Die folgende Abbildung betrachtet eine Zeitreihe, die den historischen Umsatz darstellt, und zeigt die entsprechende Prognose.
Die Regressionsprognose ist eine Kurve anstelle von binären (oder Kombinationen von binären) Einstellungen. Die Eingaben werden in die Zukunft verlängert.
Wie wirkt sich diese Unterscheidung auf das Geschäft aus?
Nun, es stellt sich heraus, dass Lokad - wie es Anfang 2010 steht - nur Regressionsprognosen liefert. Daher gibt es viele interessante Probleme, die von Lokad nicht angegangen werden können, da es sich um Klassifikationsprobleme handelt:
- Kundensegmentierung: Für jeden Kunden möchten wir die Wahrscheinlichkeit bewerten, durch eine Direktmarketingaktion einen erfolgreichen Up-Sale zu erzielen. Nach dem gleichen Prinzip könnten wir auch versuchen, die Abwanderung vorherzusagen.
- Betrugserkennung: Für jede Transaktion möchten wir - basierend auf dem Transaktionsmuster - die Wahrscheinlichkeit für einen Betrugsversuch bewerten.
- Priorisierung von Deals: Basierend auf den Eigenschaften des Interessenten (Budgetverfügbarkeit, Branche, Kontaktrang im Unternehmen, ausgedrücktes Interessensniveau usw.) möchten wir die Wahrscheinlichkeit bewerten, aus jedem Interessenten einen profitablen Deal zu machen, um die Anstrengungen des Vertriebsteams zu priorisieren.
Häufig werden wir gefragt, ob Lokad auch Klassifikationsprognosen liefern könnte. Leider wird die Antwort vorerst negativ ausfallen. Obwohl sie auf derselben mathematischen Theorie basieren, erfordern Klassifikation und Regression sehr unterschiedliche Technologien. Lokad konzentriert sich daher voll und ganz auf Regressionsprobleme.
Obwohl wir Klassifikationsprobleme nicht ignorieren, verdienen sie wirklich Aufmerksamkeit und Anstrengungen. Für 2010 halten wir uns an unsere Roadmap, aber in Zukunft könnte die Klassifikation eine natürliche Erweiterung unserer Prognosedienste sein.