Prognose mit Kategorien und Hierarchie

Prognosen mit Kategorien und einer Hierarchie












Starseite » Ressourcen »

Lokad hat sich zum Ziel gesetzt so genaue Prognose, wie möglich, zu liefern. Doch wenn man sich ein einzelnes Produkt ansieht, sind oft nicht ausreichende historische Daten verfügbar, um eine genaue statistische Prognose zu berechnen. Lokad umgeht dieses Problem, indem es weitgehende Korrelationen unter den Artikeln erstellt, um der Prognose den Feinschliff zu geben. Gleichzeitig ist aber die Erstellung von Korrelationen in sich selbst auch etwas eingeschränkt, da die Historie vielleicht zu kurz ist oder zu wenige Daten enthält. Daher nutzt Lokad auch das Konzept der Artikelhierarchie und der Artikelkategorien, um die Prognosen besser zu gestalten. Auf dieser Seite erklären wir, wie solche Daten an Lokads Prognose-Engine übergeben werden können.

Allgemeine Syntax

Die Kategorien und die Hierarchie können dem Prognose-Engine als benannte Argumente, wie aus folgender Syntax hervorgeht, mitgeteilt werden:
Leadtime = forecast.leadtime(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4https://www.lokad.com/edit.aspx?page=categories-and-hierarchy#
  // andere Argumente abgeschnitten
  )
Demand = forecast.demand(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4
  label: PlainText
  // andere Argumente abgeschnitten
  )  

Diese Argumente sind optional, so dass category, hierarchy und label ausgelassen werden können. Werden sie nicht ausgelassen, können bis zu 4 Vektoren angegeben werden, es können aber natürlich auch 1, 2 oder 3 Vektoren angegeben werden.

Prognose-Perspektive

Kategorien und Hierarchie spielen eine ähnliche Rolle aus der Perspektive des Prognose-Engines. Sie helfen den Prognose-Engine, mit einer geringen Anzahl historischer Daten auszukommen. So kann für einen beliebigen Artikel (1) die Anzahl der vergangenen Beobachtungen sehr eingeschränkt sein und womöglich lediglich eine Handvoll für das ganze Jahr vorhanden sein. In solchen Fällen können Prognosen, die sich auf begrenzte historische Daten stützen, für einen Artikel ziemlich ungenau sein, da die Schätzung des Artikels äußerst „verrauscht“ sein würde.

(1) Der Begriff Artikel kann sich, je nach dem betrachteten Unternehmensfall auf ein Produkt, einen Strichcode, eine SKU, ein Teil, usw. beziehen. Der Artikel definiert aus der Sicht der Prognose die Granularität des Interesses.

Gegen diese Sorge nutzt Lokads Prognose-Engine Korrelationen zwischen Artikel. Doch, da nur wenige historische Daten verfügbar sind, ist es schwer, Korrelationen der Artikel allein nach den vergangenen Werten zu erstellen. Folglich versucht das Prognose-Engine auch, mögliche Beziehungen zwischen den Artikeln anhand ihrer Attribute und Eigenschaften festzustellen.

Im Einzelhandel werden diese Eigenschaften gewöhnlich über PIM-Systeme (Product Information Management) gesammelt. Als Webapp bietet Lokad kein PIM-Feature, doch die von Lokad verarbeiteten Daten stammen oft aus PIMs. Diese Eigenschaften sind für die Prognose interessant, da sie implizit viele Informationen über den Markt enthalten, so zeigen sie etwa auf die relevanten Marktsegmente und heben die Differenzierungsfaktoren der Artikel hervor.

Die Hierarchie

Die Hierarchie ist als hierarchische Organisation (baumförmig) aller Artikel konzipiert. Der Prognose-Engine unterstützt bis zu vier Hierarchie-Ebenen. Wenn mehrere Hierarchie-Ebenen vorhanden sind, sollten sie dem Prognose-Engine nach absteigender Bedeutung übermittelt werden, d.h. das erste Argument stellt die wichtigste Hierarchie-Ebene dar. Der Prognose-Engine unterstützt nicht mehrere Hierarchien.

In den meisten Unternehmen liegt bereits eine Hierarchie zur Organisation der Artikel vor. Hierarchie-Ebenen können je nach geltender Terminologie im Unternehmen als Markt, Segment, Familie, Unterfamilie, usw. benannt werden. Zum Beispiel ist die Produkthierarchie für Unternehmen im Online-Handel gewöhnlich auf deren Webseite über die Navigationsmenüs sichtbar.

Die Kategorien

Die Kategorien sind für verschiedene Kategorisierungen der Artikel gedacht, die für die Prognose als relevant betrachtet werden. Kategorien sollen die Hierarchie auf transversale Eigenschaften der verkauften Güter (z.B. der Autor im Falle eines Buches) vervollständigen. Im Gegensatz zur Hierarchie, wird bei Kategorien nicht erwartet, dass sie einen bestimmten Bezug unter sich teilen, daher wird nicht erwartet, dass die erste Kategorie über der zweiten liegt.

In der Praxis können Kategorien benutzt werden, um vielfältige Attribute von Artikel, wie etwa die Marke, das Material oder die Farbe zu spiegeln. Außerdem können Kategorien auch als alternative zur Darstellung einer zweitrangigen Hierarchie verwendet werden. Das Prognose-Engine unterstützt bis zu vier verschiedene Kategorie-Attribute.

Bezeichnungen im Plain-Text-Format

Die Bezeichnungen (Labels) sind zur allgemeinen Kategorisierung der Artikel über ihre Beschreibungen im Plain-Text-Format gedacht. Der Prognose-Engine bietet Text Mining Fähigkeiten, die Datasets unterstützten, bei denen Kategorien und Hierarchien fehlen. In der Tat ist oft für die Genauigkeit der Prognose erwünschte Information zu eigenen Kategorien und Hierarchien nicht vorhanden und die manuelle Eingabe hiervon für tausende Artikel ist außerdem unpraktisch.

Zum Glück ist Lokads Prognose-Engine in der Lage, die Beschreibungen der Artikel im Plain-Text-Format zu nutzen. Obwohl es keine strikte Begrenzung zur Länge der Beschreibungen Plain-Text-Format gibt, ist der Prognose-Engine für Beschreibungen von weniger als 20 Wörtern optimiert. Als Faustregel gilt, dass die besten Ergebnisse bei einer einzeiligen Artikelbeschreibungen erzielt werden. In der Praxis beobachten wir, dass Beschreibungen hoher Qualität im Plain-Text-Format die Genauigkeit fast so viel erhöhen, wie gut definierte Kategorien und Hierarchien.

Vorkenntnisse des Markts

Hierarchie und Kategorien sollten dem Prognose-Engine Vorkenntnisse über den Markt liefern. Unserer Erfahrung nach sind alle Attribute oder Eigenschaften, die für einen Fachmann aufschlussreich sind, mit großer Wahrscheinlichkeit auch für den Prognose-Engine relevant. Für jegliche größere Datasets, die über 100 Artikel beinhalten, empfehlen wir mindestens zwei Attribute (gar zwei Hierarchie-Ebenen, oder eine Hierarchie-Ebene und eine Kategorie). Die Bereitstellung solcher Informationen trägt deutlich zur Genauigkeit bei.

Gleichzeitig raten wir davon ab, synthetische Kategorien oder Hierarchie-Ebenen zu erstellen, die beispielsweise der Saisonabhängigkeit oder dem Absatzvolumen gewidmet sind. Dies kann der Prognose-Engine nämlich von selbst erledigen, wenn die Attribute aus den historischen Daten berechnet werden können.