00:00:03 Überblick über die Datenbereitstellung in der Data Science.
00:00:46 Unterschätzung der Komplexität der Datenbereitstellung.
00:02:01 Typische Dauer von Datenbereitstellungsprojekten.
00:03:19 Herausforderungen bei der Geschwindigkeit und Genauigkeit der Datenbereitstellung.
00:06:07 Bedeutung der Dokumentation der Datenbereitstellung.
00:08:00 Interpretation von ‘Bestelldatum’ in der Supply Chain.
00:09:02 Komplikationen bei der Dateninterpretation durch System-Upgrades.
00:10:07 Verständnis der Datenbedeutung zur Vermeidung von Fehlern.
00:10:15 Fallstudie: Besonderheiten des Supply Chain Systems.
00:14:53 Notwendigkeit der Daten-Dokumentation in den Geschäftsabläufen.
00:16:01 Bedeutung der Datenverfolgung in der Supply Chain.
00:17:24 Erweiterung des Datenumfangs bei automatisierten Entscheidungen.
00:18:42 Risiken bei der Abhängigkeit von Einzelpersonen für die Datenrückverfolgung.
00:19:02 Herausforderungen und Erwartungen bei der Datenbereitstellung.
00:20:13 Datenbereitstellung als unternehmensweite Anstrengung.
00:21:56 Beurteilung der Richtigkeit der Dateninterpretation anhand der realen Wirksamkeit.
00:23:02 Konsequenzen falscher Dateninterpretation und Bedeutung der Rückverfolgbarkeit.
00:24:37 Schwierigkeiten und Ergebnisse einer schlechten Datenbereitstellung.
00:24:49 Das Konzept der ‘guten’ Datenbereitstellung.

Zusammenfassung

In dieser Folge von Lokad TV diskutieren Moderator Kieran Chandler und Lokad-Gründer Joannes Vermorel die Feinheiten der Datenbereitstellung in der Data Science, ein Prozess, der oft unterschätzt wird, aber aufgrund der DSGVO-Konformität derzeit Priorität hat. Vermorel betont, dass die Datenbereitstellung, die häufig mehrere Monate und umfangreiche Ressourcen in Anspruch nimmt, entscheidend ist, um das Problem “Müll rein, Müll raus” zu umgehen. Dazu müssen inkonsistente oder unvollständige Daten in ein verständliches Format umgewandelt werden, was eine gründliche Dokumentation erfordert. Der Prozess ist komplex und wird durch die vielschichtigen Geschäftsprobleme und den historischen Kontext der Daten geprägt. Vermorel befürwortet einen verteilten Ansatz, der verschiedene Teams in der Organisation einbezieht, und betont, dass eine effektive Datenbereitstellung zugänglich sein und klare Entscheidungsfindung erleichtern sollte.

Ausführliche Zusammenfassung

In der von Kieran Chandler moderierten Folge von Lokad TV diskutieren er und Joannes Vermorel, der Gründer von Lokad, die komplexe, aber entscheidende Rolle der Datenbereitstellung im Bereich der Data Science. Mit dem Anstieg der DSGVO-Konformitätsgesetze rückt Daten immer stärker in den Fokus vieler Führungskräfte, wobei geschätzt wird, dass Unternehmen derzeit über 450 Milliarden US-Dollar allein für die Datenbereitstellung ausgeben. Das Ziel der Datenbereitstellung besteht darin, rohe, häufig inkonsistente oder unvollständige Daten in ein Format umzuwandeln, das leicht interpretiert und angewendet werden kann.

Vermorel geht auf die häufige Unterschätzung der Komplexität der Datenbereitstellung ein. Trotz der erheblichen Investitionen von Unternehmen geraten zahlreiche Projekte in Verzug oder überschreiten ihr Budget. Laut Vermorel können die meisten IT-Systemfehler auf Probleme in der Datenbereitstellungsphase zurückgeführt werden. Er erklärt, dass die vielschichtigen Geschäftsprobleme als Schritte der Datenbereitstellung erscheinen und die Komplexität der Aufgabe erhöhen.

In Bezug auf Zeitpläne schlägt Vermorel vor, dass groß angelegte Datenbereitstellungsprojekte mindestens einige Monate dauern können und oft bis zu sechs Monate dauern. Obwohl die Annahme besteht, dass verbesserte Tools oder skalierbarere Software den Prozess beschleunigen sollten, deutet er darauf hin, dass der Reifegrad des Gesamtsystems den Fortschritt verlangsamt. Um das Problem “Müll rein, Müll raus” wirklich zu vermeiden, müssen Daten zuerst dokumentiert und geklärt werden. Dieser Prozess trägt nach seiner Meinung zur längeren Zeitspanne bei.

Auf die Frage nach der Machbarkeit einer Beschleunigung dieses Prozesses erklärt Vermorel, dass es nicht so einfach ist, einfach mehr Ressourcen hinzuzufügen. Die behandelten Daten wurden ursprünglich nicht für Zwecke der Datenbereitstellung produziert, sondern sind ein Nebenprodukt von Unternehmenssystemen. Zum Beispiel beschreibt er, wie die Hauptfunktion eines Point-of-Sale-Systems darin besteht, Kundenzahlungen zu verarbeiten, nicht jedoch Daten zu sammeln. Selbst diese Systeme liefern jedoch Daten, die aufgrund praktischer betrieblicher Gründe wie Barcode-Fehlern inkonsistent oder fehlerhaft sein können. Diese Inkonsistenzen erfordern umfangreiche Vorbereitungsarbeiten für eine effektive Nutzung in der Supply Chain-Optimierung.

Vermorel spricht auch über die Bedeutung der Dokumentation bei der Datenbereitstellung. Bei Lokad beginnt ein Datenbereitstellungsprojekt in der Regel mit weniger als einer Zeile Dokumentation pro Feld pro Tabelle und endet mit einer Seite Dokumentation pro Feld pro Tabelle. Diese umfassende Dokumentation ist entscheidend, um zu verhindern, dass eine schlechte Qualität der Eingangsdaten zu einer schlechten Qualität der Ausgabe führt, oder “Müll rein, Müll raus”. Der sechsmonatige Zeitplan für die Datenbereitstellung umfasst daher auch den Prozess der Erstellung dieser umfangreichen Dokumentation.

Vermorel beginnt damit, auf die Komplexitäten und potenziellen Fehlinterpretationen hinzuweisen, die aus einem einfachen Datenpunkt resultieren können: dem Datum einer historischen Bestellung. Er erklärt, dass das “Datum” nicht so einfach ist, wie es erscheinen mag, da es mehrere potenzielle Interpretationen gibt, wie zum Beispiel wann der Kunde auf ein Produkt geklickt hat, wann er seinen Warenkorb validiert hat, wann die Zahlung verarbeitet wurde oder wann die Waren im Lager verfügbar waren.

Er weist darauf hin, dass die Interpretation solcher Daten sich im Laufe der Zeit aufgrund von System-Upgrades oder Änderungen der Geschäftspraktiken ändern kann. Daher ist es wichtig, nicht nur die Daten selbst, sondern auch den historischen Kontext, in dem sie produziert wurden, zu verstehen. Wenn diese Komplexitäten nicht berücksichtigt werden, können Unternehmen mit einem “Müll rein, Müll raus” -Problem konfrontiert werden, bei dem falsche Interpretationen zu schlechten Entscheidungen führen.

Vermorel hebt eine Fallstudie mit einem der Kunden von Lokad hervor, um seinen Standpunkt zu veranschaulichen. Dieser Kunde betreibt eine anspruchsvolle industrielle Einrichtung mit kurzen Durchlaufzeiten, bei der die genaue Menge der bestellten Waren entscheidend ist. Das System des Kunden verfügt über eine Funktion, bei der die gelieferte Menge nicht genau mit der Bestellung übereinstimmt, die gesamte Bestellung jedoch abgelehnt und zurückgesandt wird. Dies führt zu einem Dilemma, bei dem sie, wenn sie etwas mehr als bestellt erhalten, die ursprüngliche Bestellung im System anpassen müssen, um mit der gelieferten Menge übereinzustimmen. Diese Lösung ermöglicht es ihnen, die Lieferung anzunehmen und

Störungen in ihren industriellen Abläufen zu vermeiden.

Dieser Prozess wird jedoch von cleveren Lieferanten ausgenutzt, die nun etwas mehr als bestellt liefern und wissen, dass es akzeptiert wird. Dies führt zu Bestellungen, die im Vergleich zu den tatsächlichen Bedürfnissen aufgebläht erscheinen und Datenartefakte erzeugen, die die Leistung des Einkaufsteams falsch darstellen. Vermorel betont, dass diese Komplexität dokumentiert werden muss, um falsche Interpretationen zu vermeiden. Er besteht darauf, dass die Probleme nicht auf eine schlechte Leistung des Einkaufsteams zurückzuführen sind, sondern auf Einschränkungen im System und darauf, wie Benutzer mit diesen Einschränkungen umgegangen sind.

Den Fokus verändernd, diskutiert Vermorel, wer sich neben Lokad, einem Unternehmen, das es für probabilistische Vorhersagen verwendet, für historische Daten interessiert. Er weist darauf hin, dass Unternehmen das Geld, das sie erwarten zu erhalten oder zu zahlen, genau überwachen, und dass solche, die dies nicht tun, im Laufe der Zeit verschwinden. Dies ist seiner Meinung nach eine Form des unternehmerischen “Darwinismus”. Er schlägt vor, dass Unternehmen, die im Laufe der Zeit auf ihre finanziellen Transaktionen achten, naturgemäß an ihren historischen Daten interessiert sind.

Das Gespräch wendet sich der Datenbereitung zu. Vermorel betont, dass Daten nicht von Natur aus “sauber” oder vollständig verstanden sind. Er schlägt vor, dass die Datenbereitung nicht nur ein IT-Problem ist, sondern darum geht, alle Aspekte der Geschäftsdaten zu verstehen, um alle Geschäftswinkel zu berücksichtigen. Die IT-Abteilung, so bemerkt er, kann nicht erwartet werden, jeden Geschäftswinkel zu beherrschen und sollte nicht allein für die Datenbereitung verantwortlich sein.

Vermorel schlägt einen verteilten Ansatz vor, bei dem verschiedene Teams mit unterschiedlicher Expertise in der gesamten Organisation eingebunden sind. Daten, die für den Einkauf relevant sind, sollten beispielsweise die Einkaufsteams einbeziehen. Ebenso sollten Daten, die für eine Lieferantenbewertung erforderlich sind, die Beschaffungsteams einbeziehen. Mit diesem Ansatz können die erforderlichen Erkenntnisse für eine effektive Datenbereitung gewonnen werden.

Wenn es darum geht, sich bei der Dateninterpretation sicher zu sein, insbesondere wenn Informationen unvollständig sind, stellt Vermorel eine Verbindung zu wissenschaftlichen Theorien her. Es ist nicht möglich zu wissen, ob eine Theorie richtig ist, aber sie kann validiert werden, wenn sie einer Überprüfung standhält. Die Richtigkeit der Datenbereitung wird festgestellt, wenn die aus der Interpretation abgeleiteten Entscheidungen korrekt sind. Wenn fehlerhafte Datenbereitung zu unsinnigen Entscheidungen führt, kann die Ursache zurückverfolgt, korrigiert und neu bewertet werden.

Vermorel beschreibt dann, wie eine gute Datenbereitung aussehen sollte, insbesondere in komplexen Supply-Chain-Szenarien. Er vergleicht sie mit einem gut geschriebenen Buch, das relevante Geschäftseinblicke und Perspektiven bietet, nicht nur technische Details. Es sollte zugänglich und in der gesamten Organisation verteilt sein und ein gemeinsames Verständnis fördern. Es erfordert einen fortlaufenden Aufwand, um die Daten zu dokumentieren, zu pflegen und zu verstehen.

Schließlich betont Vermorel, dass die Datenbereitung eine Interpretation eines gültigen Verständnisses der Daten selbst sein sollte. Sobald dieses Verständnis etabliert und aufrechterhalten wird, sind die logischen Operationen mit den Daten recht einfach. Eine gute Datenbereitung ist daher sowohl ein gut geschriebenes Handbuch als auch ein gemeinsames Verständnis, das klare und effektive Entscheidungen in der Supply Chain ermöglicht.

Vollständiges Transkript

Kieran Chandler: In der heutigen Folge werden wir die Datenbereitung diskutieren, eine der Grundlagen der Datenwissenschaft. Angesichts der jüngsten DSGVO-Konformitätsgesetze steht Daten sehr im Vordergrund vieler Führungskräfte. Es ist auch ein großes Geschäft, denn einer aktuellen Umfrage zufolge geben Unternehmen allein für die Datenbereitung über 450 Milliarden Dollar aus. Bei der Datenbereitung geht es darum, Rohdaten in ein leicht verständliches Format zu bringen, damit sie sinnvoll verwendet werden können. Das ist keine leichte Aufgabe, wenn man bedenkt, dass Daten aus vielen verschiedenen Quellen stammen können und oft inkonsistent, unvollständig und fehlerhaft sein können. Also Joannes, warum sprechen wir heute über Datenbereitung? Ich meine, wenn diese Unternehmen über 450 Milliarden Dollar investieren, sollte es etwas sein, das wir inzwischen verstehen.

Joannes Vermorel: Ja, absolut. Datenbereitung ist ein Bereich, der ziemlich bekannt ist, aber systematisch in Bezug auf Veränderungen unterschätzt wird. Es ist interessant, weil die meisten Datenbereitungsvorhaben ihre Fristen verpassen und das Budget überschreiten. Das Kernproblem ist, dass viele tatsächliche Fehler, die Sie in IT-Systemen, Unternehmenssoftware im Allgemeinen, sehen, auf Probleme auf der Ebene der Datenbereitung zurückzuführen sind. Es ist äußerst komplex. Obwohl es ein bekanntes Problem ist, besteht das Kernproblem darin, dass Geschäftskomplexitäten als Datenbereitungsschritte wieder auftauchen und es sich somit um einen unbegrenzten Bereich handelt. Es gibt kein endgültiges Rezept für die Datenbereitung.

Kieran Chandler: Wie lange sollte es also dauern, eine beträchtliche Menge an Daten vorzubereiten?

Joannes Vermorel: Ich habe noch nie ein groß angelegtes Datenbereitungsvorhaben gesehen, das weniger als ein paar Monate gedauert hat. In der Regel sind es eher sechs Monate. Man könnte argumentieren, dass es mit besseren Tools und skalierbarerer Software schneller gehen sollte. Die Realität ist jedoch, dass es in der Branche so wenig Reife gibt, dass für praktisch jedes Unternehmen außer einigen Datenchampions wie Google die Daten zuerst dokumentiert und geklärt werden müssen. Es gibt so viele Dinge, die mit diesen Daten erledigt werden müssen, um das Problem “Müll rein, Müll raus” zu vermeiden. Es dauert also ein paar Monate, und sechs Monate sind ein realistisches Ziel, wenn eine komplexe Lieferkette involviert ist.

Kieran Chandler: Sechs Monate klingt nach einer ziemlich langen Zeitspanne. Gibt es eine Möglichkeit, diesen Prozess zu beschleunigen? Kann ich als große Organisation nicht einfach mehr Leute auf das Problem ansetzen?

Joannes Vermorel: Hier haben Sie ein spezifisches Problem: Können neun Frauen in einem Monat ein Baby bekommen? Das Problem besteht darin, die Art der Probleme zu verstehen, mit denen wir es zu tun haben. Erstens wurde die von Ihnen verwendeten Daten nicht von vornherein zur Verwendung als Daten produziert. Es handelt sich um ein Nebenprodukt Ihres Unternehmenssystems, das zufällig Ihr Unternehmen betreibt. Nehmen wir ein Beispiel für eine Point-of-Sale-Software, etwas, mit dem Sie in einem Supermarkt bezahlen können. Ihre Hauptfunktion besteht darin, Kunden zu verarbeiten, die den Laden verlassen möchten, während sie das bezahlen, was sie bezahlen sollten. Wenn also aus irgendeinem Grund ein Barcode nicht erkannt wird, wird der Kassierer wahrscheinlich ein ähnlich teures Produkt zweimal scannen. Am Ende zahlen Sie den richtigen Preis, aber in Bezug auf die Daten wird das Produkt doppelt gezählt.

Kieran Chandler: Ein Produkt, das nullmal gezählt wird, kann Probleme in Bezug auf die Bestandskontrolle verursachen, da Ihre elektronischen Aufzeichnungen nicht stimmen. Das ist keine gute Lösung, und es ist ratsam, dies zu vermeiden. Aber die Realität ist, dass, wenn Sie die Wahl zwischen der Lösung eines Datenproblems und dem reibungslosen Betrieb Ihres Unternehmens haben, diejenigen vor Ort, die physisch Lieferketten betreiben müssen, immer eine Lösung bevorzugen werden, die den Fluss von Waren, Kunden, Service und allem anderen nicht stört. Der Betrieb des Unternehmens hat oberste Priorität und Daten sind nur ein Nebenprodukt zweiter Ordnung. Sie werden nie als Bürger erster Klasse behandelt. Das ist der Grund, warum immer all diese Arbeit erledigt werden muss, weil die Daten nicht nur zum Zweck der Optimierung der Lieferkette gesammelt wurden. Kommen daher all diese Herausforderungen?

Joannes Vermorel: Tatsächlich kommen sie daher.

Kieran Chandler: Sprechen wir über die zuvor erwähnte Dokumentation. Was erwarten Sie in dieser Dokumentation zu sehen und wie hilft sie? Um das zu verstehen, wenn wir zur sechsmonatigen Zeitspanne zurückkehren, welche Art von Dokumentationsumfang erwarten wir?

Joannes Vermorel: Eine Faustregel wäre, dass wir bei Lokad in der Regel weniger als eine Zeile Dokumentation pro Tabelle pro Feld haben, wenn wir ein Projekt starten. Normalerweise haben wir nicht einmal das. Wir starten viele Projekte, bei denen wir nicht einmal eine Zeile Dokumentation pro Tabelle im ERP, MRP, WMS oder einem anderen System haben, das zur Steuerung Ihrer Lieferkette verwendet wird. Wenn wir fertig sind, haben wir eine Seite Dokumentation pro Feld pro Tabelle. Wenn Sie also 20 Tabellen mit 20 Feldern haben, sprechen wir von 400 Seiten Dokumentation. Ja, es dauert sechs Monate, um diese 400 Seiten Dokumentation zu erstellen.

Kieran Chandler: Das klingt nach einer riesigen Menge an Dokumentation. Wird das wirklich alles benötigt?

Joannes Vermorel: Es wird alles benötigt, wenn Sie vermeiden möchten, dass Müll hereinkommt und Müll herauskommt.

Kieran Chandler: Warum ist das so?

Joannes Vermorel: Betrachten wir einen praktischen Fall: Angenommen, ich habe eine Tabelle namens “Aufträge”. Sie enthält meine historischen Aufträge und hat ein Datum. Aber ist es einfach? Sprechen wir wirklich darüber, um welche Art von Datum es sich handelt? Handelt es sich um das Datum, an dem der Kunde auf ein Produkt geklickt hat, um es in den Warenkorb auf der E-Commerce-Website zu legen? Oder um das Datum, an dem der Kunde den Warenkorb validiert und die Zahlung geleistet hat? Oder um das Datum, an dem die Zahlung vom Kreditkartenprozessor validiert wurde? Oder um das Datum, an dem der Eintrag in das System registriert wurde? Oder um das Datum, an dem der Kaufauftrag zuletzt im System geändert wurde? Es gibt etwa 20 verschiedene Interpretationen für dieses eine “Datum”-Feld.

Außerdem, wenn Ihr Unternehmen mehr als ein Jahrzehnt Geschichte hat, besteht die Möglichkeit, dass sich die feine Linie der Interpretation des “Auftragsdatums” im Laufe der Jahre geändert hat. Sie könnten in eine Situation geraten, in der Sie ein Upgrade eines Systems hatten und die Semantik dieser Spalte sich geändert hat.

Es ist auch nicht von Natur aus etwas, das für Ihre gesamte Geschichte vollständig homogen ist. Dann können Sie weitere Komplikationen haben, wie zum Beispiel Randfälle. Zum Beispiel soll dieses Datum das Datum sein, an dem der Kunde den Warenkorb validiert hat, es sei denn, die Zahlung wurde letztendlich als Betrug abgelehnt. In diesem Fall handelt es sich um das Datum und die Uhrzeit, zu der der Auftrag als Betrug abgelehnt wurde.

Nochmals, es ist eigentlich kein sehr gutes Design, aber Unternehmen, die komplexe Lieferketten betreiben, haben komplexe Systeme und eine lange Geschichte. Daher wurde IT nicht unbedingt von Anfang an perfekt durchgeführt, und Sie müssen mit all diesen historischen Komplikationen umgehen. Diese spiegeln sich in dieser Dokumentation wider. Wenn Sie all diese Komplikationen nicht berücksichtigen, werden Sie Probleme haben, wenn Sie diese Daten analysieren möchten.

Kieran Chandler: Um eine optimierte Entscheidung für Ihre Lieferkette zu generieren, können Sie ein Problem von “Müll hereinkommt, Müll herauskommt” haben, wenn Sie die Daten falsch interpretieren. Also, was Sie sagen, ist, dass es darum geht, die Semantik der Daten zu klären, richtig?

Joannes Vermorel: Genau. Sie müssen verstehen, dass Daten mehr als nur Zahlen sind. Sie repräsentieren verschiedene Faktoren, die in einer Zelle kombiniert sein können. Es geht nicht nur darum, die Software zu verstehen, die Daten erzeugt, sondern auch darum, wie Menschen mit der Software interagieren. Ihre Dokumentation muss den menschlichen Aspekt dessen berücksichtigen, was die Menschen tun.

Kieran Chandler: Haben Sie ein gutes Beispiel dafür, wie einer Ihrer Kunden dieses Problem in der Vergangenheit erlebt hat und wie es sich auf ihr Unternehmen ausgewirkt hat?

Joannes Vermorel: Ja, ich kann ein Beispiel geben. Wir hatten einen Kunden, der einen sehr anspruchsvollen Betrieb betrieb, der eine hohe Verfügbarkeit erforderte. Sie gaben Bestellungen mit sehr kurzen Vorlaufzeiten an ihre Lieferanten weiter. Ihr System hatte eine interessante Designfunktion. Wenn die gelieferte Menge nicht mit den ursprünglich angeforderten Mengen übereinstimmte, musste die gesamte Bestellung abgelehnt und an den Lieferanten zurückgeschickt werden.

Nehmen wir zum Beispiel an, Sie bestellen 1.000 Einheiten, aber der Lieferant liefert 1.050 Einheiten, dann müssten Sie sie ablehnen. Das Problem dabei ist, dass es bei einer Ablehnung zu ernsthaften betrieblichen Problemen führen könnte. Das System erlaubte ihnen nicht, die Menge zu ändern, also endete es damit, dass sie die ursprüngliche Bestellung änderten, um die gelieferte Menge widerzuspiegeln.

Kieran Chandler: Also, Sie meinen, sie haben die ursprüngliche Bestellung geändert, um dem zu entsprechen, was geliefert wurde?

Joannes Vermorel: Genau. Allerdings ergab sich dadurch ein weiteres Problem. Die Lieferanten wurden auf diese Praxis aufmerksam. Sie erkannten, dass sie mehr liefern konnten als bestellt wurde, in dem Wissen, dass das Unternehmen diese Lieferungen benötigte. Sie lieferten keine übermäßige Menge, sondern etwas, was das Unternehmen akzeptieren würde.

In den Daten schien es so, als ob die ursprüngliche Bestellung für die größere Menge erfolgt wäre. Dies führte zu seltsamen Daten, bei denen Bestellungen im Vergleich zu dem, was benötigt wurde, zu groß erschienen, was den Eindruck erweckte, dass das Einkaufsteam Schwierigkeiten hatte, die richtigen Mengen zu wählen. Das Problem lag jedoch nicht beim Einkaufsteam, sondern an den Einschränkungen des Systems und wie die Menschen mit diesen Einschränkungen umgingen.

All diese Details mussten dokumentiert werden, um zu vermeiden, zu falschen Schlussfolgerungen zu gelangen. Das Einkaufsteam war nicht schlecht in ihrem Job. Das Problem bestand darin, dass sie ein System mit Einschränkungen hatten, mit denen sie nur versuchten, zurechtzukommen.

Kieran Chandler: Das System erzeugt all diese seltsamen Nebeneffekte. Um das zu verstehen, braucht man eine ganze Seite Erklärung, aber es gibt kein Entkommen. Es ist einfach die Komplexität des Geschäfts selbst, die sich in diesen Daten widerspiegelt. Lassen Sie uns von diesen hinterhältigen Lieferanten abkommen. Das ist definitiv ein unterhaltsames Beispiel. Also, Sie haben den Aspekt der Person erwähnt. Offensichtlich verwenden wir bei Lokad historische Daten, um probabilistische Prognosen für die Zukunft zu erstellen. Wer sonst interessiert sich eigentlich für historische Daten, außer uns?

Joannes Vermorel: Typischerweise erhielt alles, was wirklich den Betrag des zu erwartenden Geldes betraf, viel Aufmerksamkeit. Es ist nicht so, dass die Leute keine Aufmerksamkeit schenkten, aber Unternehmen, die das Geld, das sie erhalten sollten, nicht genau überwachten, tendierten dazu, im Laufe der Zeit zu verschwinden. Das ist wie Darwinismus in Aktion. Wenn Sie nicht einmal darauf achten, verschwinden Sie einfach. Deshalb wurde vor etwa fünf Jahrhunderten von einigen italienischen Mönchen die doppelte Buchführung erfunden. Wenn Sie nicht aufpassen, bricht Ihr Kloster einfach aufgrund schlechter Buchhaltungspraktiken zusammen. Es ist nicht gerade ein neues Problem, aber es gibt viele Daten, die wir in der Vergangenheit nicht als geschäftskritisch betrachtet haben, die jetzt geschäftskritisch werden.

Um Ihnen ein Beispiel zu geben, um Fehlbestände in der Vergangenheit ordnungsgemäß zu erfassen, haben Sie berücksichtigt, was Sie eingekauft haben, damit Sie wissen, was Sie Ihren Lieferanten bezahlen sollten, und was Sie verkaufen, damit Sie wissen, was Ihre Kunden Ihnen bezahlen sollten. Aber was ist mit der Verfolgung der historischen Fehlbestände? Solange Sie einen Supply-Chain-Praktiker haben, der die Mengen per Hand festlegt und sich daran erinnert, dass es einige seltsame Zeiträume mit Fehlbeständen gab, benötigen Sie keine historischen Aufzeichnungen. Sie sind Teil Ihres Systems.

Das Problem besteht darin, dass, sobald Sie zu etwas übergehen möchten, das quantitativer ist, wie das, was wir bei Lokad mit automatisierten Entscheidungen für all diese banalen Aufgaben tun, wie zum Beispiel die Entscheidung, wie viel bestellt werden soll, genaue Aufzeichnungen über die historischen Lagerbestände viel wichtiger werden. Andernfalls interpretiert Ihre Automatisierung den Verkauf und den Mangel an Nachfrage falsch.

Wenn Sie eine höhere Automatisierung in Ihrem Unternehmen haben möchten, müssen Sie auf einen breiteren Datensatz achten, nicht nur auf die rohe Buchhaltung. Ihr Buchhalter interessiert sich nicht für Ihre Tage mit Fehlbeständen, aber Ihre Supply-Chain-Optimierungssoftware schon. Sie müssen den Kreis der Daten erweitern, die wirklich Teil Ihres Bereichs sind, die dokumentiert sind und bei denen Sie Qualitätskontrolle und Sicherheit benötigen.

Kieran Chandler: Also sind wir ziemlich abhängig von dieser einen Person, die sich daran erinnert, was in der Vergangenheit passiert ist. Sollten wir nicht besser auf die Daten vorbereitet sein, wenn sie eintreffen? Sollte nicht die IT-Abteilung oder jemand anders diese Daten vorbereiten und sicherstellen, dass sie von Anfang an sauber sind? Es scheint ein einfacherer Weg zu sein, die Dinge zu erledigen.

Joannes Vermorel: Ja, aber das Problem liegt nicht in der IT-Kompetenz. Es gibt keine sauberen Daten. Der Punkt ist, dass Daten nicht von Natur aus mit ausreichender Tiefe verstanden werden und nicht alle Geschäftswinkel angemessen abgedeckt sind.

Kieran Chandler: Es wird oft gesagt, dass Unternehmen Milliarden in KI investieren, aber die Realität ist, dass es die Komplexität des Unternehmens selbst ist, die bei dieser Aufgabe, dieser Herausforderung der Datenvorbereitung, zum Vorschein kommt. Und zu sagen: “Oh, die IT-Abteilung sollte sich darum kümmern”, ist gleichbedeutend mit der Erwartung, dass die IT das Unternehmen führt und in jedem einzelnen Geschäftswinkel sachkundig ist.

Joannes Vermorel: Absolut, das schafft plötzlich ein organisatorisches Problem, weil man erwartet, dass die IT genauso ein Experte in Personalwesen, Marketing, Einkauf usw. ist. Ich meine, man erwartet eine vollständige Beherrschung aller Geschäftswinkel von der IT-Abteilung. Aber das ist zu viel verlangt. Die IT-Abteilung muss sich bereits mit allen IT-Änderungen befassen, daher sollte von ihr nicht erwartet werden, jedes einzelne Geschäftsproblem im Unternehmen anzugehen. Alternativ könnten Sie die IT als Ihr gesamtes Unternehmen definieren, aber das widerspricht dem Zweck.

Zurück zum vorliegenden Fall muss die Datenvorbereitung eine ziemlich verteilte Anstrengung im Unternehmen sein, denn letztendlich sind die einzigen Personen, die das erforderliche Verständnis für die Vorbereitung der relevanten Daten für den Einkauf liefern können, die Einkaufsteams. Ebenso müssen Sie, wenn Sie eine Lieferantenbewertung einführen und die Daten mit ausreichender Genauigkeit vorbereiten möchten, damit sie wirklich Sinn ergibt, mit Ihren Teams sprechen, die für die Beschaffung verantwortlich sind.

Jedes Mal, wenn Sie ein Problem angehen, müssen die Spezialisten für dieses Problem in Ihrem Unternehmen involviert sein, denn sie sind diejenigen, die Ihnen das erforderliche Verständnis für die Vorbereitung der Daten geben, damit sie Sinn ergeben. Es ist kein rein IT-Problem. Es geht darum, das gesamte erforderliche Verständnis zu sammeln, damit Sie bei der Verarbeitung von Daten nicht mit Daten enden, die im Hinblick auf das zu lösende Geschäftsproblem unsinnig sind.

Kieran Chandler: Also sind wir noch nicht ganz da, wie es scheint. Einige Unternehmen sind zwar schon dort, aber sie sind die Ausnahme, nicht die Regel. Wie können Sie sicher sein, wenn Sie nicht alle Informationen haben und es Lücken gibt, die Sie interpretieren, dass Ihre Interpretation die richtige ist? Es könnte viele Möglichkeiten geben.

Joannes Vermorel: Absolut, und das ist ein interessanter Punkt, denn es ist ähnlich wie bei wissenschaftlichen Theorien. Sie wissen nie, ob Ihre Theorie richtig ist, Sie wissen nur, dass sie gut genug ist und wenn sie in der Praxis herausgefordert wird, funktioniert sie. Sie haben nichts Besseres, um sie besser funktionieren zu lassen.

Was bedeutet das also für die Datenbereitung? Es bedeutet, dass Sie wissen, dass Ihre Datenbereitung korrekt ist, wenn am Ende der Datenpipeline die automatisch generierten Entscheidungen basierend auf dieser Interpretation korrekt sind. Wenn Sie korrekte Entscheidungen treffen, bedeutet das, dass Ihre Optimierungslogik effizient ist, Ihre Machine Learning-Schichten genau sind und viele andere Dinge. Grundsätzlich ist es einfach nicht möglich, korrekte Entscheidungen zu treffen, die von einer falschen Interpretation generiert werden. In der Regel werden Ihre Ergebnisse so stark beeinträchtigt, wenn Sie Ihre Daten nicht korrekt interpretieren und vorbereiten, dass es keine Chance gibt, dass es funktioniert.

Das Fazit ist, dass es keinen Ausweg gibt, als die Vorbereitung durchzuführen, zuversichtlich zu sein und dann die Entscheidungen zu generieren. Wenn die Entscheidungen unsinnig sind, gehen Sie zurück, verfolgen Sie das Problem bis zur Ursache zurück - häufig ist es die Datenbereitung - und beheben Sie es. Wenn am Ende des Tages die Entscheidungen, die aus Ihrem System kommen, für einen Praktiker, der seinen eigenen Verstand benutzt, um sie zu bewerten, Sinn ergeben, dann wissen Sie, dass Sie es richtig gemacht haben.

Kieran Chandler: Man könnte sagen, dass ich glaube, dass sie richtig vorbereitet sind, aber in der Regel geht es um Nuancen. Der Supply Chain-Praktiker könnte sagen: “Es ist eine gute Entscheidung, aber sie könnte noch weiter verbessert werden. Zum Beispiel, wenn wir den Preis unserer Konkurrenten berücksichtigen würden, weil das ungewöhnliche Spitzen oder Rückgänge in der Nachfrage erklärt, und wir haben diese Daten noch nicht.” Es ist also keine Schwarz-Weiß-Situation.

Joannes Vermorel: Wir haben viel über die Schwierigkeiten bei der Datenbereitung und darüber gesprochen, wie eine schlechte Datenbereitung aussieht. Aber um es zusammenzufassen, wie sieht eine gute Datenbereitung aus? In einer moderat komplexen Supply Chain-Situation würde eine gute Datenbereitung wie ein gut strukturiertes Buch aussehen. Denken wir daran wie an ein 400-seitiges Buch mit einer Seite pro Tabelle oder zwanzig Feldern in 20 Tabellen. Aber es reicht nicht aus, dass es nur ein Buch ist, es muss ein gut geschriebenes Buch sein.

Wenn Sie etwas unglaublich Langweiliges schreiben, wird es niemand lesen und es wird keine Auswirkungen auf Ihre Organisation haben. Es muss also gut geschrieben sein. Und mit gut geschrieben meine ich, dass es lesbar sein sollte. Es muss auch aus geschäftlicher Sicht geschrieben sein. Es ist keine IT-Dokumentation. Datenbereitung ist wirklich kein IT-Problem, es geht eher darum, alle geschäftlichen Erkenntnisse zu haben.

Die gültige Perspektive im Geschäft ändert sich immer. Wenn sich die Wettbewerbslandschaft in Ihrer Branche ändert, ändert sich auch die gültige Perspektive zu einem bestimmten Problem. Dieses Buch muss also gut geschrieben und gepflegt werden.

Dies ist eine sehr verteilte Anstrengung in Ihrem Unternehmen, denn zum Beispiel hat nur das Merchandising-Team den richtigen Einblick und die richtige Perspektive, um zu wissen, wie die Merchandising-Tabellen überhaupt dokumentiert werden sollten. Diese Datenbereitung sieht aus wie saubere, gut geschriebene Materialien, die in Ihrem Unternehmen weit verbreitet und zugänglich sind.

Das Interessante ist, dass, wenn Sie all diese Erkenntnisse haben, die Datenverarbeitung, die Logik ist, zu einer einfachen Interpretation des gültigen Verständnisses der Daten selbst wird. Sie müssen eine enorme Menge an Aufwand betreiben, um die Daten zu verstehen, sie zu dokumentieren, zu schreiben und zu pflegen. Aber wenn Sie all das getan haben, wird das Schreiben der Logik einfach. Wie sieht also eine gute Datenbereitung aus? Es ist wie ein gut geschriebenes Buch, ein gemeinsames Verständnis, eine Art Supply Chain-Bibel, die intern in Ihrem Unternehmen existiert.

Kieran Chandler: Klingt gut! Also, Daten in Graustufen, wird das ein neuer Bestseller aus der Organisation?

Joannes Vermorel: Möglicherweise, wer weiß?

Kieran Chandler: Okay, wir hoffen, Ihnen hat die heutige Folge über die Datenbereitung gefallen. Wie immer, melden Sie sich bei weiteren Fragen und wir sehen uns das nächste Mal auf Lokad TV. Auf Wiedersehen für jetzt.