00:00:43 Einführung von Pierre Pinson
00:01:25 Pierre Pinsons Hintergrund und seine Arbeit im Bereich Data-centric Design Engineering und Vorhersage.
00:02:20 Wie Pierre in die probabilistische Vorhersage und ihre Anwendungen in Energie, Logistik und Business Analytics einstieg.
00:04:17 Bewertung der Vorhersagequalität, ihre Bedeutung für die Entscheidungsfindung und wie sie mit dem Vorhersagewert zusammenhängt.
00:07:41 Erste Reaktionen auf probabilistische Vorhersagen.
00:08:27 Das Problem der Überkonfidenz.
00:10:00 Claude Bernards Kritik an Statistiken und Wahrscheinlichkeiten.
00:13:00 Determinismus vs. stochastische Verhaltensweisen in der Welt.
00:14:37 Brücke zwischen Meteorologie und Wirtschaft durch probabilistische Vorhersagen schlagen.
00:15:11 Die Bedeutung der Wettervorhersage und kulturelle Implikationen.
00:16:46 Wahrscheinlichkeiten erklären und Vorhersagen verstehen.
00:18:58 Herausforderungen der Informationsüberflutung und Entscheidungsfindung.
00:20:31 Wahrscheinlichkeiten in Risikoabschätzungen umwandeln.
00:22:14 Ausgewogenheit zwischen automatisierter Entscheidungsfindung und Benutzervertrauen.
00:23:36 Bedeutung meteorologischer Vorhersagen in Wirtschaft und Logistik.
00:25:01 Windvorhersagen und ihre Bedeutung im Energiesektor.
00:26:00 Wetterdatennutzung in der Prognose des Strombedarfs und in supply chain Situationen.
00:30:25 Unterschiede bei der Anwendung probabilistischer Vorhersagen in meteorologischen und logistischen Kontexten.
00:32:46 Diskussion über die Herausforderungen bei der Übersetzung komplexer probabilistischer Vorhersagen für Kunden.
00:33:32 Kostenbedenken bei Cloud Computing und der Bereitstellung großer Datenmengen.
00:35:02 Die Nutzung zweidimensionaler Histogramme und ihre Auswirkungen auf Speicher und Kosten.
00:37:19 Unterrichten probabilistischer Vorhersagen und die Herausforderungen, denen sich die Studierenden stellen müssen.
00:40:00 Probabilistische Vorhersagen zu vereinfachen und die Modellüberprüfung zu verstehen.
00:42:40 Ineffizienz in Prozessen und Transportmethoden.
00:43:57 Die Herausforderung, Unsicherheiten aus der supply chain zu entfernen.
00:45:20 Die Kosten der Beseitigung von Unsicherheiten und ihre Auswirkungen auf verschiedene Branchen.
00:47:00 Die Entwicklung der Vorhersagen und der Wandel von angewandter Mathematik zur Wirtschaftswissenschaft.
00:50:53 Das Zusammenführen verschiedener Bereiche in Vorhersagen und Entscheidungsfindung unter Unsicherheit.
00:52:30 Anpassung der Erklärung probabilistischer Vorhersagen an unterschiedliche Hintergründe.
00:53:21 Die Anwendung probabilistischer Vorhersagen in verschiedenen Unternehmen und ihre Vorteile.
00:55:53 Die Attraktivität visuell ansprechender probabilistischer Vorhersagen und Geschichten über Urheberrechtsverletzungen.
00:58:03 Die Grenzen von Tortendiagrammen bei der Vermittlung von Informationen und ihre Verwendung in der Pre-Sale-Phase.
01:00:01 Die Akzeptanz von Unsicherheit in beruflichen Laufbahnen und das Verständnis der probabilistischen Perspektive.
01:02:23 Interdisziplinärer Ansatz und Unsicherheit in verschiedenen Branchen.
01:04:27 Die Bedeutung von Bildung und wie neue Generationen die Branche beeinflussen.
01:07:00 Die Adoptionskurve probabilistischer Vorhersagen in verschiedenen Bereichen.
01:08:33 Joannes’ Sicht auf einen jahrhundertelangen Zeithorizont zur Akzeptanz von Unsicherheit.
01:10:37 Herausforderungen bei der Einführung neuer Ideen und das langsame Tempo des Wandels in einigen Bereichen.
01:12:14 Die Bedeutung der Mathematik in der Vorhersagetechnologie.
01:13:26 Zukünftige Fortschritte in der Wissenschaft und Technologie der Vorhersage.
Zusammenfassung
In einem Interview mit Conor Doherty diskutieren Joannes Vermorel, Gründer von Lokad, und Pierre Pinson, Chair of Data-centric Design Engineering am Imperial College London, über probabilistische Vorhersage und ihre Anwendungen in verschiedenen Bereichen. Sie betonen die Bedeutung, die Unsicherheit in Vorhersagen zu verstehen, sowie den Bedarf an kontinuierlicher Weiterbildung in diesem Bereich. Alle drei sind sich einig, dass Innovation schneller voranschreitet, als Menschen sie annehmen können, und raten dazu, über neue Entwicklungen in diesem Bereich auf dem Laufenden zu bleiben und sich auf kommende Fortschritte vorzubereiten.
Erweiterte Zusammenfassung
In diesem Interview diskutiert der Moderator Conor Doherty probabilistische Vorhersagen mit den Gästen Joannes Vermorel, dem Gründer von Lokad, und Pierre Pinson, Chair of Data-centric Design Engineering am Imperial College London. Pinson verfügt über einen umfangreichen Hintergrund im Bereich Data-centric Design Engineering und hat sich auf verschiedene Anwendungsgebiete konzentriert, unter anderem Energie und Logistik. Vermorel hingegen näherte sich probabilistischen Vorhersagen aus einer supply chain Perspektive an.
Pinson war zunächst an Wetter und erneuerbarer Energie interessiert und wurde ein Promotionsangebot für Vorhersagen von Windparks unterbreitet. Er betont die Bedeutung, die Unsicherheit einer Vorhersage sowie die potenzielle Bandbreite der Ergebnisse zu verstehen. Vermorels Weg zur probabilistischen Vorhersage begann mit der Erkenntnis, dass viele supply chain Forecasts größtenteils null waren. Er stellte fest, dass, obwohl alles möglich ist, nicht alles gleichermaßen wahrscheinlich ist, und dass das Verständnis der Struktur von Vorhersageungenauigkeiten wertvoll sein kann.
Die Meteorologie verwendet verschiedene Kennzahlen, um die Vorhersagequalität zu bewerten, wie zum Beispiel die Distanz zwischen Prognosen und tatsächlichen Ergebnissen sowie den Durchschnitt der absoluten Differenzen zwischen beiden. Allerdings zeigen diese Kennzahlen nicht immer an, ob eine Vorhersage für eine spezifische Anwendung gut oder schlecht ist. Vermorel fügt hinzu, dass probabilistische Vorhersagen dabei helfen können, eine fundierte Einschätzung des Möglichen zu liefern.
Eine Herausforderung für diejenigen, die mit probabilistischen Vorhersagen arbeiten, besteht darin, andere davon zu überzeugen, die Idee der Quantifizierung von Unsicherheiten zu akzeptieren und anzunehmen. Menschen bevorzugen in der Regel deterministische Vorhersagen aufgrund kognitiver Verzerrungen, die zu Überkonfidenz führen. Probabilistische Vorhersagen bieten hingegen eine transparentere und gerechtere Darstellung möglicher Ergebnisse. Der Einsatz probabilistischer Vorhersagen in der decision-making kann zu besseren Ergebnissen führen, aber die Menschen müssen offen für das Konzept der Unsicherheit sein.
Claude Bernard, ein französischer Physiologe des 19. Jahrhunderts, argumentierte gegen den Einsatz von Statistiken und Wahrscheinlichkeiten in wissenschaftlichen Experimenten und vermutete, dass Variabilität auf unvollständiges Verständnis oder nachlässige Wissenschaft zurückzuführen sei. Pinson ist jedoch der Ansicht, dass deterministische Ansätze zwar für bestimmte Probleme gut funktionieren können, die Welt aber nicht grundsätzlich deterministisch ist. Probabilistische Vorhersagen sind in Situationen mit inhärent stochastischem Verhalten und Unsicherheit wertvoll.
Eine der größten Herausforderungen bei probabilistischen Vorhersagen ist die Informationsüberflutung. Die Menschen müssen bereits eine Vielzahl von Informationen verarbeiten, und die Hinzunahme probabilistischer Daten kann es noch schwieriger machen, alles zu verstehen. Dies gilt insbesondere bei der Verarbeitung großer Datenmengen, wie zum Beispiel bei Vorhersagen für Millionen von Produkten in einer supply chain.
Um dieses Problem anzugehen, haben sich einige Unternehmen an die automatisierte Entscheidungsfindung oder Risikoabschätzungen gewandt, um den Nutzern zu helfen, probabilistische Vorhersagen zu verstehen. Durch die Umwandlung probabilistischer Daten in quantifizierte Risiken können die Nutzer die potenziellen Konsequenzen ihrer Entscheidungen besser nachvollziehen, ohne von der Komplexität der Daten überfordert zu werden.
Im Bereich der Meteorologie hat sich probabilistische Vorhersage als nützlich erwiesen, um Größen wie Temperatur, Niederschlag, Windgeschwindigkeit und Sonnenstrahlung zu prognostizieren. Diese Variablen können erhebliche Auswirkungen auf verschiedene Aspekte des täglichen Lebens und der Wirtschaft haben, wie zum Beispiel die Energieproduktion und -verbrauch. In einigen Fällen kann der Einsatz von Wetterdaten in supply chain Forecasting zu genaueren Vorhersagen führen, insbesondere wenn es zu plötzlichen Änderungen in den Wetterbedingungen kommt.
Die Interviewpartner räumen jedoch ein, dass die Einbindung von Wetterdaten in supply chain Forecasting herausfordernd war, mit nur wenigen erfolgreichen Beispielen. In einem Fall wurden Wetterdaten verwendet, um die Vorhersagen für den Strombedarf eines Elektrizitätsanbieters in Europa zu verbessern. Durch die Integration von Wetterdaten in ihre Prognosen konnte das Unternehmen die durch schnelle Wetteränderungen verursachten Ungenauigkeiten verringern.
Vermorel teilt seine Erfahrungen mit Lokad, das trotz seiner einfachen Prognosemodelle eine beeindruckende Genauigkeit erreicht hat. Ein Beispiel, das er anführt, ist ein Projekt mit einem Eishersteller, der einen Nachfrageschub basierend auf Wetterbedingungen vorhersagen wollte. Obwohl die Post-Mortem-Analyse erfolgreich die Ursachen für den gestiegenen Umsatz ermittelte, erwies sich die Nachfrageprognose aufgrund der langen Durchlaufzeiten, die in der supply chain involviert sind, als schwieriger. Vermorel betont, dass trotz der Herausforderungen, denen sie gegenüberstanden, weiterhin Potenzial für probabilistische Vorhersagen in verschiedenen Branchen besteht.
Pinson erörtert die Unterschiede zwischen der Anwendung probabilistischer Vorhersagen in meteorologischen Kontexten und in Logistik- sowie Geschäftskontexten. Er erklärt, dass die Hauptaufgabe darin besteht, das richtige Vorhersageprodukt zu bestimmen, das als Input für Entscheidungsprozesse verwendet werden soll. Er erwähnt, dass Szenarien, Intervalle und Quantile einige der in Betracht gezogenen Optionen sind, letztlich jedoch von den spezifischen Bedürfnissen des Kunden abhängen.
Vermorel hebt zudem die Bedeutung der Berücksichtigung von Rechenkosten bei der Umsetzung probabilistischer Vorhersagetechniken hervor. Nach seiner Erfahrung liefern Histogramme und Wahrscheinlichkeitsdichten die detailliertesten Informationen, können jedoch rechnerisch aufwendig sein, insbesondere wenn mit hochdimensionalen Daten gearbeitet wird. Deshalb setzt Lokad häufig einen Mix aus verschiedenen Techniken ein, um die Kosten im Griff zu behalten und die Berechnungen effizient zu gestalten.
Beim Unterrichten von Studierenden über probabilistische Vorhersagen stellt Pinson fest, dass die größte Herausforderung nicht darin besteht, sie von den Vorzügen des Konzepts zu überzeugen, sondern ihnen zu helfen, die praktischen Aspekte der Anwendung dieser Techniken in realen Situationen zu verstehen. Vermorel fügt hinzu, dass es für Praktiker entscheidend ist, die theoretischen Aspekte probabilistischer Vorhersagen mit den praktischen Überlegungen zu Kosten und rechnerischer Effizienz in Einklang zu bringen.
Vermorel berichtet von seinen Schwierigkeiten, Menschen zu unterrichten, die bereits durch Berater ausgebildet wurden, die für schlanke Strukturen und die Beseitigung von Unsicherheiten in supply chains eintreten. Er ist der Meinung, dass einige Unsicherheiten entfernt werden können, andere jedoch akzeptabel sind und mit geeigneten Werkzeugen gemanagt werden sollten.
Pinson betont, dass die Beseitigung von Unsicherheit kostspielig sein kann und es daher besser ist, sie klug zu akzeptieren und zu managen. Er führt das Beispiel der erneuerbaren Energien an, bei denen die Entwicklung von Speichersystemen zur Bewältigung einer unendlichen Energiemenge extrem teuer und kaum machbar wäre. Stattdessen kann es kosteneffizienter und praktikabler sein, Unsicherheit zu akzeptieren und Vorhersagen zu nutzen.
Die Diskussion wendet sich den historischen und kulturellen Aspekten von Vorhersagen zu, bei denen die Menschen stets versucht haben, in einer deterministischen Welt zu leben und Unsicherheiten zu beseitigen. Zudem erörtern sie das Zusammenführen unterschiedlicher Disziplinen, wie Naturwissenschaften, Sozialwissenschaften und Wirtschaftswissenschaften, in der Vorhersage und Entscheidungsfindung unter Unsicherheit.
Pinson spricht über die Herausforderungen, probabilistische Vorhersagen Menschen mit unterschiedlichen Hintergründen zu vermitteln, und über den Bedarf an einer gekürzten Version für diejenigen, die keinen starken mathematischen Hintergrund haben. Er schlägt vor, mit einfachen Beispielen zu beginnen und die Komplexität schrittweise zu erhöhen, während er die Bedeutung des Verständnisses der zugrunde liegenden Prinzipien und Konzepte betont.
Vermorel berichtet von Erfahrungen mit Urheberrechtsverletzungen, da einige der Grafiken seines Unternehmens ohne Genehmigung auf LinkedIn wiederverwendet wurden. Diese ansprechenden Grafiken können jedoch die Aufmerksamkeit potenzieller Kunden auf sich ziehen und das Unternehmen technologisch fortschrittlicher erscheinen lassen.
Pinson erklärt, dass Unsicherheit in jedem Aspekt unseres Lebens präsent ist und dass das Verständnis und Management von Unsicherheit für Fachleute in verschiedenen Bereichen von entscheidender Bedeutung ist. Bildung spielt eine Schlüsselrolle dabei, dieses Verständnis zu fördern, da Studierende, die probabilistische Vorhersagen erlernen, diese Fähigkeiten in die Arbeitswelt einbringen und einen Unterschied in ihren Unternehmen machen können.
Pinson ist der Ansicht, dass die Verbreitung probabilistischer Vorhersagen in verschiedenen Branchen weiter zunehmen wird, da immer mehr Menschen darüber gebildet werden und sich Unternehmen gegenseitig zu Inspiration und Ideen anspornen. Er nennt die Schifffahrtsindustrie als Beispiel für einen Bereich, der bei der Einführung probabilistischer Vorhersagen bisher zögerlich war, nun aber in anderen Branchen nach Anhaltspunkten sucht, um sie in ihre Abläufe zu integrieren.
Vermorel unterstreicht die Bedeutung, Unsicherheit in Vorhersagen zu verstehen, und führt als Beispiel die Schlacht des 19. Jahrhunderts an, bei der es fast ein ganzes Jahrhundert dauerte, bis die Menschen zugaben, dass Chemie in der Medizin relevant ist. Er schlägt vor, dass Innovation schneller geschieht, als die Menschen sie aufnehmen können, und dass Bildung dabei eine entscheidende Rolle spielt. Vermorel erwähnt auch Niels Bohrs Zitat “Science progresses one funeral at a time” und betont damit, dass bedeutende Fortschritte zwar schnell eintreten können, das Verständnis ihrer Implikationen jedoch scheinbar ewig dauert.
Pinson diskutiert die Anwendungen der probabilistischen Vorhersage in der Meteorologie und erwähnt, dass, obwohl die Mathematik hinter der Vorhersagetechnologie vielleicht nicht der relevanteste Teil der Diskussion ist, es entscheidend ist, die fortlaufenden Entwicklungen in der angewandten Mathematik anzuerkennen. Er erklärt, dass das Entwerfen von Maschinen zur parallelen Vorhersage von Millionen von time series Herausforderungen mit sich bringt, aber Forscher entwickeln kontinuierlich neue Modelle und Technologien für die Zukunft.
Sowohl Vermorel als auch Pinson stimmen darin überein, dass im Bereich der Vorhersage und probabilistischen Vorhersage noch viel Fortschritt zu erzielen ist und dass eine fortlaufende Weiterbildung und ein besseres Verständnis von Unsicherheiten notwendig sind. Sie fordern dazu auf, über neue Entwicklungen in diesem Gebiet auf dem Laufenden zu bleiben und sich auf die kommenden Fortschritte vorzubereiten.
Vollständiges Transkript
Conor Doherty: Willkommen zurück bei LokadTV! Ich bin euer Gastgeber, Conor, und wie immer ist Lokad-Gründer Joannes Vermorel an meiner Seite. Heute ist Pierre Pinson hier, Chefredakteur des International Journal of Forecasting und Chief Scientist bei Half Space. Heute wird er uns über mehrere interessante Anwendungen probabilistischer Vorhersagen erzählen. Willkommen bei Lokad, schön, Sie kennenzulernen.
Pierre Pinson: Vielen Dank, dass Sie mich heute eingeladen haben.
Conor Doherty: Und vielen Dank, dass Sie heute dabei sind. Wir freuen uns sehr, Sie hier zu haben. Pierre, ich habe gerade eine sehr kurze Einführung gegeben; Sie haben tatsächlich einen ziemlich umfangreichen Lebenslauf. Könnten Sie uns zunächst einen Einblick in Ihren Hintergrund und in das, was Sie tun, geben? Ich weiß, dass Sie in mehreren Projekten und in verschiedenen Bereichen aktiv sind.
Pierre Pinson: Ja, vielen Dank. Zunächst einmal bin ich derzeit Professor am Imperial College in London. Ich leite einen Lehrstuhl, der sich auf datenorientiertes Design Engineering konzentriert. Da heutzutage immer mehr Daten verfügbar sind, müssen wir aus diesen Daten Wert schöpfen – und das ist das Ziel meiner Forschung und Lehre. Offensichtlich ist eine der interessantesten und ersten Anwendungen, an die man mit Daten denkt, die Vorhersage. Daher beschäftige ich mich seit 20 Jahren mit verschiedenen Anwendungsfeldern, hauptsächlich im Energiebereich, da dort so viele Vorhersagen relevant und notwendig sind, aber auch in Logistik, Business Analytics usw.
Conor Doherty: Eine Menge interessanter Bereiche, und vieles überschneidet sich mit dem, was wir machen wollen. Wie sind Sie also zur probabilistischen Vorhersage gekommen?
Pierre Pinson: Nun, ich wollte eigentlich nie probabilistische Vorhersagen machen, das muss ich gestehen. Ich war sehr an Wetter und erneuerbaren Energien interessiert, und man bot mir an, eine Promotion zur Vorhersage im Bereich der erneuerbaren Energien – etwa für Windparks, also wie viel ein Windpark morgen produzieren wird – zu machen. Das Problem ist, ein Vorhersager liegt immer falsch, und mein Doktorvater meinte: “Wir würden zwar gern wissen, wie falsch sie liegen, aber es sollte nicht nur ein einzelnes Maß sein – etwa, ob eine Vorhersage im Durchschnitt so gut oder so schlecht ist. Wir möchten wissen, ob meine Vorhersage für morgen gut sein wird oder nicht.” Und so entwickelte sich für mich die probabilistische Vorhersage, denn dann hat man die Vorstellung, basierend auf dem, was ich heute weiß, in die Zukunft zu blicken und zu beschreiben, wie groß die Unsicherheit bezüglich dessen, was geschehen könnte, ist – vielleicht auch, was das wahrscheinlichste Ergebnis, das erwartete Ergebnis und welchen Intervallbereich man erwarten könnte.
Conor Doherty: Das ist interessant, und ich komme gleich zu Ihnen, Joannes, dazu. Aber wenn Sie darüber sprechen, was eine gute Vorhersage in der Meteorologie ausmacht, welche Metriken verwenden Sie, um die Effektivität zu messen? Es kann ja nicht nur heißen: “Heute hat es nicht geregnet, also war alles 100% korrekt.” Welche Metriken werden dafür herangezogen?
Pierre Pinson: Genau deshalb ist es ja auch eine Wissenschaft für sich, zu bewerten, ob eine Vorhersage gut war oder nicht. Prinzipiell, wenn man eine Vorhersage für eine kontinuierliche Variable hat, wie Windgeschwindigkeit oder Temperatur, verstehen wir Vorhersagequalität als den Abstand zwischen dem, was prognostiziert wurde, und dem, was tatsächlich passiert ist. Dieser Abstand kann auf verschiedene Arten verarbeitet werden: Man kann beispielsweise die Summe der quadrierten Abweichungen oder Fehler nehmen, den Durchschnitt der absoluten Differenz berechnen usw. Es gibt also viele Metriken, die aussagen, wie gut oder schlecht eine Vorhersage ist. Das Problem ist, dass sie letztlich auf eine Zahl hinauslaufen. Wenn ich also sage, dass meine Vorhersage im Durchschnitt um zwei falsch liegt, könnten Sie denken: “Okay, großartig” – aber macht das eine gute oder schlechte Vorhersage für meine Anwendung? Genau das war in den letzten Jahrzehnten der Entwicklung im Vorhersagebereich oft das Problem: Wir müssen die Vorhersagequalität – also wie genau man in Bezug auf diesen Abstand ist – mit dem Vorhersagewert verbinden, nämlich damit, wie nützlich die Vorhersage für unsere Entscheidungsfindung ist.
Conor Doherty: Gibt es da Ähnlichkeiten zu unserer Herangehensweise?
Joannes Vermorel: Das ist sehr interessant, denn bei Lokad sind wir über einen völlig anderen Weg zur probabilistischen Vorhersage gelangt, und das, was Sie beschreiben, entspricht eher der fundierten Meinung, die ich nach einigen Jahren entwickelt habe, im Gegensatz zu meinem ursprünglichen Ansatz. Mein anfänglicher Ansatz war viel alltäglicher: Wir sagten in supply chains zu vielen Dingen einfach Null voraus. Diese Anekdote habe ich schon ein paar Mal erzählt, denn als wir unsere ersten Versuche unternahmen, Verkaufszahlen in Mini-Märkten vorherzusagen – wo die meisten Produkte im Schnitt praktisch null Mal pro Tag verkauft werden – näherte man sich dem nächstmöglichen ganzzahligen Wert. In einem typischen Mini-Markt werden bei etwa 95% der Produkte an einem beliebigen Tag null Einheiten verkauft. Genau dieses Problem führte zu einer Vorhersageverzerrung, die uns zu Quantilen führte. Und während wir mit den Quantilen experimentierten, erkannten wir, dass wir wahrscheinlich alle Quantile gleichzeitig haben sollten, und so kamen wir zur probabilistischen Vorhersage. Aber heutzutage, wenn ich erklären muss, warum probabilistische Vorhersagen wichtig sind, sehe ich es so: Ja, Ihre Vorhersage ist verzweifelt ungenau – das wissen wir. Meine Vorhersage, beispielsweise als Anbieter, ist verzweifelt ungenau, aber das heißt nicht, dass ich keinerlei Ahnung davon habe, wie diese Ungenauigkeiten aussehen werden. Tatsächlich habe ich eine ziemlich fundierte Einschätzung des Spektrums der Möglichkeiten. Alles ist möglich, aber nicht alles ist gleichermaßen wahrscheinlich. In Ihrer fundierten Einschätzung des Spektrums der Möglichkeiten gilt: Alles ist möglich, aber nicht alles gleich wahrscheinlich, und es gibt eine Struktur zur Analyse von Fehlern. Können Sie das näher erläutern?
Pierre Pinson: Das Absonderlichste und Faszinierendste für die Menschen ist die Vorstellung, dass es eine Struktur in dieser Fehleranalyse gibt. Die Leute nehmen intuitiv an, dass Unsicherheit daraus resultiert, Dinge nicht zu wissen, und wenn man ihnen dann sagt, dass es eine Struktur in dem gibt, was sie nicht wissen, klingt das verwirrend. Als ich anfing, probabilistische Vorhersagen zu befürworten, war die erste Reaktion, dass egal was passiert, ich niemals falsch liegen würde, weil meine Vorhersage stets die Wahrscheinlichkeit eines Ereignisses berücksichtigen würde. Die Leute sahen das als den ultimativen Verteidigungsmechanismus für den Anbieter.
Joannes Vermorel: Es ist interessant, Ihre Anekdoten zu hören, aber man könnte es auch aus einer anderen Perspektive betrachten. Es gibt das “Big Mouse Paradox” aus der Psychologie und dem Marketing, bei dem überkonfidente Personen in einem Raum mehr Anerkennung bekommen, selbst wenn sie falsch liegen könnten. Die meisten bevorzugen eine deterministische Vorhersage, weil sie ihnen ein Gefühl von Sicherheit gibt, auch wenn sie wissen, dass sie falsch sein wird. Eine probabilistische Vorhersage anzubieten, bedeutet tatsächlich mehr Transparenz und Fairness, aber die Menschen müssen das akzeptieren und ihren kognitiven Bias zugunsten des Determinismus überwinden.
Joannes Vermorel: Wenn wir zugeben, dass wir nicht exakt sein können, aber dennoch eine ziemlich gute Vorstellung vom Spektrum der Möglichkeiten vermitteln, handeln wir transparenter und oft auch besser in Bezug auf die Vorhersagequalität. Das größte Problem für uns, die wir mit probabilistischen Vorhersagen arbeiten, ist es, die Menschen dazu zu bringen, die Idee zu akzeptieren, dass man die Unsicherheit umarmen und sie in die Entscheidungsfindung einbeziehen sollte. Das führt tatsächlich zu besseren Ergebnissen. Dieser Drang nach Determinismus im Leben ist ein großes Problem für uns, die wir mit probabilistischen Vorhersagen arbeiten. Wir müssen die Menschen irgendwie dazu bringen zu akzeptieren, dass sie sich von der Vorstellung lösen, dass ein einzelner Punkt alle Informationen liefern und wahr sein muss. Sie müssen erkennen, dass es besser ist, wenn man die Unsicherheit quantifizieren und in die Entscheidungsfindung einbeziehen kann – denn dadurch kann man nur bessere Entscheidungen treffen.
Conor Doherty: Was halten Sie davon, Joannes?
Joannes Vermorel: Es ist sehr interessant, diese Idee, die eigene Schwäche zuzugeben. Wenn man zurückgeht bis zu Claude Bernard, der das Kontroll-Experiment erfunden hat, dann hat er eine ganze Argumentation gegen den Einsatz von Statistik und Wahrscheinlichkeiten aufgestellt. Sein Punkt war eigentlich sehr treffend: Er argumentierte, dass, wenn etwas variiert, das nur bedeutet, dass das Experiment schlecht konzipiert ist und man die Gegebenheiten nicht ausreichend kontrolliert. Er war im medizinischen Bereich tätig und meinte, dass, wenn es Variabilität gibt, eine dritte Variable dafür verantwortlich sein muss. Somit war er gegen den Einsatz von Statistik und Wahrscheinlichkeiten, weil er darin die Anerkennung sah, dass man ein unvollständiges Verständnis hat – ein Zeichen von Faulheit als Wissenschaftler. Am Ende hat man diese anspruchsvolle Statistik, die nur eine Ausrede für die eigenen Unzulänglichkeiten ist. Was ist Ihre Sicht auf diesen Einwand, Pierre?
Pierre Pinson: Ich stimme zu, dass das für bestimmte Problemstellungen gilt, bei denen man sich allein auf die physikalischen Gesetze in einer sehr kontrollierten Umgebung verlässt und der deterministische Ansatz damit eigentlich ausreichen sollte. Man sollte sich nicht zu sehr mit diesen Unsicherheiten und dem probabilistischen Rahmen befassen. Aber wenn man das allgemeinere Bild betrachtet, ist es fast eine philosophische Aussage über die Welt: Glauben wir, dass die Welt für alles, was geschieht, grundsätzlich deterministisch ist? Oder gibt es um uns herum tatsächlich ein stochastisches Verhalten, gewisse stochastische Regeln? Das macht die grundlegende Idee des Determinismus nicht immer anwendbar. Das sieht man auch beim Wetter. Wir haben immer wieder versucht zu denken: Wenn wir immer mehr Messungen haben und die Gesetze der Physik immer besser kennen, sollten wir in der Lage sein, das Wetter als deterministischen Prozess zu betrachten und vorherzusagen. Das ist ein schöner Gedanke, aber es gab in den letzten 100 Jahren wiederholt Experimente, die zeigen, dass vielleicht nicht alles deterministisch sein kann. Und selbst diese Argumente der unvollständigen Kenntnisse – ich denke, es gibt so viele Dinge, die wir modellieren und vorhersagen müssen, für die wir niemals ausreichend Wissen haben werden, um uns in einen rein deterministischen Rahmen zu zwängen. Das ist einfach nicht möglich.
Conor Doherty: Wenn ich hier einhaken darf: Eine Frage, die ich schon vorhin stellen wollte, war, ob nicht genau diese Verbindung zwischen Geschäft und Meteorologie hergestellt wird, denn es gibt eine interessante Brücke zwischen diesen beiden Bereichen – vor allem vor dem Hintergrund Ihres Hintergrunds, denn Sie haben sowohl Erfahrung in der Geschäftswelt als auch in der Meteorologie. Vermutlich fanden Sie sich also in einer Situation wieder, in der Sie probabilistische Vorhersagen auf ein Geschäftsproblem angewendet haben und dabei vielleicht auf Widerstand gestoßen sind – so etwas wie “Oh, ich will probabilistische Vorhersagen nicht nutzen, das ist die dunkle Kunst” – aber dieselbe Person zückt zehn Sekunden später ihr iPhone und sagt: “Oh, 60% Chance, dass es später regnet, besser nimm einen Regenschirm mit.” Wie gehen Sie in diesem Moment mit dieser kognitiven Dissonanz um?
Pierre Pinson: Das ist ein sehr guter Punkt, und tatsächlich gibt es hier auch ein kulturelles Problem. Ich glaube, wir haben gesehen – Sie erwähnten, dass die Wettervorhersage ein so wichtiges Feld ist, weil sie überall verwendet wird und jeder darauf sensibel reagiert. Diese Informationen sind für viele Menschen von Bedeutung. Es hat sich gezeigt, dass, wenn wir die Art und Weise der Kommunikation von Vorhersagen ändern, manche Methoden funktionieren und andere nicht. Es ist manchmal schwierig für Menschen, den tatsächlichen Gehalt der Information einzuschätzen, aber wir finden sie dennoch nützlich – egal was passiert. Es ist ein Prozess, und ich denke, in verschiedenen Bereichen müssen wir denselben Prozess durchlaufen. Das kann im Geschäftsbereich sein, in technischen Problemen, in der Versicherungsbranche – es gibt so viele Bereiche, in denen wir als Wissenschaftler oder Vorhersageanbieter im industriellen Ökosystem dazu beitragen müssen, die Kultur zu verändern, damit die Menschen – seien es Kunden oder allgemeine Nutzer – erkennen, dass wir auch anders denken können und dass dies Vorteile mit sich bringt.
Conor Doherty: Nur um darauf noch einmal zurückzukommen: Sie sagten, wenn ich es richtig verstanden habe, dass es bestimmte Mechanismen zur Vermittlung meteorologischer Informationen oder Wettervorhersagen gibt, die bei den Menschen Anklang finden – und andere, die es nicht tun. Könnten Sie das bitte etwas näher erläutern oder vielleicht ein Beispiel geben, damit die Leute es besser verstehen?
Pierre Pinson: Es wurden verschiedene Studien von Psychologen durchgeführt, die mit Wettervorhersagern zusammenarbeiteten. Wenn man beispielsweise eine Aussage über die Regenwahrscheinlichkeit trifft, etwa dass es in den nächsten zwei Stunden zu 60% in London regnen wird, interpretieren das die Menschen unterschiedlich. Einige denken, es bedeute, dass es 60% der Zeit in London regnen wird, während andere glauben, es bedeute, dass es an einem bestimmten Ort in London zu 60% regnen wird. Viele Menschen haben Schwierigkeiten, das grundlegende Konzept der Wahrscheinlichkeit zu verstehen.
Joannes Vermorel: Ja, wir haben dieses Problem auch festgestellt, wenn wir mit Nutzern oder Kunden arbeiten. Es wird viel Arbeit in die Entwicklung von Methoden für probabilistische Vorhersagen gesteckt und darin, wie diese in der Praxis eingesetzt werden können. Gleichzeitig muss aber auch viel Arbeit investiert werden, um den Menschen zu vermitteln, was diese Informationen wirklich bedeuten und wie sie ihre Entscheidungen beeinflussen können. Die Herausforderung besteht darin, die Menschen dazu zu bringen, zu verstehen, wie sie von einer probabilistischen Vorhersage zu einer besseren Entscheidung gelangen können, als wenn sie eine deterministische Vorhersage verwendet hätten. Wenn sie das nicht verstehen, werden sie es auch nicht akzeptieren.
Conor Doherty: Wie machen Sie das klar? Verwenden Sie einen White-Box-Ansatz?
Joannes Vermorel: Wir machen etwas, das gleichzeitig ähnlich und unähnlich ist. Mein Problem, wenn ich aus einem supply chain Hintergrund komme, ist der Umgang mit der Informationsüberflutung. Die Leute haben bereits zu viel Information. Selbst deterministische Vorhersagen können überwältigend sein, da sie oft super aggregiert sind und verschiedene Probleme aufweisen. Wenn man in den Bereich probabilistischer Vorhersagen übergeht, wird es um zwei Größenordnungen schlimmer, mit Histogrammen für jeden Datenpunkt und noch mehr Komplexität, wenn man hochdimensionale Wahrscheinlichkeiten betrachtet.
Anfangs haben wir versucht, die Visualisierung und andere Aspekte zu verbessern, aber letztendlich sind wir zu einer Lösung gelangt, bei der wir Wahrscheinlichkeiten aus der Nutzersicht entfernen. Wir basieren Entscheidungen auf Wahrscheinlichkeiten, wandeln diese jedoch in Risikobewertungen um, die in Währung ausgedrückt werden. Zum Beispiel könnten wir einem Kunden mitteilen, dass das Risiko eines Überbestands X Betrag beträgt und das Risiko eines stockout Y Betrag. Wir quantifizieren Risikoklassen und Perspektiven, wobei die zugrunde liegende probabilistische Vorhersage das “Verrohrungssystem” für diese Bewertungen darstellt.
Natürlich ist dies nicht die perfekte Lösung, aber sie funktioniert für unsere Kunden. Manchmal lieben data scientist Teams die Arbeit mit Wahrscheinlichkeiten, doch supply chain Experten, die weniger mit Wahrscheinlichkeiten vertraut sind, finden diesen Ansatz zugänglicher. Ich würde sagen, dass der supply chain Experte, der in Sachen supply chain unglaublich kompetent ist, aber in Bezug auf Wahrscheinlichkeiten nicht so bewandert, es sehr schwer findet, sein Interesse daran zu entwickeln, allein aufgrund der geforderten Informationsüberflutung. Sehr schnell müssen diese Manager einschätzen, ob es überhaupt wert ist, sich diese Histogramme anzusehen. Das ist ein sehr hartes Verkaufsargument, wenn man mit Menschen spricht, die ihre Zeit sehr schätzen.
Pierre Pinson: Ich stimme zu, ich stimme völlig zu. Es gibt sehr unterschiedliche Verläufe. Wie du erwähnt hast, gibt es verschiedene Wege, wie man dieses Problem der Informationsüberflutung angehen kann. Ich stimme deiner Strategie hier vollkommen zu. Ich denke, dass der Versuch, automatisierte Entscheidungsfindung einzusetzen oder optimale Entscheidungen vorzuschlagen – nachdem man das Kosten-Nutzen-Verhältnis des Nutzers verstanden hat – etwas Gutes ist. Aber wieder einmal müssen die Anwender verstehen, wie man zu diesem Ergebnis gelangt ist und warum sie es überhaupt vertrauen sollten, was kurios ist, denn als es deterministisch war, vertrauten sie darauf. Und jetzt, da das Wort Wahrscheinlichkeit ins Spiel kommt, vertrauen sie ihm nicht mehr. Aber das ist eine andere Geschichte. Die Schönheit probabilistischer Information besteht darin, dass man diese zusätzliche Schicht sehr grundlegender Bewertungen, Risikobewertungen, liefern kann, was sie wirklich wollen, wenn sie sagen, dass sie probabilistisch akzeptieren. Bitte sag mir, welchem Risiko ich ausgesetzt bin. Das ist die einfachste Art von Information, die man bereitstellen kann, um die Vorteile probabilistischer Vorhersagen zu bieten – ohne diese erwähnte Informationsüberflutung. Daher denke ich tatsächlich, dass dies eine sehr gute Strategie ist.
Conor Doherty: Nun, wir haben die Themen irgendwie miteinander verschmolzen, wie Meteorologie und Business. In diesem Punkt, Pierre, da du in beiden Bereichen viel Erfahrung hast, welche Beispiele für wichtige meteorologische Vorhersagen oder meteorologische Daten hast du herangezogen und in einem Geschäfts- oder Logistikkontext angewendet?
Pierre Pinson: Die Wettervorhersageinformationen, die man als Input für Entscheidungsfindungen verwenden möchte, besitzen nur sehr wenige Variablen, die äußerst wichtig sind – und danach nimmt die Bedeutung der Variablen schnell ab. Die wichtigsten Variablen sind die Temperatur, die so viele andere Prozesse in unserem Leben antreibt, und dann gibt es den Niederschlag. Neuerdings spielt auch der Wind eine Rolle, denn in den alten Zeiten, vor etwa 30 Jahren, wenn Wetterdienste über den Wind sprachen, erstellten sie Windvorhersagen fast zum Spaß, weil es niemanden wirklich interessierte. Es ging nur darum: Wird es windig sein oder nicht? Und vielleicht, wenn man segelt, interessiert man sich ein wenig mehr dafür. Aber heute, wegen Energieanwendungen, sind Vorhersagen der Windgeschwindigkeit extrem wichtig, da schon ein kleiner Vorhersagefehler in der Windgeschwindigkeit zu riesigen Fehlern in der Energie führen kann, die morgen verfügbar sein wird. Denkt an ein Land wie Dänemark, wo im Durchschnitt die Hälfte der Energie aus dem Wind stammt. Es ist ziemlich wichtig, gute Windvorhersagen zu haben. Dies sind die relevantesten Variablen, und nun spielt auch die Sonneneinstrahlung wegen der Solarenergie eine Rolle. Aber ich würde sagen, dass dies die wichtigsten Variablen sind, und was den Einfluss betrifft, werden diese Wettervariablen heute überall eingesetzt. Wenn man die Bedeutung der Wettervorhersagen und die Qualität der Vorhersagen in unserem täglichen Leben betrachtet – sowohl im geschäftlichen Kontext als auch im Alltag – ist das extrem wichtig.
Conor Doherty: Sicherlich, was die Vorlaufzeiten beim Versand von Waren aus dem Ausland betrifft – wenn man bedenkt, was Pierre gerade beschrieben hat – muss das ebenfalls in probabilistische Vorhersagen für supply chains einfließen, oder?
Joannes Vermorel: In der gesamten Geschichte von Lokad glaube ich, dass es nur zwei Fälle gab, in denen es uns tatsächlich gelang, Wetterdaten in supply chain Situationen einzusetzen. Das könnte wieder an fehlendem Talent, mangelndem Engagement oder vielen anderen Faktoren gelegen haben. Aber der springende Punkt war: Vor etwa einem Jahrzehnt hatten wir einen großen europäischen Stromanbieter und einen Vertrag, um deren Strombedarfsprognose zu verbessern, indem das Wetter einbezogen wurde. Und das war für mich der einzige Fall, in dem es einen sehr eindeutigen Erfolg bei der Nutzung von Wetterdaten gab. Es funktioniert, und letztlich betrachteten wir Vorhersagen, die bereits sehr aggregiert waren, im Wesentlichen nach Regionen. Selbst ohne Wetter war die Prognose bereits sehr genau, etwa zu 2% Genauigkeit, weil sie stark aggregiert war. Aber nebenbei bemerkt, das betraf ausschließlich den Strombedarf – und zwar nur von einem Tag auf den nächsten. Man schaute also lediglich 24 Stunden voraus, und die aggregierten Regionen wären beispielsweise ein Land wie Belgien oder vielleicht Frankreich, aufgeteilt in fünf Gebiete, also auf einem ziemlich hohen Aggregationsniveau.
Ohne Wetter hättest du eine Vorhersage, eine Zeitreihenprognose, die zu 2% genau war, und die meisten Ungenauigkeiten wurden durch schnelle Wetterwechsel verursacht. Wenn es kalt ist, bleibt es in der Regel kalt, doch wenn sich plötzlich das Wetter ändert, entsteht ein Sprung, den man nicht rechtzeitig erkennt. Das bedeutete, dass du im Durchschnitt eine Prognose hattest, die zu 0,5% genau war, aber an Tagen, an denen das Wetter wechselte, sich die Ungenauigkeit vielleicht auf 5 oder 6% summierte. Indem das Wetter einbezogen wurde, hatten sie bereits etwa 0,5% Genauigkeit erreicht, und mit Lokad erzielten wir nahezu die gleiche Genauigkeit – allerdings mit Modellen, die tatsächlich viel einfacher und handhabbarer in der Software waren. Es war also eine besondere Art von Unterfangen.
Das war das erste Mal, dass ich sagte, dass es, weißt du, wirklich gut funktioniert. Der zweite Fall betraf FMCG-Marken, die im Wesentlichen Nachfragespitzen mithilfe von Wettervorhersagen prognostizieren wollten. Leider waren die Ergebnisse überwiegend negativ. Was sehr gut funktionierte, war – und ich werde den Namen der Marke nicht nennen, aber sagen wir, es handelte sich um einen Eisdielenanbieter – dass sie einfach wissen wollten, was nach dem Sommer sehr gut funktionierte. Die Frage lautete: Haben wir mehr Eis verkauft, weil es sehr heiß war, oder weil das Marketing promotion sehr gut war? Als Post-Mortem-Technik, um die Situation zu erklären, funktionierte es gut. Allerdings besteht das Problem bei der Prognose darin, dass die Vorlaufzeiten in den meisten supply chain Situationen erheblich sind. Zum Beispiel, wenn du Eis produzierst, musst du die Rohmaterialien bestellen und deinen Produktionsplan etwa sechs Wochen im Voraus vorbereiten. Zu diesem Zeitpunkt neigen Wettervorhersagen dazu, sich auf saisonale Durchschnittswerte zurückzuziehen, die nicht wesentlich besser sind als der saisonale Durchschnitt, um deine Entscheidung zu beeinflussen. Nach unserer Erfahrung erwies sich das als unglaublich schwierig – wir hatten nur wenige Erfolge, aber es war in vielerlei Hinsicht sehr lehrreich.
Conor Doherty: Pierre, wenn es darum geht, probabilistische Vorhersagen im meteorologischen Kontext anzuwenden, wie überträgt sich das auf den Einsatz in einem logistischen oder geschäftlichen Kontext? Gibt es Ähnlichkeiten hinsichtlich der Einschränkungen oder des Prozesses?
Pierre Pinson: Eines der Hauptprobleme, das ausschlaggebend ist, wenn wir an verschiedene Anwendungen denken – seien es meteorologische oder wetterkritische Branchen – ist die Art des Vorhersageprodukts, das als Input für Entscheidungsfindungen nützlich ist. Typischerweise verwenden Wettervorhersagen Ensemble-Vorhersagen, die aus mehreren Trajektorien oder potenziellen Zukünften bestehen. Zum Beispiel hat das European Centre 51 alternative Szenarien. Allerdings gibt es viele Arten von Entscheidungsprozessen, für die unterschiedliche Vorhersageprodukte benötigt werden.
Im Handel beispielsweise bevorzugen es die Leute, Dichten zu verwenden, also vollständige Beschreibungen der Wahrscheinlichkeitsdichtefunktion. Einige ziehen Intervalle und vordefinierte Konfidenzniveaus als Input für Entscheidungsprozesse vor. Andere verlangen spezifische Quantile, basierend auf ihren Kosten-Nutzen-Erwägungen. Der Hauptunterschied, den ich zwischen der Meteorologie und anderen Bereichen beobachtet habe, ist, dass wir viel Zeit darauf verwenden müssen, über das richtige Vorhersageprodukt nachzudenken, das als Input genutzt werden soll. Wir müssen uns in die Welt unserer Kunden hineinversetzen und den besten Weg finden, die komplexe Information aus probabilistischen Vorhersagen in das umzusetzen, was für sie am nützlichsten ist. Somit sollte die Vorhersage für die Kunden nützlich sein, und auch dein Ansatz konzentriert sich darauf. Kannst du näher auf die Bedenken bezüglich der cloud computing Kosten eingehen und erklären, wie sie deine Arbeit beeinflussen?
Joannes Vermorel: Ja, als Anbieter von enterprise software ist einer der Hauptaspekte die Cloud-Computing-Kosten – auf sehr alltägliche Weise. Um dir ein Gefühl für das Ausmaß zu geben: Die Kundenbasis von Lokad verwaltet etwa ein Petabyte an Daten, und dafür zahlen wir derzeit an Microsoft, unseren Cloud-Hosting-Anbieter. Es ist ein gutes Geschäft sowohl für Microsoft als auch für Lokad, aber es sind Kosten involviert. Das meiste, worauf wir achten, wird durch die Kosteneffizienz gesteuert, die wir in Bezug auf die Computerhardware erreichen können.
Histogramme und Wahrscheinlichkeitsdichten sind typischerweise am besten. Sie sind super reichhaltig, super schön und super einfach zu verwenden. Aber das Problem ist, dass in einer Dimension das in Ordnung ist. Du hast fixe Kosten – du erhöhst die Datenmenge sagen wir mal um das 100-fache und erhältst ein schönes Histogramm. Aber wenn du in zwei Dimensionen gehst, weil du eine Matrix von Wahrscheinlichkeiten erstellen möchtest, wird es komplizierter. Zum Beispiel möchtest du vielleicht die Wahrscheinlichkeiten betrachten, einen bestimmten Bedarf für ein Produkt zu haben, und gleichzeitig die Wahrscheinlichkeiten für denselben Bedarf eines anderen Produkts – jedoch gemeinsam. Der Grund ist, dass diese Produkte Konkurrenten sind, und wenn der Bedarf für ein Produkt stark ansteigt, geschieht das meist aufgrund von Kannibalisierung durch das andere. Du möchtest also Wahrscheinlichkeiten, die berücksichtigen, dass höchstwahrscheinlich, wenn der Bedarf eines Produkts zunimmt, der Bedarf eines anderen Produkts abnimmt – und umgekehrt. Wenn du dies in einer Matrix darstellst, erhältst du ein zweidimensionales Histogramm, und der dafür benötigte Speicher steigt erheblich. Es wird immer schlimmer, je mehr Dimensionen hinzukommen, was die Sache sehr kostspielig macht.
Ähnlich ist es, wenn du zu Monte Carlo-ähnlichen Simulationen übergehst, die sehr gut darin sind, mit hochdimensionalen Sachverhalten umzugehen – das Problem ist, dass bei vielen Szenarien die Erträge abnehmen. Du benötigst möglicherweise sehr viele Szenarien, um ein Risiko, das etwas selten ist – sagen wir 10.000 Fälle – überhaupt beobachten zu können. Die meisten unserer Überlegungen beruhen darauf, die Rechenkosten überschaubar zu halten. Es geht nicht nur um die Kosten, die wir an Microsoft zahlen, sondern auch darum, dass bei komplexeren Berechnungen die Rechenzeit zunimmt und die Leute warten müssen, bis die Vorhersage abgeschlossen ist, bevor sie mit ihren Aufgaben fortfahren können.
Für deterministische Zeitreihentechniken, insbesondere jene prämachine-learning Methoden, die bis in die 90er verwendet wurden, kann man sie fast in Echtzeit einsetzen, selbst wenn es Zyklen und dergleichen gibt. Sie sind super flott, und man kann schnell Ergebnisse mit Methoden wie ARIMA oder exponentieller Glättung erzielen – all diese Dinge können in Echtzeit durchgeführt werden, auch wenn Zyklen vorhanden sind. Aber wenn du etwas so richtig Ausgefallenes wählst, wie ein sehr tiefes Deep Learning Netzwerk, dann kann so etwas Stunden zum Training benötigen, und das verursacht für uns erhebliche Kosten. Außerdem dominiert aus unserer Sicht oft die Praktikabilität, und das ist ein großes Anliegen.
Conor Doherty: Pierre, eines der Dinge, die du tust, ist an der Imperial College London zu lehren, und du begegnest Studenten, die zu deiner Klasse kommen, um zum ersten Mal etwas über probabilistische Vorhersagen zu lernen. Bei Menschen, die bereits einen Hintergrund in Mathematik haben und im Grunde vom Konzept der Unsicherheitsakzeptanz überzeugt sind, was ist deiner Erfahrung nach die größte Herausforderung beim Erlernen dieser Fähigkeiten, denen du folgst?
Pierre Pinson: Beim Unterrichten von Vorhersagen habe ich das vor allem gemacht, als ich in Dänemark tätig war – mit starkem Fokus auf Energie. Ich denke, die Probleme sind immer dieselben. Eines der ersten Probleme ist das, was wir schon gehört haben: Es geht darum, es zu akzeptieren. Warum sollte ich überhaupt probabilistisch vorgehen? Normalerweise verbringe ich ziemlich viel Zeit damit, Probleme und Entscheidungsfindungsprobleme zu beschreiben und den Studenten zu zeigen, dass man nur bessere Entscheidungen treffen kann, wenn man probabilistisch agiert. Es ist sehr wichtig, dass ein Entwickler oder Nutzer einer Vorhersage – also ein Kunde auf beiden Seiten – versteht, dass man nur dann besser werden kann, wenn man probabilistisch vorgeht. Es wird etwas kosten, aber wenn du es annimmst, wird es besser laufen. Es braucht viel Arbeit, dich selbst zu überzeugen und zu erkennen, warum es besser wäre. Wenn du nicht verstehst, warum es besser wäre, wirst du möglicherweise Schwierigkeiten haben, es zu akzeptieren. Deshalb verbringen wir ziemlich viel Zeit damit.
Dann möchte ich, dass sie verstehen, dass es nicht schwierig ist, diese Prognosen zu erstellen. Du hast einige der klassischen Modelle erwähnt, aber man kann es auch in Bezug auf einfache Zufallsvariablen betrachten. Wenn du eine probabilistische Prognose für etwas machen möchtest, das gaußverteilt ist, dann, wenn wir die klassische Punktprognose durchführen, sagen wir einfach den Mittelwert voraus. Und jetzt, wo wir sagen, dass wir probabilistisch vorgehen wollen, müssen wir lediglich zusätzlich die Varianz vorhersagen, und dann haben wir eine vollständige probabilistische Prognose. Selbst wenn du nicht parametrisch vorgehen möchtest, wenn du Quantile vorhersagen willst, kannst du tatsächlich dieselben Modelle wie im deterministischen Fall verwenden, du änderst einfach die loss function in deinem Training, und voila, du hast eine quantile forecast. Ein wichtiger Aspekt ist, dass ich den Studierenden beibringe, dass es nicht wesentlich komplexer ist, diese zu erlernen und zu handhaben.
Der letzte Teil ist die Verifikation, denn wir haben bereits früher besprochen, dass manche Leute die Vorstellung haben, man könne es jetzt locker angehen, oder? Denn wenn man probabilistisch vorgeht, könnte man sagen, was auch immer, und mir später irgendwie mitteilen, dass man niemals falsch liegt. Aber es gibt einige sehr strenge Rahmenwerke, um probabilistische Prognosen zu verifizieren und tatsächlich zu zeigen, dass diese sinnvoll sind, dass deine Wahrscheinlichkeiten korrekt sind und dass du versuchst, Informationen zu konzentrieren, usw. Das sind die Hauptbausteine, die ich mit meinen Studierenden durchgehe, und meiner Erfahrung nach sind dies die Grundlagen, die man benötigt, wenn man später in seiner Arbeit mit probabilistischen Prognosen arbeiten muss.
Joannes Vermorel: Mein Problem ist amüsant, weil ihr wahrscheinlich den Vorteil habt, Studierende zu haben. Meine Interessenten haben in der Regel bereits eine Ausbildung in der Form erhalten, wie es Berater ihnen vermitteln. Lasst uns heute Gegner machen. Das Problem ist, dass es eine Art Anti-Befürwortung gibt, wie die Lean-Bewegung. Die Lean-Bewegung und die Idee, dass wir beispielsweise weniger verschwenden sollten. Ich meine, grundsätzlich ist es ja besser, Verschwendung zu vermeiden. Per Definition ist Verschwendung etwas Unerwünschtes, daher ist diese Aussage tautologisch. Niemand sagt, lasst uns Verschwendung um ihrer selbst willen erzeugen, aber das ist Teil der Lean Manufacturing Bewegung und der lean supply chain movement. Das Problem bei dieser Denkweise ist, dass man am Ende mit Dingen landet wie etwa, wenn du verschwenderische Prozesse wie lange Durchlaufzeiten hast, willst du sie eliminieren. Aber irgendwann kann es einen Prozess geben, der nicht unbedingt sehr verschwenderisch, aber dennoch sehr ineffizient ist, weil du versucht hast, deine Durchlaufzeiten so weit wie möglich zu verkürzen. Wenn du beispielsweise Dinge so schnell wie möglich transportieren möchtest, ist ein Flugzeug das Beste, aber die Effizienz von Flugzeugen in Bezug auf Treibstoff ist im Vergleich zu Zügen oder Frachtschiffen schrecklich. Wenn man also konsequent auf Nullvorrat, Nullverzug, Nullverschwendung setzt, wie es von bestimmten Bewegungen propagiert wird, ist das ein Versuch, die Unsicherheit vollständig zu eliminieren. Wenn du keine Durchlaufzeit hast, warum prognostizierst du dann überhaupt? Du musst dich nur um das kümmern, was direkt vor dir liegt. Wenn du keinen Vorrat hast, warum solltest du dann überhaupt das potenzielle Risiko von Überbeständen managen? Meine interessante Sichtweise ist also, dass ein Teil der Herausforderung darin besteht, dass Menschen, die in den frühen Jahren eines Kurses, der die Überlegenheit des probabilistischen Denkens demonstrierte, nicht profitiert haben, ein oder zwei, manchmal drei oder vier Jahrzehnte meinungsstarke Befürwortung von Beratern durchlaufen haben, um alle Arten von Unsicherheiten aus ihrer supply chain zu entfernen. Einige der Unsicherheiten, würde ich sagen, sind die zufälligen, bei denen Unsicherheiten einfach aufgrund eines miesen Prozesses entstehen – diese sollte man tatsächlich entfernen. Wenn beispielsweise Menschen nicht über die nötigen Fähigkeiten verfügen und manche einfach Müll produzieren, ist das nicht die Art von Unsicherheit, die man möchte. Aber es gibt andere Unsicherheiten, wie die Tatsache, dass Frachtschiffe aufgrund des Wetters vielleicht etwas langsamer sind, sodass sie nicht jedes Mal mit derselben Geschwindigkeit fahren. Es ist jedoch vollkommen akzeptabel, diese Unsicherheit zu tolerieren, wenn du die Werkzeuge hast, um damit auf sinnvolle Weise umzugehen.
Pierre Pinson: Du hast recht. Typischerweise rahmen wir dieses Thema als eine Frage der Kosten ein, denn irgendwie hat das Entfernen von Unsicherheiten seinen Preis. Wenn du über eine unendliche Menge Geld verfügst, das du bereit bist zu investieren, um alle Unsicherheiten zu entfernen, könntest du es tun. Aber jegliche Art von Unsicherheit – abgesehen von denen, die darauf zurückzuführen sind, dass du etwas falsch machst oder ineffizient handelst – jede grundlegendere Unsicherheit in deinem Prozess, die du entfernen möchtest, wird höchstwahrscheinlich teuer werden. Es ist also ein typisches Problem, bei dem du sagst: “Okay, großartig, du willst alle Unsicherheiten entfernen, als kämen sie umsonst. Wenn es kostenlos käme, hätten wir es auch getan.” Diese Kosten sind also etwas, das wir entscheiden müssen, ob wir sie tragen können. Wir ziehen eine Parallele, die in der Energie sehr interessant ist. Zum Beispiel arbeite ich viel mit erneuerbarer Energie. Wenn wir Speichersysteme entwickeln würden, um eine unendliche Menge Energie jederzeit und so lange wie gewünscht speichern zu können, wäre das Problem irgendwie gelöst. Manche Leute sagen, wir bräuchten nicht zu prognostizieren, wir müssten uns keine Sorgen machen. Aber die Entwicklung und der Einsatz von Batterien in solchem Maßstab