Trascrizione della presentazione di Joannes Vermorel tenuta all’Ecole polytechnique di Palaiseau (Francia) venerdì 3 giugno per il simposio Intelligenza artificiale, digitale e cambiamento climatico. Il simposio è stato organizzato da Sylvain Le Corff, professore al Telecom Sud Paris, e Eric Moulines, professore all’Ecole polytechnique e membro eletto dell’Académie des sciences.

Prevedere il cambiamento climatico come un pianificatore della supply chain

La mia competenza si basa sulla scienza della supply chain e sull’analisi predittiva della supply chain. La supply chain è, in parole povere, la colla tra produzione e consumo: è necessario acquisire, trasportare, trasformare e distribuire materiali. Di questo si tratta la supply chain. Confesso subito che la scienza della supply chain difficilmente sarà il futuro della climatologia.

Tuttavia, le moderne supply chain stanno già sfruttando tecniche di previsione automatizzate su larga scala. Questo è esattamente ciò che la mia azienda, Lokad, fa da oltre un decennio.

Durante questo decennio, ho imparato una serie di lezioni fondamentali per quanto riguarda l’uso delle tecniche di previsione, tipicamente algoritmi di machine learning, in contesti reali. La lezione più importante è che è meglio essere approssimativamente corretti piuttosto che esattamente sbagliati. Eppure, quando guardo intorno a me, vedo un sacco di sforzi di data science profondamente fuorvianti.

L’aspetto più insidioso di “crunching the data” è che gli algoritmi - o la tecnologia - possono dare un’illusione di razionalità, un’illusione di scienza. Eppure, troppo spesso, quegli sforzi di analisi dati fuorvianti portano a conclusioni che non sono migliori dell’astrologia. Nessun algoritmo ti salverà mai se affronti un problema nel modo sbagliato.

Per capire come la modellazione predittiva per la supply chain possa darci lezioni preziose per la previsione del cambiamento climatico, permettetemi di sottolineare che il clima e i mercati globali hanno molto in comune. In entrambi i casi, il nostro stile di vita è in gioco. In entrambi i casi, abbiamo sistemi complessi che non sono pienamente compresi. In entrambi i casi, ogni partecipante ha un impatto sul sistema, ma è un impatto piccolo. In aggregato, una serie di piccoli impatti può portare a un grande impatto. Eppure, i partecipanti hanno incentivi propri e, come tali, nulla è mai semplice.

Pertanto, valuterò, in stile supply chain, l’evoluzione del clima dalla prospettiva metropolitana francese, proprio come un’azienda utilizza le proprie quote di mercato per valutare il mercato.

Le supply chain mi hanno insegnato che il costo si trova sempre negli estremi. Piccoli eccessi di produzione e piccole mancanze sono di solito facili da risolvere; sono quelli grandi che segnano la rovina delle aziende. Pertanto, quando si prevede il cambiamento climatico, come pianificatore della supply chain, non mi interessano le piccole variazioni. La Francia ha un clima mite; e ricordate che qui adotto una prospettiva centrata sulla Francia.

La Francia avrebbe pochi o nessun problema ad adattarsi a temperature medie due gradi più alte o più basse. Allo stesso modo, potremmo avere il 10% di vento in più o in meno, o il 10% di pioggia in più o in meno, farebbe quasi nessuna differenza. Preciso subito che non sto dicendo che non ci sarebbe alcun impatto. Sto solo sottolineando che altri paesi - come la Danimarca o l’Italia - non hanno problemi a lungo termine legati a climi più freddi o più caldi - pur mantenendo uno stile di vita che, per tutti gli effetti, è quasi identico a quello che godiamo in Francia. Con il cambiamento climatico, si verificherebbero adattamenti in una serie di settori che vanno dalla scelta delle colture per l’agricoltura allo spessore degli strati di isolamento termico negli edifici. Tuttavia, queste evoluzioni sono modeste rispetto ad altre fonti di cambiamento che interessano la Francia.

Pertanto, come pianificatore della supply chain, sono gli estremi climatici che catturano il mio interesse. Per valutare cosa possiamo aspettarci, dobbiamo guardare agli estremi storici. Infatti, gli estremi futuri dovrebbero sempre essere stimati come più grandi degli estremi passati. Questo è vero per i mercati e molto probabilmente vero per il clima. Quindi, diamo un’occhiata a ciò che la storia della Francia ci dice.

Estate 16361, è l’anno in cui Corneille scrisse Le Cid, ma anche l’anno di un’estate terribilmente calda. Le temperature salirono a 39°C a Parigi per settimane. In una sola estate ci furono 500.000 morti, per lo più bambini e neonati. La causa principale della morte era l’acqua contaminata e malattie come la dissenteria. Il numero di morti, in rapporto alla popolazione francese dell’epoca, è paragonabile a quello della Prima Guerra Mondiale, che durò poco più di 4 anni.

Pertanto, una temperatura sostenuta di 39°C per tutta l’estate, per tutta la Francia, dovrebbe essere il punto di riferimento di ciò per cui dovremmo essere pronti. Non c’è quasi alcun modello climatico coinvolto in questa proposta: è una lettura diretta della recente storia climatica francese. Se è successo 4 secoli fa, la mia proposta è semplicemente che potrebbe accadere di nuovo la prossima estate.

Naturalmente, negli ultimi 2 secoli, la scienza medica e l’igiene hanno praticamente eliminato la dissenteria in Francia. Tuttavia, significa che possiamo affrontare estati calde senza problemi? Se giudichiamo dagli eventi recenti dell’estate 2003 in Francia, le estati calde presentano ancora seri rischi. L’ondata di calore del 2003 è durata appena 2 settimane, raggiungendo i 39°C a Parigi, e ha causato 15.000 morti in Francia2, principalmente tra le persone anziane. Tuttavia, negli anni successivi, la percentuale di apparecchiature per l’aria condizionata nelle case in Francia è passata dal 4% nel 20053 al 25% nel 20204.

Qui, stiamo toccando un aspetto critico delle previsioni sugli affari umani: le persone osservano e si adattano. Questo non influisce sempre negativamente sull’accuratezza delle previsioni - anche se spesso lo fa - ma l’ingegno umano contribuisce quasi sempre a rendere le previsioni a lungo termine irrilevanti. Infatti, tenete presente che una previsione, qualsiasi previsione, è prima di tutto una scelta del modello. Il modello definisce il campo di battaglia: cosa verrà previsto. Una previsione può essere molto accurata eppure completamente irrilevante. Questo è un pericolo che ogni azienda che gestisce una supply chain deve affrontare: i mercati stanno cambiando nella loro natura, non solo crescendo o diminuendo.

Tornando ai nostri estremi climatici, diamo ora uno sguardo al grande inverno del 1709. Durante il mese di gennaio 17095, le temperature scesero a -20°C a Parigi; questo è come un inverno freddo a Quebec City. Il fiume Senna è ghiacciato come gli altri grandi fiumi della Francia. In 11 giorni, la Francia perde 100.000 persone a causa dell’ondata di freddo. In totale, l’inverno fa 600.000 vittime, per lo più famiglie povere. Anche in questo caso, queste perdite sono paragonabili all’impatto completo della Prima Guerra Mondiale in Francia, tranne che, ancora una volta, il disastro avviene in poche settimane, invece di anni. Questo inverno faceva parte di un periodo noto come la Piccola Era Glaciale in Europa, che durò dalla metà del XIII secolo alla metà del XIX secolo.

Mentre il fatto che il fiume Senna sia ghiacciato solidamente a Parigi potrebbe sorprendere questo pubblico, è interessante notare che la latitudine nord di Parigi è 49° mentre la latitudine di Quebec City è solo 47°. Quindi, geograficamente, Parigi è più a nord di Quebec City.

In ogni caso, nei secoli passati, il fiume Senna si è ghiacciato molte volte. È una questione di storia, senza coinvolgere alcun modello climatico. Se un inverno del genere è accaduto 3 secoli fa, la mia proposta rimane che potrebbe accadere di nuovo il prossimo inverno.

Pertanto, consideriamo il tipo di problemi che sorgerebbero in Francia se dovessimo subire un inverno canadese come quello accaduto in passato.

Il primo problema a cui posso pensare è: l’acqua. In Francia, le tubature dell’acqua sono tipicamente sepolte a 80 cm di profondità, ma a Quebec City sono a 130 cm e per buoni motivi. A 80 cm, le tubature si congelano e si rompono a Quebec. Pertanto, una grande ondata di freddo, in Francia, distruggerebbe molto probabilmente una parte considerevole della nostra infrastruttura di distribuzione dell’acqua.

Inoltre, il trasporto sarebbe gravemente colpito. I camion canadesi utilizzano riscaldatori a blocco perché il diesel si congela a -10°C. Non ho statistiche sulla diffusione dei riscaldatori a blocco sui camion in Francia, ma il tasso di attrezzatura sembra essere molto limitato. Considerando che più del 98% dei veicoli professionali funzionano a diesel, è ragionevole supporre che quasi tutti questi veicoli diventerebbero inutilizzabili durante una grande ondata di freddo.

Infine, è probabile che la rete elettrica subisca gravi black-out. Nel 20126, che è stato un inverno freddo, la Francia importava fino al 9% della sua elettricità dalla Germania. La parte di energia che può essere spenta a volontà, principalmente con grandi aziende industriali, produce solo una riduzione energetica del 1%. Un brown-out controllato produce approssimativamente un’ulteriore riduzione energetica del 3%. Oltre questo punto, l’unica opzione rimasta per la rete elettrica è quella di interrompere porzioni della rete.

Questi problemi non sono teorici. Si scopre che quando ho discusso del caso degli inverni rigidi con mio padre, quei problemi sono esattamente ciò che è accaduto a Saint Etienne nel 1956.

Il 1956 è stato l’inverno più freddo del XX secolo in Francia. A Saint Etienne, la rete elettrica collassò. Le tubature dell’acqua si ruppero. I veicoli smisero di funzionare. Nel sud, persino il porto di Marsiglia si congelò solidamente.

Le famiglie rimasero senza acqua, cibo o riscaldamento per giorni. Un’ispezione sommaria delle statistiche di mortalità INSEE per febbraio 19567 indica circa 15000 morti in eccesso rispetto agli anni precedenti.

Questo rigido inverno del 1956 è accaduto in una società post-bellica che aveva ancora poca dipendenza dagli elettrodomestici elettrici. Inoltre, questa società utilizzava ancora ampiamente il riscaldamento a legna, che non dipende dalla rete elettrica. Non ho dubbi che lo stesso inverno in Europa oggi avrebbe conseguenze molto più gravi.

Tornando alla nostra discussione sulla previsione del clima, è chiaro, a questo punto, che non sono le temperature future a contare veramente, ma le conseguenze di quelle temperature. Lo stesso si potrebbe dire per tutte le altre variabili climatiche: vento, pioggia, ecc.

Se il primo errore di previsione “data science” è concentrarsi sulle medie anziché sulle estreme; allora, il secondo errore di previsione è confondere artefatti numerici con conseguenze reali nel mondo reale. Nella supply chain, questa intuizione è riassunta come le percentuali di errore di previsione sono irrilevanti, contano solo gli errori in dollari.

Infatti, le previsioni sono artefatti numerici che sono progettati per supportare le decisioni. La qualità di queste previsioni dipende molto dalla loro adeguatezza per raggiungere decisioni migliori.

Valutare la qualità delle previsioni basandosi solo su indicatori statistici arbitrari indicators come l’errore medio assoluto (MAE), l’errore quadratico medio (MSE) o l’errore percentuale medio assoluto (MAPE), che sono completamente sconnessi dalle conseguenze reali nel mondo reale, è probabilmente uno degli errori più comuni che osservo tra i miei colleghi data scientist.

Personalmente, chiamo queste previsioni previsioni nude. Le previsioni nude sono l’opposto delle profezie mitiche. Queste previsioni ricevono molta più attenzione di quanto dovrebbero e quando le persone prestano attenzione a queste previsioni, peggiorano solo la situazione.

Per capire perché le previsioni nude sono sbagliate, bisogna capire che, nella supply chain - e sospetto anche nel clima - è facile generare previsioni che sono contemporaneamente estremamente accurate e estremamente stupide.

Infatti, consideriamo un minimarket con rifornimenti giornalieri. Per quasi tutti i prodotti del minimarket, la previsione di vendite giornaliere più accurata è zero unità. Infatti, la maggior parte dei prodotti, in un minimarket, non viene venduta nemmeno una volta al giorno in media. Quindi, una previsione di vendite pari a zero è di solito la previsione giornaliera più accurata considerando l’errore medio assoluto.

Quindi, se una previsione di vendite pari a zero viene presa come input, il negozio non rifornirà nulla. Infatti, zero vendite previste significa zero unità da rifornire. Presto, tutti gli scaffali del minimarket sono vuoti e quindi, abbiamo effettivamente zero vendite, rendendo questo modello di previsione di vendite pari a zero accurato al 100%. Nel frattempo, il minimarket fallisce.

Questa situazione si verifica nella vita reale (con soluzioni software aziendali che competono con Lokad). Si chiama un problema di blocco dell’inventario. Per risolverlo, il modello deve prevedere la domanda invece di prevedere le vendite; tuttavia, ciò è difficile perché le vendite sono osservate mentre la domanda non lo è.

Più in generale, le metriche di previsione statistica danno l’illusione della scienza: Ho progettato un modello di previsione che è più accurato dell'1% more accurate, quindi, il mio modello è provabilmente migliore_. Tuttavia, questo di solito non è il caso e non sto nemmeno parlando di overfitting. Il problema che sto evidenziando è che inseguire una metrica statistica rende inevitabilmente il modello peggiore. Il modello di previsione diventa esattamente sbagliato mentre prima era approssimativamente corretto.

Non sono un esperto di clima, ma dal mio punto di vista sulla supply chain, nei media - la stampa ma anche i social network - vedo un’abbondanza di previsioni climatiche nude: previsioni che non sono collegate a nessun processo pratico di decision-making. Non metto in discussione l’accuratezza di queste previsioni; questo è un dibattito per i climatologi. Tuttavia, la mia esperienza nella supply chain mi dice che cercare di inferire qualsiasi tipo di decisione nel mondo reale basandosi su queste previsioni nude è una ricetta per conseguenze non volute, sprecando tipicamente tonnellate di risorse nel processo e raggiungendo frequentemente l’opposto di ciò che era l’intento originale.

Una buona previsione inizia con un problema da affrontare. Una volta che il problema è adeguatamente caratterizzato, procediamo all’indietro identificando i dati e le ricette numeriche che sono adatte a supportare qualsiasi decisione sia in gioco.

Al contrario, una cattiva previsione inizia con un dataset che si trova per caso a disposizione e con un data scientist che è desideroso di testare l’ultimo paper di machine learning su questo stesso dataset, possibilmente un paper scritto dallo stesso data scientist.

Pertanto, la mia conclusione, che si applica sia alla supply chain che al clima, è che se vuoi distinguere le buone previsioni dalle cattive previsioni, inizia immediatamente a respingere le previsioni nude. Non viene mai nulla di buono da queste previsioni. Quindi, assicurati che le previsioni siano approssimativamente corrette, invece di essere esattamente sbagliate. E infine, cerca la vicinanza di queste previsioni alle decisioni nel mondo reale. Se le persone che fanno le previsioni non devono subire le conseguenze di quelle previsioni, allora la tua posizione predefinita dovrebbe essere di profondo scetticismo.


  1. Pagina 351, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  2. RAPPORTO FATTO A NOME DELLA COMMISSIONE D’INCHIESTA SULLE CONSEGUENZE SANITARIE E SOCIALI DELLA CANICOLA, Relatore M. François d’AUBERT, N° 1455 - volume 1, 24 febbraio 2005. ↩︎

  3. Il mercato dell’aria condizionata si raffredda, Valérie Leboucq, Les Echos, 7 ottobre 2005. ↩︎

  4. LA CLIMATIZZAZIONE: VERSO UN UTILIZZO RAGIONATO PER LIMITARE L’IMPATTO SULL’AMBIENTE, ADEME presse, 30 giugno 2021 ↩︎

  5. Pagina 517, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  6. La ondata di freddo di febbraio 2012, RTE ↩︎

  7. Démographie - Numero di decessi - Francia metropolitana, Identificativo 000436394, INSEE ↩︎