Uno dei luoghi di ricerca di Lokad consiste nel rivedere qualcosa di semplice (e fondamentale) e cercare di migliorarlo un po’ (e renderlo un po’ più semplice). Questo approccio tende ad essere l’opposto esatto della maggior parte degli articoli di ricerca, che tendono ad essere versioni più complesse di qualche lavoro precedente. Pertanto, per impostazione predefinita, cerchiamo una maggiore semplicità piuttosto che una maggiore sofisticazione. Uno degli ingegneri di R&S di Lokad, Antonio Cifonelli, ha applicato questo approccio nella sua tesi di dottorato, affrontando il venerabile modello di exponential smoothing per conferirgli migliori attributi, ovvero renderlo più esplicabile.

Due figure da una tesi di dottorato su Probabilistic Exponential Smoothing per l'AI Esplicabile nel dominio della Supply Chain.

L’esplicabilità, come qualità di un modello, è spesso fraintesa sia nella sua natura che nella sua intenzione, almeno per quanto riguarda le supply chain. Avere un modello esplicabile non significa ottenere risultati che possono essere facilmente compresi o convalidati dalla mente umana. Questo sarebbe molto sbagliato, dato che mezza dozzina di operazioni in virgola mobile sono già sufficienti a confondere la maggior parte delle persone, comprese quelle che si considerano a proprio agio con i numeri. La mente umana non è semplicemente (naturalmente) abile quando si tratta di aritmetica di base; è stata, dopotutto, il primo dominio ad essere superato dalle macchine negli anni ‘50. Inoltre, l’esplicabilità non è intesa a rendere il modello affidabile, almeno non del tutto. Ci sono strumenti più affidabili (backtesting, cross-validation, ecc.) per valutare se un modello debba essere fidato o meno. Essere in grado di creare una narrazione sul modello e sui suoi risultati non dovrebbe essere considerato un motivo sufficiente per la fiducia.

Dal punto di vista di Lokad, lo scopo dell’esplicabilità è preservare la possibilità di gestire la supply chain attraverso una variante del modello quando si è di fronte a una perturbazione che invalida il modello originale. Le perturbazioni nella supply chain sono varie: guerre, tariffe, lockdown, fallimenti, tempeste, controversie legali, ecc. Quando si verifica una perturbazione, il modello predittivo diventa invalido in modi sottili ma importanti. Tuttavia, ciò non significa che tutti i modelli catturati dal modello cessino di essere rilevanti. Ad esempio, il profilo di stagionalità del modello può rimanere completamente invariato.

Pertanto, un modello esplicabile dovrebbe fornire modi a uno Scienziato della Supply Chain per modificare, regolare o distorcere il modello originale al fine di ottenere una variante che rifletta adeguatamente la perturbazione. Naturalmente, si prevede che questi cambiamenti siano stime approssimative, di natura euristica, poiché i dati precisi non sono ancora disponibili. Tuttavia, come recita il mantra adottato da Lokad, è meglio essere approssimativamente corretti che esattamente sbagliati.

Per ulteriori dettagli su come potrebbero apparire i modelli esplicabili, consulta il manoscritto di dottorato del Dr. Cifonelli di seguito.

Autore: Antonio Cifonelli

Data: dicembre 2023

Abstract:

È noto da molto tempo (almeno dal 2017) il ruolo chiave che l’AI potrebbe svolgere nel migliorare le operazioni aziendali, ma il processo di penetrazione di questa nuova tecnologia ha incontrato determinati ostacoli all’interno delle aziende, in particolare i costi di implementazione. Le aziende rimangono legate ai loro vecchi sistemi a causa dell’energia e del denaro necessari per sostituirli. In media, ci vogliono 2,8 anni dalla selezione del fornitore alla piena implementazione di una nuova soluzione. Ci sono tre punti fondamentali da considerare nello sviluppo di un nuovo modello. Disallineamento delle aspettative, necessità di comprensione e spiegazione, e problemi di prestazioni e affidabilità. Nel caso di modelli che trattano dati di supply chain, ci sono anche cinque problemi specifici aggiuntivi:

  • Gestione dell’incertezza. La precisione non è tutto. I decisori cercano un modo per minimizzare il rischio associato a ogni decisione che devono prendere in presenza di incertezza. Ottenere una previsione esatta è vantaggioso; ottenere una previsione abbastanza accurata e calcolare i suoi limiti è realistico e appropriato.
  • Gestione dei dati interi e positivi. La maggior parte degli articoli venduti al dettaglio non può essere venduta in sottounità, ad esempio una lattina di cibo, un pezzo di ricambio o una maglietta. Questo semplice aspetto della vendita comporta un vincolo che deve essere soddisfatto dal risultato di qualsiasi metodo o modello: il risultato deve essere un numero intero positivo.
  • Osservabilità. La domanda dei clienti non può essere misurata direttamente, solo le vendite possono essere registrate e utilizzate come proxy per la domanda.
  • Scarsità e parsimonia. Le vendite sono una quantità discontinua: un prodotto può vendere bene una settimana, poi non vendere affatto la settimana successiva. Registrando le vendite per giorno, un intero anno viene condensato in soli 365 (o 366) punti. Inoltre, una grande proporzione di essi sarà zero.
  • Ottimizzazione just-in-time. La previsione è una funzione chiave, ma è solo un elemento in una catena di processi che supportano la presa di decisioni. Il tempo è una risorsa preziosa che non può essere dedicata interamente a una singola funzione. Il processo decisionale e le relative adattamenti devono quindi essere effettuati entro un limite di tempo limitato e in modo sufficientemente flessibile da poter essere interrotti e riavviati se necessario per incorporare eventi imprevisti o aggiustamenti necessari.

Questa tesi si inserisce in questo contesto ed è il risultato del lavoro svolto presso Lokad, un’azienda software con sede a Parigi che mira a colmare il divario tra tecnologia e supply chain. La ricerca dottorale è stata finanziata da Lokad in collaborazione con l’ANRT nell’ambito di un contratto CIFRE. Il lavoro proposto mira a essere un buon compromesso tra nuove tecnologie e aspettative aziendali, affrontando i vari aspetti presentati sopra. Abbiamo iniziato a fare previsioni utilizzando metodi di base - la famiglia di smoothing esponenziale - che sono facili da implementare e estremamente veloci da eseguire. Poiché sono ampiamente utilizzati nell’industria, hanno già conquistato la fiducia degli utenti. Inoltre, sono facili da capire e spiegare a un pubblico non specializzato. Sfruttando tecniche di intelligenza artificiale più avanzate, è possibile superare alcune limitazioni dei modelli utilizzati. L’apprendimento incrociato si è rivelato un approccio rilevante per estrapolare informazioni utili quando il numero di dati disponibili era molto limitato. Poiché l’assunzione gaussiana comune non è adatta per i dati di vendita discreti, abbiamo proposto di utilizzare un modello associato a una distribuzione di Poisson o a una distribuzione binomiale negativa, che corrisponde meglio alla natura dei fenomeni che stiamo cercando di modellare e prevedere. Abbiamo anche proposto di utilizzare la simulazione per gestire l’incertezza. Utilizzando simulazioni Monte Carlo, vengono generati, campionati e modellati diversi scenari utilizzando una distribuzione. Da questa distribuzione, è possibile dedurre intervalli di confidenza di dimensioni diverse e adattate. Utilizzando dati aziendali reali, abbiamo confrontato il nostro approccio con metodi all’avanguardia come il modello Deep Auto-Regressive (DeepAR), il modello Deep State Space (DeepSSMs) e il modello Neural Basis Expansion Analysis (N-Beats). Abbiamo dedotto un nuovo modello basato sul metodo di Holt-Winter. Questi modelli sono stati implementati nel flusso di lavoro di Lokad.

Commissione:

La difesa si è svolta di fronte a una commissione composta da:

  • M. Massih-Reza AMINI, Professore presso l’Université Grenoble, Alpes, Rapporteur.
  • M.me Mireille BATTON-HUBERT, Professore presso l’École des Mines de Saint-Étienne, Rapporteur.
  • M.me Samia AINOUZ, Professore presso l’INSA Rouen, Normandie, Esaminatore.
  • M. Stéphane CANU, Professore presso l’INSA-Rouen, Normandie, Direttore di tesi.
  • M.me Sylvie LE HÉGARAT-MASCLE, Professore presso Paris-Saclay, Esaminatore.
  • M. Joannes VERMOREL, CEO di Lokad, Membro invitato.

Scarica la tesi (PDF)