Liscio Esponenziale Probabilistico per l'IA Spiegabile nel dominio della Supply Chain
Uno degli ambiti di ricerca di Lokad consiste nel rivedere qualcosa di semplice (e fondamentale) cercando di renderlo un po’ migliore (e un po’ più semplice). Questo approccio tende ad essere l’esatto opposto della maggior parte degli articoli di ricerca, che risultano essere versioni più complesse di lavori precedenti. Così, di default, miriamo a una maggiore semplicità piuttosto che a una maggiore sofisticazione. Uno degli ingegneri di R&D di Lokad, Antonio Cifonelli, ha applicato questo approccio nella sua tesi di dottorato, affrontando il venerabile modello del liscio esponenziale per dotarlo di migliori attributi—ovvero, renderlo più spiegabile.

La spiegabilità, come qualità di un modello, è frequentemente fraintesa sia nella sua natura sia nel suo intento—almeno per quanto riguarda le supply chain. Avere un modello spiegabile non significa ottenere risultati che possano essere facilmente compresi o validati dalla mente umana. Questo sarebbe molto difettoso, dato che mezzo dozzina di operazioni in virgola mobile sono già sufficienti a confondere la maggior parte delle persone, anche coloro che si ritengono a proprio agio con i numeri. La mente umana semplicemente non è (naturalmente) abile quando si tratta di aritmetica di base; dopotutto, è stato il primo ambito a essere superato dalle macchine negli anni ‘50. Inoltre, la spiegabilità non ha lo scopo di rendere il modello affidabile—beh, non proprio. Esistono strumenti più affidabili (backtesting, cross-validation, etc.) per valutare se un modello debba essere considerato affidabile o meno. Essere in grado di narrare una storia sul modello e sui suoi risultati non dovrebbe essere considerato un motivo sufficiente per fidarsi.
Dal punto di vista di Lokad, lo scopo della spiegabilità è preservare la possibilità di operare la supply chain attraverso una variante del modello quando si è di fronte a un’interruzione che invalida il modello originale. Le disruptions nella supply chain sono varie: guerre, tariffe, lockdown, fallimenti, tempeste, contenziosi, etc. Quando si verifica un’interruzione, il modello predittivo diventa invalido in modi sottili ma significativi. Tuttavia, ciò non significa che tutti i pattern mai catturati dal modello cessino di essere rilevanti. Ad esempio, il profilo di seasonality del modello potrebbe rimanere del tutto inalterato.
Pertanto, un modello spiegabile dovrebbe offrire possibilità a un Supply Chain Scientist di modificare, aggiustare o distorcere il modello originale per ottenere una variante che rifletta adeguatamente l’interruzione. Naturalmente, si prevede che tali modifiche siano stime approssimative—di natura euristica—poiché dati precisi non sono ancora disponibili. Tuttavia, come recita il mantra adottato da Lokad, è meglio essere approssimativamente corretti che esattamente sbagliati.
Per ulteriori dettagli su come potrebbero essere i modelli spiegabili, dai un’occhiata al manoscritto di dottorato del Dr Cifonelli qui sotto.
Autore: Antonio Cifonelli
Data: Dicembre 2023
Abstract:
Il ruolo chiave che l’IA potrebbe svolgere nel migliorare le operazioni aziendali è noto da tempo (almeno dal 2017), ma il processo di penetrazione di questa nuova tecnologia ha incontrato alcuni ostacoli all’interno delle aziende, in particolare i costi di implementazione. Le aziende rimangono legate ai loro vecchi sistemi a causa dell’energia e del denaro richiesti per sostituirli. In media, ci vogliono 2.8 anni dalla selezione del fornitore al pieno dispiegamento di una nuova soluzione. Ci sono tre punti fondamentali da considerare quando si sviluppa un nuovo modello: il disallineamento delle aspettative, la necessità di comprensione e spiegazione, e le questioni relative a prestazioni e affidabilità. Nel caso di modelli che trattano dati della supply chain, ci sono inoltre cinque problematiche specifiche:
- Gestire l"incertezza. La precisione non è tutto. I decisori cercano un modo per minimizzare il rischio associato a ogni decisione che devono prendere in presenza di incertezza. Ottenere una previsione esatta è vantaggioso; ottenere una previsione abbastanza accurata e calcolarne i limiti è realistico e appropriato.
- Gestire dati interi e positivi. La maggior parte degli articoli venduti al dettaglio non può essere venduta in sottounità, ad esempio una lattina di alimenti, un pezzo di ricambio o una t-shirt. Questo semplice aspetto della vendita comporta un vincolo che deve essere rispettato dal risultato di qualsiasi metodo o modello: il risultato deve essere un intero positivo.
- Osservabilità. La domanda dei clienti non può essere misurata direttamente; solo le vendite possono essere registrate e utilizzate come proxy per la domanda.
- Scarsità e parsimonia. Le vendite sono una quantità discontinua: un prodotto può vendere bene una settimana e poi per niente quella successiva. Registrando le vendite giornalmente, un intero anno viene condensato in soli 365 (o 366) punti. Inoltre, una grande proporzione di questi sarà pari a zero.
- Ottimizzazione just-in-time. La previsione è una funzione chiave, ma è solo uno degli elementi in una catena di processi a supporto del decision-making. Il tempo è una risorsa preziosa che non può essere dedicata interamente a una singola funzione. Il processo decisionale e le relative modifiche devono quindi essere eseguiti entro un lasso di tempo limitato e in maniera sufficientemente flessibile da poter essere interrotti e riavviati, se necessario, per incorporare eventi inaspettati o aggiustamenti necessari.
Questa tesi si inserisce in questo contesto ed è il risultato del lavoro svolto al cuore di Lokad, un’azienda software con sede a Parigi che mira a colmare il divario tra tecnologia e la supply chain. La ricerca dottorale è stata finanziata da Lokad in collaborazione con l’ANRT nell’ambito di un contratto CIFRE. Il lavoro proposto mira a essere un buon compromesso tra le nuove tecnologie e le aspettative aziendali, affrontando i vari aspetti sopra presentati. Abbiamo iniziato a fare previsioni utilizzando metodi di base - la famiglia del liscio esponenziale - che sono facili da implementare ed estremamente veloci da eseguire. Poiché sono ampiamente utilizzati nell’industria, hanno già conquistato la fiducia degli utenti. Inoltre, sono facili da comprendere e spiegare a un pubblico non specializzato. Sfruttando tecniche di IA più avanzate, alcune delle limitazioni dei modelli utilizzati possono essere superate. Il cross-learning si è rivelato un approccio rilevante per estrapolare informazioni utili quando il numero di dati disponibili era molto limitato. Poiché la comune ipotesi gaussiana non è adatta ai dati di vendita discreti, abbiamo proposto l’utilizzo di un modello associato sia a una distribuzione di Poisson che a una distribuzione Binomiale Negativa, che corrisponde meglio alla natura dei fenomeni che cerchiamo di modellare e prevedere. Abbiamo inoltre proposto l’uso della simulazione per affrontare l’incertezza. Utilizzando simulazioni Monte Carlo, vengono generati, campionati e modellati vari scenari mediante una distribuzione. Da questa distribuzione, si possono dedurre intervalli di confidenza di dimensioni diverse e adattate. Utilizzando dati aziendali reali, abbiamo confrontato il nostro approccio con metodi all’avanguardia come il modello Deep Auto-Regressive (DeepAR), il modello Deep State Space (DeepSSMs) e il modello Neural Basis Expansion Analysis (N-Beats). Abbiamo dedotto un nuovo modello basato sul metodo Holt-Winter. Questi modelli sono stati implementati nel workflow di Lokad.
Giuria:
La difesa si è svolta davanti a una giuria composta da:
- M. Massih-Reza AMINI, Professore all’Université Grenoble, Alpes, Relatore.
- M.me Mireille BATTON-HUBERT, Professoressa all’École des Mines de Saint-Étienne, Relatrice.
- M.me Samia AINOUZ, Professoressa all’INSA Rouen, Normandie, Esaminatrice.
- M. Stéphane CANU, Professore all’INSA-Rouen, Normandie, Direttore della tesi.
- M.me Sylvie LE HÉGARAT-MASCLE, Professoressa a Paris-Saclay, Esaminatrice.
- M. Joannes VERMOREL, CEO di Lokad, Membro Invitato.