Mostrami i soldi: Riflessioni su ISF 2024
“Affinché migliori il tuo gioco, devi studiare il finale prima di tutto; poiché, mentre i finali possono essere studiati e padroneggiati autonomamente, il mediogioco e l’apertura devono essere studiati in relazione al finale.” Fonte: Le ultime lezioni di scacchi di Capablanca (1966), p. 23
A few weeks ago, I spoke on a panel at the 44th International Symposium on Forecasting in Dijon, France. The topic of the panel was Demand Planning and the Role of Judgement in the New World of AI/ML.
Come ambasciatore di Lokad, potete immaginare quale fosse il mio punto di vista:
-
le previsioni e la presa di decisioni dovrebbero essere completamente automatizzate;
-
la qualità delle previsioni dovrebbe essere valutata dalla prospettiva di decisioni migliori;
-
il giudizio umano dovrebbe essere usato per migliorare l’automazione (non per modificare le previsioni o le decisioni).

Stranamente, la mia posizione sull’automazione non ha suscitato tanto disaccordo quanto si potrebbe pensare. Il presidente (Responsabile della Comunicazione di Lokad, Conor Doherty) e gli altri partecipanti al panel (Sven Crone di iqast e Nicolas Vandeput di SupChains) erano quasi unanimemente d’accordo sul fatto che questo fosse il futuro delle previsioni. L’unico disaccordo riguardava quanto rapidamente potremmo raggiungere questo stato (nota: io credo che ci siamo già).
Ciò che ha causato non poco disaccordo, e forse anche confusione, è stato il mio argomento secondo cui l’accuratezza delle previsioni non è affatto importante quanto prendere decisioni migliori. Questo disaccordo non si è limitato agli altri partecipanti al panel, ma anche ai membri del pubblico. Penso che ci siano due ragioni principali a questo:
-
Quando ho parlato sul palco, non avevo a disposizione un supporto visivo per illustrare questo punto. Ci sono alcune componenti in movimento nella spiegazione, quindi un supporto visivo avrebbe sicuramente aiutato le persone a comprendere.
-
L’idea che l’accuratezza delle previsioni sia meno importante delle decisioni contraddice l’educazione, la formazione e l’esperienza della maggior parte dei professionisti.
Alla fine di questo saggio, spero di aver affrontato entrambi i punti sopra elencati. Per quanto riguarda il primo punto, ho incluso una spiegazione breve ma sistematica e un supporto visivo intuitivo. Per quanto riguarda il secondo punto, posso solo chiedere al lettore di mantenere una mente aperta per i prossimi 5-10 minuti, e di cercare di approcciare queste parole come se non avesse alcuna formazione pregressa nelle previsioni della supply chain.
Domande guida
Ci sono, a mio parere, cinque domande fondamentali a cui bisogna rispondere per chiarire la mia posizione. In questa sezione, farò del mio meglio per fornire risposte brevi (più o meno) a ciascuna - in sostanza il succo della questione. State tranquilli, Lokad dispone di una ricchezza di risorse aggiuntive per spiegare le tecnicalità, che collegherò alla fine del saggio.
Q1: Cosa significa che una previsione “aggiunge valore”?
Inizierò immediatamente con un esempio. Supponiamo che esista un meccanismo predefinito per prendere decisioni in un’azienda (ad esempio, previsione statistica automatizzata + politica di inventario automatizzata).
Affinché una previsione modificata aggiunga valore, essa deve modificare una decisione predefinita (generata usando il processo predefinito dell’azienda) in modo da influenzare in maniera diretta e positiva i ritorni finanziari dell’azienda (cioè, dollari, sterline o euro di profitto).
Se una previsione è più accurata (in termini di previsione della domanda effettiva) ma non porta a prendere una decisione diversa e migliore, allora non ha aggiunto valore.
Molte aziende usano ancora modelli di previsione basati su serie temporali, mentre Lokad preferisce previsioni probabilistiche per aiutare a generare decisioni bilanciate in base al rischio. Tuttavia, lo stesso criterio si applica a entrambi i paradigmi delle previsioni. Affinché un qualsiasi tipo di previsione aggiunga valore, essa deve modificare una decisione predefinita in modo da influenzare in maniera diretta e positiva i ritorni finanziari di un’azienda.
Ad esempio, una nuova decisione (“modificata”) potrebbe eliminare direttamente una futura rottura di stock che si sarebbe verificata con la decisione predefinita.
“Direttamente” è fondamentale qui. In termini molto semplici, la previsione aggiunge valore solo se è possibile identificare il preciso cambio di decisione che ha influenzato i ritorni finanziari aggiuntivi o ha evitato perdite finanziarie (rispetto alla decisione predefinita).
Pensate in termini di causalità, non di correlazione.
Q2: Una previsione più accurata aggiunge sempre valore?
Tecnicamente, no. Una previsione più accurata, di per sé, non aggiunge necessariamente “valore”. Questo perché, come detto in precedenza, affinché qualcosa (in questo caso una previsione) aggiunga valore deve influenzare in maniera diretta e positiva i ritorni finanziari di un’azienda attraverso una decisione migliore.
A differenza delle previsioni, le decisioni nella supply chain hanno vincoli di fattibilità (ad esempio, MOQs, moltiplicatori di lotto, dimensioni dei lotti, ecc.) e incentivi finanziari (ad esempio, sconti, termini di pagamento, ecc.). Possono esserci molte più previsioni rispetto alle decisioni fattibili.
Ciò significa che le decisioni nella supply chain possono occasionalmente essere (e molto spesso lo sono) insensibili alle variazioni nell’accuratezza delle previsioni. Questo vale sia per le previsioni basate su serie temporali che per quelle probabilistiche.
La ragione di questa insensibilità è dovuta ai vincoli nella presa di decisioni (ad esempio, MOQs). È perfettamente possibile che una previsione più accurata (ad esempio, del 10% in più di accuratezza) porti alla stessa decisione di una meno accurata. Il grafico qui sotto illustra questo concetto.

Nell’esempio sopra, supponiamo che la previsione di consenso di 55 unità fosse più accurata della previsione automatizzata di 50 unità. Da un punto di vista finanziario, l’aumentata accuratezza non ha portato a una decisione diversa (a causa della presenza di un MOQ). Pertanto, la previsione più accurata non ha aggiunto valore.
Infatti, c’è un forte argomento secondo cui la previsione di consenso più accurata ha portato a un valore aggiunto negativo. Questo perché i passaggi di revisione extra (secondo un processo standard di Forecast Value Added) costano denaro (tempo ed energie extra) all’azienda, senza però tradursi in una decisione migliore. Da un punto di vista puramente finanziario, questi passaggi di revisione manuale hanno comportato una perdita netta.
Consideriamo anche un caso in cui non vi sia alcun vincolo di MOQ.
Immaginate lo stesso scenario complessivo, ma con un moltiplicatore di lotto invece di un MOQ. Le decisioni fattibili sono incrementi di 50 unità (ad esempio, 50 unità in una scatola o su un pallet). In questa situazione, si dovrebbe acquistare o 50 o 100 unità (1 o 2 scatole o pallet).

In realtà, potrebbe essere meno redditizio acquistare 100 unità (coprendo il suggerimento della previsione di consenso di 55 unità) piuttosto che acquistare 50 unità (leggermente meno di quanto suggerito dalla previsione “più accurata”). Si potrebbe tentare di coprire la domanda residua con ordini arretrati o semplicemente perdere vendite (ad esempio, se si vendono beni deperibili come alimenti freschi).
Da un punto di vista economico, la decisione finanziaria migliore potrebbe non essere quella di seguire la previsione “più accurata”. In questo scenario, sia la previsione automatizzata (50 unità di domanda) che quella di consenso (55 unità di domanda) portano alla stessa decisione (ordinare 50 unità). Pertanto, la previsione “più accurata” non ha determinato un aumento del valore finanziario.
Certo, non tutte le situazioni sono altrettanto rigide per quanto riguarda i vincoli, tuttavia la supply chain è piena di tali scenari. Ovviamente, ammetto che previsioni differenti porteranno a decisioni diverse, ma la questione del valore rimane aperta. In ogni caso, dovremmo considerare se il ritorno aggiuntivo atteso dall’acquisto di unità extra sia maggiore delle risorse supplementari impiegate per migliorare l’accuratezza delle previsioni.
Forse l’accuratezza extra vale la pena in alcune situazioni. Tuttavia, i previsori e i professionisti della supply chain sembrano presumere riflessivamente che lo sia in termini assoluti, nonostante esistano chiari scenari in cui non lo è.

Se avete in mente uno scenario che non corrisponde perfettamente agli esempi descritti qui, va bene. Ricordate, l’obiettivo oggi è dimostrare un concetto generale (ovvero che esistono situazioni in cui l’accuratezza extra delle previsioni non vale la pena perseguirla), non analizzare in profondità ogni possibile scenario decisionale nella supply chain.
Q3: Come possiamo garantire che il valore ottenuto valga il costo dell’intervento giudiziale?
Un elemento chiave della discussione in panel a Digione è stato il valore (o la mancanza di valore) dell’intervento giudiziale (o “override umano”) nel processo di previsione. Per parafrasare l’altra parte, “dobbiamo avere persone nel processo per correggere quando la previsione automatizzata ha mancato qualcosa”.
Questa è una prospettiva per me molto interessante, poiché presume che l’override umano aggiunga valore - altrimenti, perché mai qualcuno dovrebbe farlo?
Per questa sezione, ignorerò la discussione sul fatto se gli esseri umani possano (occasionalmente o anche spesso) superare una previsione automatizzata (in termini di accuratezza). In effetti, sono disposto ad ammettere che, per ogni singolo SKU, un essere umano possa operare altrettanto bene, o addirittura meglio, rispetto a una previsione automatizzata in termini di accuratezza.
Nota: Non credo che ciò sia vero se si considera la previsione di decine di migliaia di SKUs per centinaia di negozi, ogni singolo giorno, in una grande supply chain1. In quest’ultimo scenario, una previsione automatizzata supera in modo significativo interi team di previsionisti e altri esperti funzionali incredibilmente abili, semplicemente perché la stragrande maggioranza degli SKU non può essere revisionata manualmente a causa dei vincoli di tempo.
Faccio questa concessione, ovvero che il giudizio umano possa talvolta essere pari o superiore alla previsione automatizzata, per due ragioni:
-
A mio parere, rende il saggio più interessante, e;
-
La forza del mio argomento non si fonda su alcuna discussione riguardante l’“accuratezza”.
La mia posizione è, come potete probabilmente intuire ormai, che gli override umani aggiungono valore solo se… aggiungono valore finanziario - un valore che dura più a lungo di un singolo ciclo di riordino. Questo è completamente indipendente da qualsiasi beneficio in termini di accuratezza.
Questo valore può essere inteso come “produce direttamente decisioni migliori rispetto a quelle inizialmente generate, calcolando i profitti extra derivanti dalla decisione migliore e sottraendo il costo dell’override”.
In parole povere, gli interventi giudiziali (override umani) sono costosi, quindi un’azienda dovrebbe cercare di ottenere un significativo ritorno sull’investimento. È per questo che sostengo che l’accuratezza delle previsioni è una metrica arbitraria (quando valutata in isolamento dalle decisioni), e le aziende dovrebbero concentrarsi su azioni che aumentano i ritorni finanziari.
L’override umano può molto bene aumentare l’accuratezza delle previsioni (ancora, faccio questa concessione per scopi di discussione), tuttavia non aumenta necessariamente il ritorno finanziario. Ciò non dovrebbe essere una proposta radicale, così come qualcuno può essere la persona più alta in una stanza e la più bassa in un’altra.
Si noti che non spetta a me fornire prove che un aumento dell’accuratezza non si traduca in profitti maggiori. È, per definizione, responsabilità di coloro che sostengono che un aumento dell’accuratezza sia di per sé redditizio fornire delle prove concrete, dirette e inconfutabili a supporto di tale affermazione.
Ancora, questa non dovrebbe essere una posizione radicale o contraria. Dovrebbe, a mio parere, essere la posizione predefinita di chiunque sia direttamente coinvolto.
Tenete presente che, affinché gli override umani siano redditizi, dobbiamo prendere in considerazione la totalità degli override. Vale a dire, ponderare il valore finanziario generato da tutti i “successi” e sottrarre tutte le perdite finanziarie causate dai “fallimenti”.
Questo esperimento dovrebbe essere condotto anche su larga scala, per un’enorme rete di negozi (clienti enterprise nel caso di B2B) e per l’intero catalogo di SKU, ogni giorno, per un periodo considerevole.
“Quanto dovrebbe durare questo esperimento, Alexey?” A riguardo, sono ambivalente. Diciamo un anno, ma sono molto aperto a discuterne. Dipende da molte cose, compreso il numero di cicli decisionali in un anno, nonché dai lead time, naturalmente.
Detto questo, l’intera discussione solleva la questione di quale sia la soglia accettabile di errore per l’override umano.
- Se i successi superano leggermente i fallimenti, è accettabile?
- Che dire del costo degli override umani stessi?
- Come possiamo includere questi costi diretti e indiretti nel calcolo?
Queste, tra l’altro, non sono domande banali. Sono il tipo di domande che un matricola porrebbe in un corso introduttivo in un campo STEM (o affine a STEM).
Fino a quando qualcuno non fornirà prova definitiva che l’override umano, applicato su larga scala, sia finanziariamente conveniente, la posizione economicamente più intelligente è presumere che non lo sia e continuare a fare affidamento sulle previsioni automatizzate e sulla presa di decisioni automatizzata.
Q4: Come determiniamo quando una previsione più accurata debba sostituire quella attuale ai fini decisionali?
In breve, il modo più semplice per capirlo è considerare la seguente domanda: la nuova previsione porta a decisioni migliori? La metrica di valutazione in questo caso dovrebbe essere il ritorno finanziario sull’investimento (ROI).
Per entrare un po’ più nel dettaglio, la sostituzione dovrebbe essere effettuata basandosi sull’utilità comparativa complessiva del nuovo modello (ad es., ROI, applicabilità, manutenibilità, ecc.), non solo sul guadagno attuale in termini di accuratezza. Il ROI è ciò che orienta l’azienda verso il successo. L’applicabilità, come dimostrerò di seguito, è progettata tenendo d’occhio il ROI. Ricorda: l’accuratezza è, se perseguita isolatamente, un KPI arbitrario.
Ad esempio, immagina di avere due modelli: uno che può gestire esplicitamente la cronologia degli stock-out e un altro che ignora gli stock-out (utilizzando alcuni trucchi di pre-elaborazione dei dati). Potrebbe darsi che gli stock-out non si verifichino molto frequentemente, e da un punto di vista decisionale entrambi i modelli performino quasi allo stesso modo. Tuttavia, sarebbe comunque più prudente preferire il modello capace di gestire gli stock-out. Questo perché, se gli stock-out dovessero verificarsi con maggiore frequenza, tale modello risulterebbe più affidabile.
Questo dimostra un altro aspetto della filosofia di Lokad: correctness by design. Ciò significa che, a livello di progettazione, miriamo a realizzare un modello che consideri in maniera proattiva - ed sia in grado di rispondere a - sia agli eventi probabili che a quelli improbabili. Questo è di fondamentale importanza, perché le maggiori penalità finanziarie spesso risiedono agli estremi - in altre parole, agli eventi improbabili.
Q5: Come si effettua la transizione da un modello di previsione a un altro in produzione?
È importante ricordare che la previsione è solo una parte dell’intero motore decisionale. Di conseguenza, aggiornare alcune componenti potrebbe avere impatti minori o maggiori sulle prestazioni complessive del motore. Il passaggio da un vecchio modello a uno nuovo potrebbe risultare problematico, anche se, in ultima analisi, il nuovo modello produrrà decisioni migliori (e quindi genererà maggiori profitti).
Questo perché le decisioni migliorate in teoria potrebbero incontrare vincoli senza precedenti nella realtà se implementate troppo rapidamente.
Ad esempio, un nuovo modello di previsione potrebbe aiutare a generare ordini di acquisto notevolmente migliorati, ma lo spazio necessario per immagazzinare l’inventario aggiuntivo potrebbe non essere ancora disponibile oppure i fornitori non potrebbero adeguare immediatamente le loro supply chain per soddisfare l’aumento della domanda. Affrettarsi a completare gli ordini ora, in cerca di profitti immediati, potrebbe comportare perdite altrove, come ad esempio il danneggiamento delle scorte o il loro rapido deterioramento a causa della mancanza di uno spazio warehouse adeguato (o dei limiti della capacità lavorativa).
In uno scenario simile, potrebbe essere saggio effettuare una transizione graduale tra i modelli. In pratica, ciò potrebbe comportare l’emissione di alcuni ordini di acquisto consecutivi, leggermente più grandi, per correggere gradualmente le posizioni delle scorte, anziché procedere immediatamente con un singolo ordine enorme.
Le persone con esperienza pratica nell’affrontare il bullwhip effect (inclusi i sostenitori del DDMRP) dovrebbero comprendere immediatamente perché questa sia una tattica saggia.
Riflessione finale
Se hai letto fino a qui, apprezzo la tua attenzione. Se ti sei trovato in disaccordo lungo il percorso, apprezzo ancora di più la tua attenzione.
Per coloro che non sono d’accordo, permettetemi un ultimo intervento: il valore significa più denaro, e più denaro deriva da decisioni migliori. Per quanto mi riguarda, nulla può sostituire decisioni buone (o migliori). Né una previsione più accurata. Né un processo S&OP più efficiente.
Se continuiamo a non essere d’accordo, va bene, ma almeno sappiamo dove ciascuno di noi si posiziona.
Grazie per aver letto.
Prima di andartene
Ecco alcune risorse in più che potrebbero esserti utili (soprattutto se non sei d’accordo con me):
-
Per quanto riguarda come Lokad prevede effettivamente tutte le fonti di incertezza (ad es., domanda, tempi di consegna, tassi di reso, ecc.), guarda le nostre video lezioni su previsioni probabilistiche e previsione dei tempi di consegna.
-
Per quanto riguarda come Lokad effettua decisioni ponderate in base al rischio, consulta il nostro tutorial educativo su ottimizzazione degli acquisti e la video lezione su allocazione delle scorte al dettaglio.
-
Per quanto riguarda come Lokad progetta la domanda e ottimizza le strategie di pricing, guarda la nostra video lezione su ottimizzazione del pricing.
Note
-
Le più grandi supply chains contano numeri ancora maggiori – decine di migliaia di negozi in oltre un centinaio di paesi, con diverse centinaia di centri di distribuzione. I cataloghi di tali giganti contengono spesso centinaia di migliaia (se non milioni) di prodotti differenti. ↩︎