Sulla analisi decisionale sequenziale.

novembre 10, 2025

supply chain science

Joannes Vermorel

Io ammiro l’ambizione di Warren Powell di unificare l’immensa famiglia di “decisioni nel tempo.” Il suo Sequential Decision Analytics (SDA) delinea una tenda generosa: dal controllo all’apprendimento per rinforzo, dal trasporto all’energia e all’e‑commerce, il messaggio è che le decisioni sequenziali condividono una struttura comune e dovrebbero essere risolte ottimizzando sulle politiche. All’interno di tale struttura si trovano quattro ampie modalità di prendere decisioni — approssimazioni miopi o a funzione di costo, approssimazioni della funzione di valore, previsione diretta e approssimazioni della funzione politica — ciascuna un percorso attraverso l’intrattabilità dei problemi dinamici. È un inquadramento potente, e ha influenzato molti campi contemporaneamente.¹

due uomini giocano a scacchi sulla spiaggia

Il mio lavoro parte da un punto di vista diverso. In Introduction to Supply Chain sostengo che la supply chain non sia un ramo della matematica o del software per se; è un ramo applicato dell’economia. L’attività quotidiana consiste nel trasformare l’opzionalità in presenza di variabilità in denaro, con il profitto — correttamente corretto per il rischio — come metro di misura. Questo approccio governa il modo in cui modelliamo, misuriamo e, in ultima analisi, automatizziamo. Se l’obiettivo è rappresentato da “monete su un registro”, ogni concetto rilevante — scarsità, compromessi, costo opportunità — deve essere prezzato prima di essere ottimizzato. Vedi Capitolo 3 (“Epistemology”) e Capitolo 4 (“Economics”).²

Dove SDA e io ci incontriamo

SDA ha ragione nel trattare il futuro come una sequenza di osservazioni e scelte in cui l’agenzia viene preservata attraverso politiche che reagiscono a ciò che è noto ad ogni passo. Le supply chain vivono esattamente in questo mondo. Ma chiunque abbia provato a gestire un’impresa su larga scala sa che i dati arrivano come sottoprodotto di sistemi di registrazione, che gli incentivi a volte si contrappongono alla verità e che le evidenze sono costose da ottenere. È per questo che il libro dedica del tempo a come viene prodotta la conoscenza all’interno delle aziende, e alle distorsioni che si insinuano — ciò che io chiamo “corruzione epistemica.” Un framework che eccelle in laboratorio deve comunque sopravvivere al contatto con gli incentivi e la semantica del reparto operativo. Vedi Capitolo 3 (“Epistemology”, esp. 3.6).²

La tassonomia delle classi di politiche di SDA è inoltre una lista di controllo utile quando dobbiamo approssimare ciò che non può essere risolto esattamente. In tal senso, il mio lavoro è in sintonia: i motori della supply chain spesso mescolano semplici passaggi miopi con brevi previsioni quando conviene. Il vocabolario di SDA aiuta a confrontare tali strategie e ci ricorda che nessuna classe singola domina tra i vari problemi.¹

Dove le nostre strade si dividono

La divergenza inizia con la prima mossa. SDA parte da un modello — stato, decisione, informazioni esogene, transizione, obiettivo — e poi cerca tra le politiche. Io parto prima, con la determinazione dei prezzi. Prima di accettare qualsiasi “stato”, desidero che i costi e i benefici che rendono una decisione economicamente legittima siano visibili e verificabili. In altre parole, preferisco prezzare le conseguenze finché molte delle complessità sequenziali non collassano in scelte solide a un solo passo.

Questo è particolarmente evidente quando “appiattiamo” un problema sequenziale inserendo i prezzi giusti. Considera la spedizione di scorte scarse da un centro di distribuzione. Se associamo un prezzo di attesa visibile all’inventario del centro — un prezzo ombra che riflette l’opzione di soddisfare una richiesta migliore domani — allora un negozio riceve un’unità solo quando il suo rendimento marginale supera realmente quel prezzo di attesa. Non stiamo ignorando il futuro; lo stiamo comprando con un numero che riflette il costo del capitale, il valore dell’informazione e l’opportunità di attendere. Vedi Capitolo 8 (“Decisions”, §8.5).²

Due strumenti rendono questo appiattimento sufficientemente sicuro da utilizzare ogni giorno. Il primo è una finestra di responsabilità: un orizzonte limitato nel quale la decisione di oggi viene ritenuta responsabile, mentre le decisioni successive ereditano il resto. Non è necessario pianificare l’intera stagione per giudicare se ordinare un container (o spedire a un negozio) sia stata una scelta saggia; misuriamo le conseguenze espresse in termini monetari in una finestra e proseguiamo. Il secondo è l’economia dell’attesa: non fare nulla per il momento è un’opzione legittima, con una regola di interruzione che interviene solo quando il rendimento atteso, corretto per il rischio, della migliore mossa ammissibile supera il costo ombra del capitale aziendale più il valore dell’opzione di ritardo. Insieme, questi strumenti preservano l’autonomia decisionale evitando la fragilità di una previsione profonda quando dati e semantica sono imperfetti. Vedi Capitolo 8 (“Decisions”, §8.5).²

La determinazione dei prezzi ci permette inoltre di internalizzare gli effetti collaterali a lungo termine senza modellare ogni contingenza. Un rivenditore che valuta l’inventario esclusivamente in base alle vendite osservate investirà insufficientemente nel servizio; la soluzione è una penalità per esaurimento scorte, una valutazione ombra che riflette il costo a lungo termine delle vendite perse. Con quel prezzo in essere, il dolore sequenziale di deludere un cliente domani viene percepito — in modo appropriato — dall’allocazione odierna. Vedi Capitoli 4 e 8.²

Questo approccio del “pricing first” si estende anche all’ingegneria. SDA è in gran parte model‑first; io sono engineering‑first. Il libro sostiene che i paradigmi di programmazione utilizzati per esprimere le decisioni contano almeno quanto il modello statistico. Le supply chain beneficiano di linguaggi e ambienti di esecuzione in cui tempo, denaro e incertezza sono cittadini di prima classe; in cui array e tabelle prevalgono; in cui il determinismo permette la verifica; e in cui il ricalcolo parziale accorcia i cicli di feedback. L’obiettivo sono motori autonomi le cui decisioni sono leggibili in termini monetari, non cruscotti che devono essere rianimati alle 7 a.m. Vedi Capitolo 9 (“Engineering”, §9.5) e Capitolo 6 (“Intelligence”, §6.3).²

Infine, c’è la questione di come apprendiamo. Le evidenze sul campo sono costose e ambigue; l’unico antidoto pratico è l’ottimizzazione sperimentale: strumentare, emettere decisioni, osservare eventuali raccomandazioni “fuori di testa”, correggere i fattori trainanti e ripetere il ciclo. Questo iter non pretende di convergere una volta per tutte; mantiene il sistema ancorato alla realtà man mano che le condizioni evolvono. Vedi Capitolo 9 (“Engineering”, §9.2).²

Cosa significa questo in pratica

La vastità di SDA è una caratteristica. Quando si calibra una previsione per un energy store, si progetta una politica per un controller robotico o si confrontano le approssimazioni della funzione valore con roll-out diretti, SDA offre un linguaggio coerente e una mappa di metodi da sperimentare. Ci ricorda inoltre che, in fin dei conti, stiamo ottimizzando sulle politiche.¹

Ma l’enterprise supply chain è un tipo diverso di territorio selvaggio. La semantica dei dati cambia sotto i tuoi piedi; gli incentivi deformano le evidenze; gli esperimenti sono rischiosi e lenti. In tale contesto, ho avuto più successo prezzando prima e modellando dopo. Il metodo è semplice da enunciare, sebbene impegnativo da eseguire. Prezza ciò che è scarso — inclusi attenzione e capacità. Applica penalità esplicite dove il futuro fa male — esaurimento scorte, congestione, obsolescenza. Limita l’attribuzione con una finestra. Ammetti l’opzione “wait” ed imposta un limite che rispetti sia il capitale sia l’incertezza. Esprimi tutto in un paradigma che renda il denaro e il tempo concetti nativi. Poi itera finché le decisioni non monitorate non smettono di sembrare assurde.

Questo non è un confutazione di SDA. È una scelta d’ordine. SDA cerca le approssimazioni che rendono l’ottimizzazione dinamica fattibile. Io cerco i prezzi che rendono le decisioni quotidiane economicamente corrette, in modo che il problema dinamico che dobbiamo approssimare sia più piccolo, meglio comportato e giustifichi lo sforzo supplementare. Le due visioni possono essere combinate: un perimetro ingegnerizzato e prezzato all’esterno; una previsione mirata o un’approssimazione della funzione valore all’interno, dove è veramente necessaria.

I lettori interessati alla mia posizione dettagliata troveranno le basi economiche nei Capitoli 3–4, il trattamento delle decisioni sequenziali nel Capitolo 8 e l’approccio ingegneristico — i paradigmi di programmazione e l’ottimizzazione sperimentale — nel Capitolo 9 di Introduction to Supply Chain. Per una esposizione compatta dell’ambito di SDA e delle quattro classi di politiche che ne costituiscono i metodi, il framework unificato di Powell e il suo testo di modellazione sono i punti di partenza migliori.¹

Note

Torna al Blog ›

Sulla analisi decisionale sequenziale.

Dove SDA e io ci incontriamo

Dove le nostre strade si dividono

Cosa significa questo in pratica

Note

Altri articoli