Regressione Quantile
La regressione quantile è un tipo di regressione (cioè previsione) che introduce volutamente un bias nel risultato. Invece di cercare la media della variabile da prevedere, una regressione quantile cerca la mediana e qualsiasi altro quantile (a volte chiamato percentili). I quantili sono particolarmente utili per l’ottimizzazione dell’inventario come metodo diretto per calcolare il punto di riordino.
La nozione di regressione quantile è un argomento statistico relativamente avanzato, l’obiettivo di questo articolo non è quello di fornire un trattamento rigoroso dell’argomento, ma piuttosto di dare un’introduzione (relativamente) intuitiva al soggetto per i professionisti del retail o della produzione.
Illustrazione visiva dei quantili

Il grafico sopra illustra 3 previsioni distinte:
- in rosso, una previsione del quantile al 75%.
- in nero, una previsione della media.
- in verde, una previsione del quantile al 25%.
Visivamente, i quantili si comportano in modo molto simile agli intervalli di confidenza. Tuttavia, in pratica, il quantile è necessario solo per una singola percentuale obiettivo.
Quantili (o percentili) della domanda futura
La previsione classica, e la più intuitiva, è la previsione media: i rispettivi pesi della sovrastima e della sottostima dovrebbero essere uguali, altrimenti la previsione risulta distorta (più precisamente distorta rispetto alla media).
Una prima raffinazione di questa visione è la previsione mediana: le rispettive frequenze di sovrastima e di sottostima dovrebbero essere uguali, altrimenti la previsione è distorta rispetto alla mediana.
A questo punto, abbiamo già spostato la nozione di previsioni non distorte da pesi uguali a probabilità uguali. Questo cambiamento è sottile, ma in alcune situazioni potrebbe avere un grande impatto numerico.
Illustrazione: Reddito familiare medio vs mediano negli Stati Uniti
Il reddito familiare illustra la profonda differenza tra la media e la mediana.
Questa discrepanza è spiegata dai redditi elevati (in termini comparativi) delle famiglie statunitensi più ricche rispetto al resto della popolazione. Tale discrepanza tra la media e la mediana si riscontra in tutte le distribuzioni non simmetriche, tipicamente in tutte le distribuzioni che non seguono una distribuzione normale.
Generalizzazione della mediana
La mediana rappresenta la soglia in cui la distribuzione si divide in parità 50/50. Tuttavia, è possibile considerare altri rapporti di frequenza. Ad esempio, possiamo considerare 80/20 o 90/10 o qualsiasi altro rapporto in cui il totale rimane al 100%.
I quantili rappresentano una generalizzazione della mediana a qualsiasi percentuale data. Per τ, un valore compreso tra 0 e 1, la regressione quantile Q(τ) rappresenta la soglia in cui la probabilità di osservare un valore inferiore alla soglia è esattamente τ.
Previsioni quantili
Sia le previsioni classiche che quelle quantili prendono in input una serie temporale. La serie temporale rappresenta i dati in ingresso. Oltre ai dati, una previsione classica della serie temporale media richiede due impostazioni strutturali aggiuntive:
- il periodo, ad esempio giorno, settimana o mese.
- l’orizzonte, un intero che rappresenta il numero di periodi da prevedere.
In modo implicito, la serie temporale viene aggregata secondo il periodo, e l’orizzonte è scelto in modo da essere sufficientemente ampio per essere di utilità pratica, tipicamente maggiore del lead time.
Le previsioni medie beneficiano di una proprietà molto utile: è matematicamente corretto sommare le previsioni. Ad esempio, se y1, y2, y3 e y4 rappresentano la previsione per le 4 settimane successive, allora se abbiamo bisogno della domanda attesa solo per le prossime due settimane, possiamo sommare y1+y2.
Tuttavia, sommare le previsioni quantili è matematicamente scorretto, o più precisamente la somma dei quantili non equivale al quantile della somma (somma dei segmenti).
Poiché le previsioni quantili non possono essere sommate, le previsioni della serie temporale quantile devono riconsiderare la nozione stessa di aggregazione per periodo. Infatti, produrre previsioni quantili per periodo è inutile, poiché tali previsioni elementari non possono essere combinate per produrre quantili corretti su segmenti.
Pertanto, la previsione della serie temporale quantile si presenta con una struttura distinta:
- τ il quantile obiettivo, una percentuale.
- λ l’orizzonte che esprime una durata (tipicamente in giorni).
Ad esempio, se la serie temporale rappresenta le vendite di un prodotto A, e abbiamo le impostazioni τ=0.90 e λ=14 giorni, allora la previsione quantile (τ, λ) restituirà il valore della domanda che ha esattamente il 90% di probabilità di essere superiore alla domanda totale osservata in 14 giorni (rispettivamente il 10% di probabilità di essere inferiore alla domanda negli stessi 14 giorni).
Contrariamente alle previsioni classiche, le previsioni quantili producono un solo e unico valore per serie temporale, indipendentemente dall’orizzonte. In un certo senso, le previsioni quantili sono più indipendenti dal periodo rispetto alle loro controparti classiche.
L’imbroglio di Lokad
A prima vista, le previsioni quantili sembrano un po’ più complicate rispetto a quelle classiche. Tuttavia, in molte situazioni reali, i professionisti finiscono per produrre prima previsioni medie per poi estrapolarle immediatamente in previsioni quantili, tipicamente assumendo che le previsioni seguano una distribuzione normale. Tuttavia, questo passaggio di estrapolazione rappresenta frequentemente il punto debole del processo, e può degradare significativamente il risultato finale. La tecnologia di previsione dovrebbe adattarsi ai requisiti pratici, cioè fornendo previsioni quantili native, e non viceversa.
Ulteriori letture
- Punto di riordino, come i quantili si applicano all’ottimizzazione dell’inventario.
- Funzione di perdita Pinball, come misurare l’accuratezza di una previsione quantile.
- Roger Koenker, Kevin F. Hallock, (2001) Regressione Quantile, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Stima quantile non parametrica, Journal of Machine Learning Research 7 1231–1264