Regresión de Cuantiles

Por Joannès Vermorel, febrero 2012

La regresión de cuantiles es un tipo de regresión (es decir, forecast) que introduce a propósito un sesgo en el resultado. En lugar de buscar la media de la variable a predecir, una regresión de cuantiles busca la mediana y cualquier otro cuantil (a veces llamados percentiles). Los cuantiles son particularmente útiles para la optimización de inventario como método directo para calcular el punto de reorden.

Regression es aquí sinónimo de forecast. “Regression” enfatiza el enfoque matemático, mientras que “forecast” enfatiza el uso práctico que se hace del resultado.

La noción de regresión de cuantiles es un tema estadístico relativamente avanzado, el objetivo de este artículo no es profundizar en un tratamiento riguroso de este asunto, sino más bien ofrecer una introducción (relativamente) intuitiva al tema para profesionales del comercio minorista o de la manufactura.

Ilustración visual de los cuantiles

Las series de tiempo del cuantil inferior y superior, lado a lado con la serie de tiempo del forecast de la media.

El gráfico anterior ilustra 3 forecasts distintos:

en rojo, un forecast de cuantil al 75%.
en negro, un forecast de la media.
en verde, un forecast de cuantil al 25%.

Visualmente, los cuantiles se comportan de manera muy similar a los intervalos de confianza. Sin embargo, en la práctica, el cuantil solo se necesita para un único porcentaje objetivo.

Cuantiles (o percentiles) de la demanda futura

El forecast clásico, y más intuitivo, es el forecast de la media: los respectivos pesos de over-forecasting y de under-forecasting deberían ser iguales, de lo contrario el forecast está sesgado (más precisamente sesgado contra la media).

Aunque contar con un forecast sin sesgo es una propiedad deseable, no dice nada sobre la precisión del forecast. En particular, un forecast puede ser sin sesgo y a la vez ser ampliamente inexacto. El sesgo solo se refiere a la propensión del modelo de forecast a sobreestimar o subestimar el futuro.

Una primera mejora de esta visión es el forecast de la mediana: la respectiva frecuencia de over-forecasting y de under-forecasting debería ser igual, de lo contrario el forecast está sesgado contra la mediana.

A este punto, ya hemos desplazado la noción de forecasts sin sesgo de pesos iguales hacia probabilidades iguales. Este cambio es sutil, pero en algunas situaciones podría tener un gran impacto numérico.

Ilustración: Ingreso medio vs. ingreso mediano en los hogares de EE.UU.

El ingreso del hogar ilustra la diferencia profunda entre la media y la mediana.

Según la Oficina del Censo de EE.UU., en 2004, el ingreso mediano del hogar fue de $44,389 mientras que ese mismo año el ingreso medio (promedio) fue de $60,528, casi un 40% superior al de la mediana.

Esta discrepancia se explica por los altos ingresos (en comparación) del hogar estadounidense más rico en relación con el resto de la población. Dicha discrepancia entre la media y la mediana se encontrará en todas las distribuciones que no son simétricas, típicamente en todas las distribuciones que no siguen una distribución normal.

Generalización de la mediana

La mediana representa el umbral donde la distribución se divide en probabilidades 50/50. Sin embargo, es posible considerar otros porcentajes de frecuencia. Por ejemplo, podemos considerar 80/20 o 90/10 o cualquier otra proporción donde el total se mantenga en 100%.

Los cuantiles representan una generalización de la mediana a cualquier porcentaje dado. Para τ, un valor entre 0 y 1, la regresión de cuantiles Q(τ) representa el umbral donde la probabilidad de observar un valor inferior a dicho umbral es exactamente τ.

Forecasts de cuantiles

Tanto los forecasts clásicos como los forecasts de cuantiles toman una serie de tiempo como entrada. La serie de tiempo representa los datos de entrada. Además de los datos, un forecast clásico de la media a partir de series de tiempo requiere dos configuraciones estructurales adicionales:

el período, como día, semana o mes.
el horizonte, un número entero que representa la cantidad de períodos a forecast.

De manera implícita, la serie de tiempo se agrega de acuerdo al período, y el horizonte se elige lo suficientemente grande para ser de uso práctico, típicamente mayor que el lead time.

Los forecasts de la media se benefician de una propiedad muy útil: es matemáticamente correcto sumar los forecasts. Por ejemplo, si y1, y2, y3 y y4 representan el forecast a 4 semanas, entonces, si necesitamos la demanda esperada solo para las próximas dos semanas, podemos sumar y1+y2.

Sin embargo, sumar forecasts de cuantiles es matemáticamente incorrecto, o más precisamente, la suma de los cuantiles no produce el cuantil de la suma (suma de los segmentos).

Ilustremos por qué no se pueden sumar los cuantiles. Supongamos que tenemos a un jugador que apuesta una moneda de $1 en una máquina tragamonedas cada semana. Supongamos que las probabilidades de ganar son del 1% para un premio de $50 y cero en caso contrario. Si observamos el cuantil del 99% de la recompensa esperada, obtenemos una recompensa semanal de $50 cada semana. Sin embargo, si observamos el cuantil del 99% en dos semanas, la recompensa esperada sigue siendo de $50. De hecho, la probabilidad de ganar dos veces es solo del 0,01% (1% multiplicado por 1%), por lo que el cuantil del 99% permanece sin cambios. Sumar los dos cuantiles semanales del 99% daría $100, pero en realidad se necesitan 16 semanas para acumular $100 de ganancia para el cuantil del 99% (la demostración de este resultado numérico no se ofrece ya que excedería el alcance de este artículo).

Dado que los forecasts de cuantiles no se pueden sumar, los forecasts de series de tiempo de cuantiles deben reconsiderar la noción misma de agregación por períodos. De hecho, producir forecasts de cuantiles por período es inútil, ya que esos forecasts elementales no pueden combinarse para producir cuantiles correctos sobre segmentos.

Así, el forecast de series de tiempo de cuantiles viene con una estructura distinta:

τ el cuantil objetivo, un porcentaje.
λ el horizonte que expresa una duración (típicamente en días).

Por ejemplo, si la serie de tiempo representa las ventas de un producto A, y tenemos los parámetros τ=0.90 y λ=14 días, entonces el forecast de cuantiles (τ, λ) devolverá el valor de demanda que tiene exactamente un 90% de probabilidad de ser mayor que la demanda total observada durante 14 días (respectivamente, un 10% de probabilidad de ser inferior a la demanda durante esos mismos 14 días).

A diferencia de los forecasts clásicos, los forecasts de cuantiles producen un y único valor por serie de tiempo, independientemente del horizonte. Hasta cierto punto, los forecasts de cuantiles son más ajenos al período que sus contrapartes clásicas.

La trampa de Lokad

A primera vista, los forecasts de cuantiles parecen algo más complicados que los clásicos. No obstante, en muchas situaciones de la vida real, los profesionales terminan produciendo primero forecasts de la media para luego extrapolarlos inmediatamente como forecasts de cuantiles, asumiendo típicamente que los forecasts siguen una distribución normal. Sin embargo, este paso de extrapolación representa frecuentemente el eslabón más débil del proceso, y puede degradar significativamente el resultado final. La tecnología de forecast debería adaptarse a los requerimientos prácticos, es decir, ofreciendo forecasts de cuantiles nativos, y no al revés.

Lecturas adicionales

Punto de reorden, cómo se aplican los cuantiles a la optimización de inventario.
Función de pérdida pinball, cómo medir la precisión de un forecast de cuantiles.
Roger Koenker, Kevin F. Hallock, (2001) Regresión de cuantiles, Journal of Economic Perspectives, 15 (4), 143–156
Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Estimación no paramétrica de cuantiles, Journal of Machine Learning Research 7 1231–1264