Regresión de Cuantiles
La regresión de cuantiles es un tipo de regresión (es decir, forecast) que introduce a propósito un sesgo en el resultado. En lugar de buscar la media de la variable a predecir, una regresión de cuantiles busca la mediana y cualquier otro cuantil (a veces llamados percentiles). Los cuantiles son particularmente útiles para la optimización de inventario como método directo para calcular el punto de reorden.
La noción de regresión de cuantiles es un tema estadístico relativamente avanzado, el objetivo de este artículo no es profundizar en un tratamiento riguroso de este asunto, sino más bien ofrecer una introducción (relativamente) intuitiva al tema para profesionales del comercio minorista o de la manufactura.
Ilustración visual de los cuantiles

El gráfico anterior ilustra 3 forecasts distintos:
- en rojo, un forecast de cuantil al 75%.
- en negro, un forecast de la media.
- en verde, un forecast de cuantil al 25%.
Visualmente, los cuantiles se comportan de manera muy similar a los intervalos de confianza. Sin embargo, en la práctica, el cuantil solo se necesita para un único porcentaje objetivo.
Cuantiles (o percentiles) de la demanda futura
El forecast clásico, y más intuitivo, es el forecast de la media: los respectivos pesos de over-forecasting y de under-forecasting deberían ser iguales, de lo contrario el forecast está sesgado (más precisamente sesgado contra la media).
Una primera mejora de esta visión es el forecast de la mediana: la respectiva frecuencia de over-forecasting y de under-forecasting debería ser igual, de lo contrario el forecast está sesgado contra la mediana.
A este punto, ya hemos desplazado la noción de forecasts sin sesgo de pesos iguales hacia probabilidades iguales. Este cambio es sutil, pero en algunas situaciones podría tener un gran impacto numérico.
Ilustración: Ingreso medio vs. ingreso mediano en los hogares de EE.UU.
El ingreso del hogar ilustra la diferencia profunda entre la media y la mediana.
Esta discrepancia se explica por los altos ingresos (en comparación) del hogar estadounidense más rico en relación con el resto de la población. Dicha discrepancia entre la media y la mediana se encontrará en todas las distribuciones que no son simétricas, típicamente en todas las distribuciones que no siguen una distribución normal.
Generalización de la mediana
La mediana representa el umbral donde la distribución se divide en probabilidades 50/50. Sin embargo, es posible considerar otros porcentajes de frecuencia. Por ejemplo, podemos considerar 80/20 o 90/10 o cualquier otra proporción donde el total se mantenga en 100%.
Los cuantiles representan una generalización de la mediana a cualquier porcentaje dado. Para τ, un valor entre 0 y 1, la regresión de cuantiles Q(τ) representa el umbral donde la probabilidad de observar un valor inferior a dicho umbral es exactamente τ.
Forecasts de cuantiles
Tanto los forecasts clásicos como los forecasts de cuantiles toman una serie de tiempo como entrada. La serie de tiempo representa los datos de entrada. Además de los datos, un forecast clásico de la media a partir de series de tiempo requiere dos configuraciones estructurales adicionales:
- el período, como día, semana o mes.
- el horizonte, un número entero que representa la cantidad de períodos a forecast.
De manera implícita, la serie de tiempo se agrega de acuerdo al período, y el horizonte se elige lo suficientemente grande para ser de uso práctico, típicamente mayor que el lead time.
Los forecasts de la media se benefician de una propiedad muy útil: es matemáticamente correcto sumar los forecasts. Por ejemplo, si y1, y2, y3 y y4 representan el forecast a 4 semanas, entonces, si necesitamos la demanda esperada solo para las próximas dos semanas, podemos sumar y1+y2.
Sin embargo, sumar forecasts de cuantiles es matemáticamente incorrecto, o más precisamente, la suma de los cuantiles no produce el cuantil de la suma (suma de los segmentos).
Dado que los forecasts de cuantiles no se pueden sumar, los forecasts de series de tiempo de cuantiles deben reconsiderar la noción misma de agregación por períodos. De hecho, producir forecasts de cuantiles por período es inútil, ya que esos forecasts elementales no pueden combinarse para producir cuantiles correctos sobre segmentos.
Así, el forecast de series de tiempo de cuantiles viene con una estructura distinta:
- τ el cuantil objetivo, un porcentaje.
- λ el horizonte que expresa una duración (típicamente en días).
Por ejemplo, si la serie de tiempo representa las ventas de un producto A, y tenemos los parámetros τ=0.90 y λ=14 días, entonces el forecast de cuantiles (τ, λ) devolverá el valor de demanda que tiene exactamente un 90% de probabilidad de ser mayor que la demanda total observada durante 14 días (respectivamente, un 10% de probabilidad de ser inferior a la demanda durante esos mismos 14 días).
A diferencia de los forecasts clásicos, los forecasts de cuantiles producen un y único valor por serie de tiempo, independientemente del horizonte. Hasta cierto punto, los forecasts de cuantiles son más ajenos al período que sus contrapartes clásicas.
La trampa de Lokad
A primera vista, los forecasts de cuantiles parecen algo más complicados que los clásicos. No obstante, en muchas situaciones de la vida real, los profesionales terminan produciendo primero forecasts de la media para luego extrapolarlos inmediatamente como forecasts de cuantiles, asumiendo típicamente que los forecasts siguen una distribución normal. Sin embargo, este paso de extrapolación representa frecuentemente el eslabón más débil del proceso, y puede degradar significativamente el resultado final. La tecnología de forecast debería adaptarse a los requerimientos prácticos, es decir, ofreciendo forecasts de cuantiles nativos, y no al revés.
Lecturas adicionales
- Punto de reorden, cómo se aplican los cuantiles a la optimización de inventario.
- Función de pérdida pinball, cómo medir la precisión de un forecast de cuantiles.
- Roger Koenker, Kevin F. Hallock, (2001) Regresión de cuantiles, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Estimación no paramétrica de cuantiles, Journal of Machine Learning Research 7 1231–1264