Regresión de Cuantiles
La regresión de cuantiles es un tipo de regresión (es decir, previsión) que introduce a propósito un sesgo en el resultado. En lugar de buscar la media de la variable a predecir, una regresión de cuantiles busca la mediana y cualquier otro cuantil (a veces llamados percentiles). Los cuantiles son particularmente útiles para la optimización de inventario como método directo para calcular el punto de reorden.
La noción de regresión de cuantiles es un tema estadístico relativamente avanzado, el objetivo de este artículo no es profundizar en un tratamiento riguroso de este asunto, sino más bien ofrecer una introducción (relativamente) intuitiva al tema para profesionales del comercio minorista o de la manufactura.
Ilustración visual de los cuantiles
El gráfico anterior ilustra 3 previsiones distintas:
- en rojo, una previsión de cuantil al 75%.
- en negro, una previsión de la media.
- en verde, una previsión de cuantil al 25%.
Visualmente, los cuantiles se comportan de manera muy similar a los intervalos de confianza. Sin embargo, en la práctica, el cuantil solo se necesita para un único porcentaje objetivo.
Cuantiles (o percentiles) de la demanda futura
La previsión clásica, y más intuitiva, es la previsión de la media: los respectivos pesos de sobreprevisión y de infraprevisión deberían ser iguales, de lo contrario la previsión está sesgada (más precisamente sesgada contra la media).
Una primera mejora de esta visión es la previsión de la mediana: la respectiva frecuencia de sobreprevisión y de infraprevisión debería ser igual, de lo contrario la previsión está sesgada contra la mediana.
A este punto, ya hemos desplazado la noción de previsiones sin sesgo de pesos iguales hacia probabilidades iguales. Este cambio es sutil, pero en algunas situaciones podría tener un gran impacto numérico.
Ilustración: Ingreso medio vs. ingreso mediano en los hogares de EE.UU.
El ingreso del hogar ilustra la diferencia profunda entre la media y la mediana.
Esta discrepancia se explica por los altos ingresos (en comparación) del hogar estadounidense más rico en relación con el resto de la población. Dicha discrepancia entre la media y la mediana se encontrará en todas las distribuciones que no son simétricas, típicamente en todas las distribuciones que no siguen una distribución normal.
Generalización de la mediana
La mediana representa el umbral donde la distribución se divide en probabilidades 50/50. Sin embargo, es posible considerar otros porcentajes de frecuencia. Por ejemplo, podemos considerar 80/20 o 90/10 o cualquier otra proporción donde el total se mantenga en 100%.
Los cuantiles representan una generalización de la mediana a cualquier porcentaje dado. Para τ, un valor entre 0 y 1, la regresión de cuantiles Q(τ) representa el umbral donde la probabilidad de observar un valor inferior a dicho umbral es exactamente τ.
Previsiones de cuantiles
Tanto las previsiones clásicas como las previsiones de cuantiles toman una serie de tiempo como entrada. La serie de tiempo representa los datos de entrada. Además de los datos, una previsión clásica de la media a partir de series de tiempo requiere dos configuraciones estructurales adicionales:
- el período, como día, semana o mes.
- el horizonte, un número entero que representa la cantidad de períodos que se deben prever.
De manera implícita, la serie de tiempo se agrega de acuerdo al período, y el horizonte se elige lo suficientemente grande para ser de uso práctico, típicamente mayor que el tiempo de entrega.
Las previsiones de la media se benefician de una propiedad muy útil: es matemáticamente correcto sumar las previsiones. Por ejemplo, si y1, y2, y3 y y4 representan la previsión a 4 semanas, entonces, si necesitamos la demanda esperada solo para las próximas dos semanas, podemos sumar y1+y2.
Sin embargo, sumar previsiones de cuantiles es matemáticamente incorrecto, o más precisamente, la suma de los cuantiles no produce el cuantil de la suma (suma de los segmentos).
Dado que las previsiones de cuantiles no se pueden sumar, las previsiones de series de tiempo de cuantiles deben reconsiderar la noción misma de agregación por períodos. De hecho, producir previsiones de cuantiles por período es inútil, ya que esas previsiones elementales no pueden combinarse para producir cuantiles correctos sobre segmentos.
Así, la previsión de series de tiempo de cuantiles viene con una estructura distinta:
- τ el cuantil objetivo, un porcentaje.
- λ el horizonte que expresa una duración (típicamente en días).
Por ejemplo, si la serie de tiempo representa las ventas de un producto A, y tenemos los parámetros τ=0.90 y λ=14 días, entonces la previsión de cuantiles (τ, λ) devolverá el valor de demanda que tiene exactamente un 90% de probabilidad de ser mayor que la demanda total observada durante 14 días (respectivamente, un 10% de probabilidad de ser inferior a la demanda durante esos mismos 14 días).
A diferencia de las previsiones clásicas, las previsiones de cuantiles producen un y único valor por serie de tiempo, independientemente del horizonte. Hasta cierto punto, las previsiones de cuantiles son más ajenas al período que sus contrapartes clásicas.
La trampa de Lokad
A primera vista, las previsiones de cuantiles parecen algo más complicadas que las clásicas. No obstante, en muchas situaciones de la vida real, los profesionales terminan produciendo primero previsiones de la media para luego extrapolarlas inmediatamente como previsiones de cuantiles, asumiendo típicamente que las previsiones siguen una distribución normal. Sin embargo, este paso de extrapolación representa frecuentemente el eslabón más débil del proceso, y puede degradar significativamente el resultado final. La tecnología de previsión debería adaptarse a los requerimientos prácticos, es decir, ofreciendo previsiones de cuantiles nativas, y no al revés.
Lecturas adicionales
- Punto de reorden, cómo se aplican los cuantiles a la optimización de inventario.
- Función de pérdida pinball, cómo medir la precisión de una previsión de cuantiles.
- Roger Koenker, Kevin F. Hallock, (2001) Regresión de cuantiles, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Estimación no paramétrica de cuantiles, Journal of Machine Learning Research 7 1231–1264