Iniciar sesión Contactar
Volver a la base de conocimiento

Regresión de Cuantiles

Por Joannès Vermorel, febrero 2012

La regresión de cuantiles es un tipo de regresión (es decir, previsión) que introduce a propósito un sesgo en el resultado. En lugar de buscar la media de la variable a predecir, una regresión de cuantiles busca la mediana y cualquier otro cuantil (a veces llamados percentiles). Los cuantiles son particularmente útiles para la optimización de inventario como método directo para calcular el punto de reorden.

Regression es aquí sinónimo de previsión. “Regression” enfatiza el enfoque matemático, mientras que “previsión” enfatiza el uso práctico que se hace del resultado.

La noción de regresión de cuantiles es un tema estadístico relativamente avanzado, el objetivo de este artículo no es profundizar en un tratamiento riguroso de este asunto, sino más bien ofrecer una introducción (relativamente) intuitiva al tema para profesionales del comercio minorista o de la manufactura.

Ilustración visual de los cuantiles

Las series temporales de cuantiles inferior y superior junto a la serie temporal de previsión de la media.

El gráfico anterior ilustra 3 previsiones distintas:

  • en rojo, una previsión de cuantil al 75%.
  • en negro, una previsión de la media.
  • en verde, una previsión de cuantil al 25%.

Visualmente, los cuantiles se comportan de manera muy similar a los intervalos de confianza. Sin embargo, en la práctica, el cuantil solo se necesita para un único porcentaje objetivo.

Cuantiles (o percentiles) de la demanda futura

La previsión clásica, y más intuitiva, es la previsión de la media: los respectivos pesos de sobreprevisión y de infraprevisión deberían ser iguales, de lo contrario la previsión está sesgada (más precisamente sesgada contra la media).

Aunque contar con una previsión sin sesgo es una propiedad deseable, no dice nada sobre la precisión de la previsión. En particular, una previsión puede ser sin sesgo y a la vez ser ampliamente inexacta. El sesgo solo se refiere a la propensión del modelo de previsión a sobreestimar o subestimar el futuro.

Una primera mejora de esta visión es la previsión de la mediana: la respectiva frecuencia de sobreprevisión y de infraprevisión debería ser igual, de lo contrario la previsión está sesgada contra la mediana.

A este punto, ya hemos desplazado la noción de previsiones sin sesgo de pesos iguales hacia probabilidades iguales. Este cambio es sutil, pero en algunas situaciones podría tener un gran impacto numérico.

Ilustración: Ingreso medio vs. ingreso mediano en los hogares de EE.UU.

El ingreso del hogar ilustra la diferencia profunda entre la media y la mediana.

Según la Oficina del Censo de EE.UU., en 2004, el ingreso mediano del hogar fue de $44,389 mientras que ese mismo año el ingreso medio (promedio) fue de $60,528, casi un 40% superior al de la mediana.

Esta discrepancia se explica por los altos ingresos (en comparación) del hogar estadounidense más rico en relación con el resto de la población. Dicha discrepancia entre la media y la mediana se encontrará en todas las distribuciones que no son simétricas, típicamente en todas las distribuciones que no siguen una distribución normal.

Generalización de la mediana

La mediana representa el umbral donde la distribución se divide en probabilidades 50/50. Sin embargo, es posible considerar otros porcentajes de frecuencia. Por ejemplo, podemos considerar 80/20 o 90/10 o cualquier otra proporción donde el total se mantenga en 100%.

Los cuantiles representan una generalización de la mediana a cualquier porcentaje dado. Para τ, un valor entre 0 y 1, la regresión de cuantiles Q(τ) representa el umbral donde la probabilidad de observar un valor inferior a dicho umbral es exactamente τ.

Previsiones de cuantiles

Tanto las previsiones clásicas como las previsiones de cuantiles toman una serie de tiempo como entrada. La serie de tiempo representa los datos de entrada. Además de los datos, una previsión clásica de la media a partir de series de tiempo requiere dos configuraciones estructurales adicionales:

  • el período, como día, semana o mes.
  • el horizonte, un número entero que representa la cantidad de períodos que se deben prever.

De manera implícita, la serie de tiempo se agrega de acuerdo al período, y el horizonte se elige lo suficientemente grande para ser de uso práctico, típicamente mayor que el tiempo de entrega.

Las previsiones de la media se benefician de una propiedad muy útil: es matemáticamente correcto sumar las previsiones. Por ejemplo, si y1, y2, y3 y y4 representan la previsión a 4 semanas, entonces, si necesitamos la demanda esperada solo para las próximas dos semanas, podemos sumar y1+y2.

Sin embargo, sumar previsiones de cuantiles es matemáticamente incorrecto, o más precisamente, la suma de los cuantiles no produce el cuantil de la suma (suma de los segmentos).

Ilustremos por qué no se pueden sumar los cuantiles. Supongamos que tenemos a un jugador que apuesta una moneda de $1 en una máquina tragamonedas cada semana. Supongamos que las probabilidades de ganar son del 1% para un premio de $50 y cero en caso contrario. Si observamos el cuantil del 99% de la recompensa esperada, obtenemos una recompensa semanal de $50 cada semana. Sin embargo, si observamos el cuantil del 99% en dos semanas, la recompensa esperada sigue siendo de $50. De hecho, la probabilidad de ganar dos veces es solo del 0,01% (1% multiplicado por 1%), por lo que el cuantil del 99% permanece sin cambios. Sumar los dos cuantiles semanales del 99% daría $100, pero en realidad se necesitan 16 semanas para acumular $100 de ganancia para el cuantil del 99% (la demostración de este resultado numérico no se ofrece ya que excedería el alcance de este artículo).

Dado que las previsiones de cuantiles no se pueden sumar, las previsiones de series de tiempo de cuantiles deben reconsiderar la noción misma de agregación por períodos. De hecho, producir previsiones de cuantiles por período es inútil, ya que esas previsiones elementales no pueden combinarse para producir cuantiles correctos sobre segmentos.

Así, la previsión de series de tiempo de cuantiles viene con una estructura distinta:

  • τ el cuantil objetivo, un porcentaje.
  • λ el horizonte que expresa una duración (típicamente en días).

Por ejemplo, si la serie de tiempo representa las ventas de un producto A, y tenemos los parámetros τ=0.90 y λ=14 días, entonces la previsión de cuantiles (τ, λ) devolverá el valor de demanda que tiene exactamente un 90% de probabilidad de ser mayor que la demanda total observada durante 14 días (respectivamente, un 10% de probabilidad de ser inferior a la demanda durante esos mismos 14 días).

A diferencia de las previsiones clásicas, las previsiones de cuantiles producen un y único valor por serie de tiempo, independientemente del horizonte. Hasta cierto punto, las previsiones de cuantiles son más ajenas al período que sus contrapartes clásicas.

La trampa de Lokad

A primera vista, las previsiones de cuantiles parecen algo más complicadas que las clásicas. No obstante, en muchas situaciones de la vida real, los profesionales terminan produciendo primero previsiones de la media para luego extrapolarlas inmediatamente como previsiones de cuantiles, asumiendo típicamente que las previsiones siguen una distribución normal. Sin embargo, este paso de extrapolación representa frecuentemente el eslabón más débil del proceso, y puede degradar significativamente el resultado final. La tecnología de previsión debería adaptarse a los requerimientos prácticos, es decir, ofreciendo previsiones de cuantiles nativas, y no al revés.

Lecturas adicionales