Las 10 rarezas en la previsión de la demanda
La previsión estadística es un campo altamente contra intuitivo. Y la mayoría de las suposiciones que pueden parecer intuitivas a primera vista, resultan ser completamente incorrectas. En esta publicación, compilamos una breve lista de los peores infractores entre todas las rarezas estadísticas que son el pan y la mantequilla del negocio de Lokad.
1. Los sistemas de previsión avanzada NO aprenden de sus errores
Los sistemas de previsión generalmente actualizan sus pronósticos diaria o semanalmente. Cada vez que se produce un nuevo lote de pronósticos, un sistema de previsión tiene la oportunidad de comparar sus pronósticos anteriores con los datos recién adquiridos y posiblemente aprender de esto. Como resultado, parecería muy razonable esperar que cualquier sistema de previsión dado aprenda de sus errores, al igual que lo haría un experto humano. Sin embargo, este no es el caso. Un sistema de previsión avanzada NO intentará aprender de sus errores. De hecho, existen mejores métodos disponibles, como backtesting, que ofrecen un rendimiento estadístico superior. Con el backtesting, el sistema se desafía a sí mismo contra toda la historia disponible cada vez que se genera un pronóstico, no solo contra el último incremento de datos.
2. Los factores estadísticos más importantes son el ruido y la aleatoriedad
Cuando se les pregunta a los profesionales sobre los factores dominantes en su demanda, muchos responden: estacionalidad, ciclo de vida del producto, presión del mercado, crecimiento empresarial, etc. Sin embargo, la mayoría de las veces, hay un elefante en la habitación: el elefante es el ruido estadístico que se encuentra en la observación de la demanda.
La mayoría de las veces, el desafío de la previsión se aborda como si, con suficientes esfuerzos, se pudieran hacer pronósticos precisos de la demanda. Sin embargo, este punto de vista es incorrecto, ya que la mayoría de las veces los pronósticos son inherentemente inexactos. Aceptar la aleatoriedad que se encuentra en la demanda generalmente produce mejores resultados comerciales que tratar de eliminar esta aleatoriedad.
3. Las correcciones de expertos generalmente hacen que los pronósticos sean menos satisfactorios
Si bien parece razonable ajustar manualmente los pronósticos estadísticos con conocimientos específicos de la industria, hemos observado, en muchas ocasiones, que esta práctica no produce los resultados deseados. Incluso cuando las correcciones manuales son realizadas por un experto en este campo, tienden a degradar la precisión general, a menos que los sistemas de pronóstico subyacentes sean inherentemente deficientes. Solo en este caso, las correcciones manuales pueden ayudar a mejorar los resultados del pronóstico.
Esto está relacionado con el hecho de que la percepción humana está fuertemente sesgada hacia la percepción de “patrones”. Con frecuencia, esto lleva a percepciones falsas de tendencias, que no son más que fluctuaciones comerciales aleatorias. Interpretar erróneamente la aleatoriedad como un “patrón” tiende a generar errores mucho más significativos que simplemente ignorar el patrón en primer lugar y tratarlo como un simple ruido.
4. El error de pronóstico debe medirse en dólares
Un pronóstico más preciso no se traduce necesariamente en mejores resultados comerciales. De hecho, la forma clásica de ver los pronósticos consiste en optimizar métricas como el MAPE (error porcentual absoluto medio) que solo están débilmente correlacionadas con los principales intereses comerciales. Estas métricas son engañosas porque se originan en un pensamiento bastante ilusorio de que si los pronósticos fueran perfectamente precisos, entonces el error del MAPE sería cero. Sin embargo, un pronóstico perfectamente preciso no es un escenario razonable, y el objetivo principal de utilizar una métrica de rendimiento es que esté alineada con los intereses de cualquier negocio dado. En otras palabras, el error de pronóstico debe expresarse en dólares, no en porcentajes. Los pronósticos diarios, semanales y mensuales no son consistentes.
Si se producen pronósticos tanto diarios como semanales, sería muy razonable esperar que si los pronósticos diarios se suman en pronósticos semanales, ambos pronósticos converjan en los mismos valores, dado que se ha utilizado la misma tecnología y la misma configuración para generar los dos conjuntos de pronósticos en cuestión.
Desafortunadamente, esto no es cierto y los dos conjuntos de pronósticos divergirán; y por razones estadísticas muy sólidas también. En resumen, los pronósticos diarios (resp. semanales) se optimizan en función de una métrica expresada a nivel diario (resp. semanal); estadísticamente, como estas dos métricas son diferentes, las salidas numéricas de la optimización numérica simplemente no tienen motivo para coincidir.
5. Los pronósticos a nivel de SKU no coinciden con los pronósticos a nivel de categoría
Si se utiliza el mismo sistema de pronóstico para pronosticar la demanda tanto a nivel de SKU como a nivel de categoría, se esperaría que los dos conjuntos de pronósticos sean consistentes: al sumar todos los pronósticos asociados con los SKU que pertenecen a una categoría determinada, no sería irrazonable imaginar que se obtenga el mismo número que el pronóstico relacionado con la categoría en sí. Esto será el caso por las mismas razones que las expuestas en el párrafo anterior.
Aún más alarmante, en realidad es muy común observar situaciones bastante extrañas donde existen patrones completamente divergentes entre los pronósticos a nivel de SKU y a nivel de categoría. Por ejemplo, todos los pronósticos de SKU podrían ser estrictamente decrecientes, mientras que los pronósticos a nivel de categoría están aumentando constantemente. Otro caso típico es la estacionalidad, que es muy visible a nivel de categoría, pero apenas perceptible a nivel de SKU. Cuando surge una situación similar, puede ser tentador intentar corregir los pronósticos a nivel de SKU para alinearlos con los pronósticos de categoría, pero tal técnica solo degradaría la precisión general del pronóstico.
6. Cambiar la unidad de medida sí importa
A primera vista, la unidad utilizada para medir la demanda no debería tener ningún impacto. Si la demanda se cuenta en unidades de inventario, y si todos los puntos en el historial se multiplican por 10, entonces se esperaría que todos los pronósticos se multipliquen por 10 sin ninguna consecuencia adicional. Sin embargo, con tecnología como la desarrollada por Lokad, el proceso de pronóstico no ocurrirá de esta manera, al menos, no exactamente de esta manera.
De hecho, una tecnología avanzada de pronóstico de demanda aprovecha muchos trucos utilizando números pequeños. La cantidad de 1 no es solo cualquier cantidad. Por ejemplo, hemos observado que, en promedio, los recibos de supermercados e hipermercados vienen con más del 75% de sus líneas con una cantidad igual a 1. Esto resulta en muchos trucos estadísticos relacionados con “números pequeños”. Multiplicar cualquier historial de demanda dado por 10 solo confundiría todas las heurísticas implementadas en cualquier sistema de pronóstico de comercio avanzado.
7. Los mejores pronósticos de promoción se generan con frecuencia cuando se ignoran las promociones
Pronosticar las promociones es difícil, realmente difícil. En el comercio minorista, no solo la respuesta de la demanda a una promoción puede ir desde nada (sin aumento) hasta un aumento de 100 veces, sino que los factores que influyen en las promociones son complejos, diversos y generalmente no se rastrean con precisión en los sistemas de TI. Combinar comportamientos comerciales complejos con datos inexactos es una receta que probablemente conduzca a un problema de “Basura entra, basura sale”.
De hecho, hemos observado rutinariamente que descartar los datos promocionales era, al menos como enfoque inicial muy humilde, la forma menos eficiente de pronosticar la demanda promocional. No afirmamos que este método sea altamente satisfactorio u óptimo, pero simplemente estamos tratando de demostrar que un pronóstico nativo construido sobre datos históricos correctos pero incompletos generalmente supera a modelos complejos construidos sobre datos más extensos pero parcialmente inexactos.
8. Cuanto más errática sea la historia, más “plano” será el pronóstico
Visualmente, si los datos históricos muestran patrones visuales fuertes, entonces se esperaría que un pronóstico también muestre patrones visuales igualmente fuertes. Sin embargo, cuando los datos históricos muestran variaciones erráticas, esta expectativa no se cumple y ocurre lo contrario: cuanto más errática sea la historia de la demanda, más suaves serán los pronósticos.
Nuevamente, la causa raíz aquí es que la mente humana está orientada hacia la percepción de patrones. Las fluctuaciones erráticas no son patrones (en el sentido estadístico) sino ruido, y un sistema de pronóstico, si está diseñado correctamente, se comporta precisamente como un filtro para ese ruido. Una vez que se elimina el ruido, todo lo que a menudo queda es solo un pronóstico “plano”.
9. Por lo general, los pronósticos diarios, semanales y mensuales son innecesarios
Los pronósticos periódicos están en todas partes, desde noticias comerciales hasta boletines meteorológicos; y sin embargo, rara vez representan una respuesta estadística adecuada a los desafíos comerciales “de la vida real”. El problema con estos pronósticos periódicos radica en el hecho de que, en lugar de abordar directamente la decisión comercial que depende de un futuro incierto, generalmente se aprovechan de alguna manera indirecta para construir la decisión posteriormente.
Una estrategia mucho más efectiva consiste en pensar en las decisiones comerciales como los pronósticos. Al hacerlo, se vuelve mucho más fácil alinear los pronósticos con las necesidades y prioridades comerciales específicas, por ejemplo, medir el error de pronóstico en dólares en lugar de porcentajes como se detalla anteriormente.
10. La mayoría de la literatura sobre pronóstico de inventario es de poca utilidad
Cuando se enfrenta a un tema difícil, es razonable comenzar a explorar este tema investigando los diferentes materiales revisados por pares disponibles en la literatura científica. Especialmente porque hay miles de artículos y documentos disponibles para el lector, en lo que respecta al pronóstico de la demanda y la optimización del inventario.
Sin embargo, hemos encontrado que la casi totalidad de los métodos analizados en dicha literatura simplemente no funcionan. La corrección matemática no se traduce en sabiduría empresarial. Muchos modelos considerados como “clásicos de todos los tiempos” son simplemente disfuncionales. Por ejemplo,
- Las existencias de seguridad son falsas, ya que se basan en suposiciones de distribución normal,
- Las cantidades económicas de pedido (EOQ) son inexactas, ya que se basan en una tarifa fija por pedido que es completamente irrealista,
- Holt-Winters, es un modelo de pronóstico que es bastante inestable numéricamente y requiere demasiada profundidad histórica para ser manejable,
- ARIMA, que es el arquetipo de enfoque impulsado por las matemáticas, es demasiado complicado para obtener resultados insuficientes,
- etc.
Las peculiaridades en el pronóstico de la demanda son (probablemente) innumerables. No dudes en publicar tus propias observaciones en la sección de comentarios a continuación.