00:00:08 Introducción al pronóstico de demanda y la agregación de datos.
00:00:41 Diferentes tipos de granularidades en el pronóstico de demanda.
00:02:00 Desafíos de varios niveles de agregación de datos en el pronóstico.
00:05:28 Nivel desagregado: SKU por día y reconstrucción de otros niveles de agregación.
00:08:31 Casos extremos y desafíos con productos perecederos en el pronóstico de demanda.
00:09:42 Importancia de la información granular en la agregación de datos.
00:11:01 Reconstrucción del nivel deseado de agregación a partir de los datos más granulares.
00:13:01 Limitaciones de las técnicas de series de tiempo en datos muy desagregados.
00:15:01 Técnicas de series de tiempo y la suposición de que el futuro será más de lo mismo.
00:17:00 La naturaleza seductora y engañosa de los modelos de series de tiempo.
00:19:03 Discutiendo las desventajas de la agregación en el pronóstico.
00:20:00 Explorando la importancia de la granularidad en la toma de decisiones.
00:21:38 Examinando horizontes relevantes y su impacto en las decisiones de la cadena de suministro.
00:23:48 Argumentando en contra de la agregación arbitraria y su impacto potencial en la eficiencia de la cadena de suministro.
00:26:35 Sugiriendo un enfoque en la granularidad impulsada por decisiones y evitando la optimización prematura.

Resumen

Joannes Vermorel, fundador de Lokad, analiza la importancia de seleccionar el nivel correcto de agregación de datos para el pronóstico de demanda en una entrevista con Nicole Zint. Se consideran dos dimensiones: temporal y estructural, que incluyen los intervalos de tiempo utilizados para agregar datos y la organización de la cadena de suministro. Vermorel señala que el nivel diario y el nivel de SKU son los más aplicables a la mayoría de las redes de cadena de suministro, pero los casos extremos pueden requerir datos más granulares. Vermorel advierte sobre las limitaciones de los modelos de series de tiempo en el pronóstico de la cadena de suministro, alentando una perspectiva más amplia que considere factores como la perecibilidad, la canibalización, la sustitución y los tiempos de entrega variables. Él enfatiza la importancia de la granularidad impulsada por decisiones y la ampliación de los horizontes de pronóstico más allá de los tiempos de entrega.

Resumen Extendido

En esta entrevista, la presentadora Nicole Zint discute el pronóstico de demanda y el nivel adecuado de agregación de datos con Joannes Vermorel, el fundador de Lokad, una empresa de software especializada en optimización de la cadena de suministro. Exploran los diferentes tipos de granularidades en el pronóstico de demanda y el impacto de estas granularidades en los métodos de pronóstico.

Vermorel explica que hay dos dimensiones principales a considerar al elegir la granularidad para el pronóstico de demanda: temporal y estructural. La dimensión temporal se refiere a los intervalos de tiempo utilizados para agregar los datos, como por hora, diario, semanal, mensual o anual. La dimensión estructural se relaciona con la organización de la cadena de suministro, incluyendo categorías de productos y ubicaciones. Esto podría implicar la agregación de datos por SKU (Stock Keeping Unit), referencia de producto, familia de productos, super familia de productos o categoría, y luego la agregación por sitio, región o país.

Al discutir los tipos de pronósticos asociados con estas granularidades, Vermorel menciona que el concepto de inteligencia de negocios, o hipercubos, popularizado en la década de 1990, es relevante. Los datos históricos se pueden representar como vectores, siendo cada nivel de granularidad un vector único. Cuando se agrega una dimensión de tiempo, estos vectores se pueden interpretar como datos de series temporales, que luego se pueden utilizar para el pronóstico.

Este enfoque se ocupa principalmente de los pronósticos de series temporales, que son la práctica principal en la industria. Vermorel señala que puede haber múltiples pronósticos generados a partir de los mismos datos debido a la variedad de niveles de agregación potenciales.

La entrevista también aborda el término técnico “equispaced” en relación con las series temporales. Las series temporales equiespaciadas tienen intervalos regulares y uniformes entre los puntos de datos. Vermorel reconoce que la mayoría de las personas en la industria de la cadena de suministro pueden no haber considerado trabajar con series temporales no equiespaciadas, ya que las series temporales equiespaciadas son más comunes. Sin embargo, señala que algunos intervalos, como los meses, no son precisamente regulares en el sentido físico, ya que los meses tienen longitudes variables.

Este segmento de la entrevista se centra en la importancia de seleccionar la granularidad adecuada para el pronóstico de demanda. Hay dos dimensiones principales a considerar: temporal y estructural. Se pueden generar varios tipos de pronósticos a partir de los mismos datos según la granularidad elegida, siendo los pronósticos de series temporales los más comunes en la industria. Además, se discute el concepto de series temporales equiespaciadas, destacando las posibles complejidades al tratar con intervalos de tiempo variables.

Vermorel habla sobre los horizontes temporales de pronóstico, la granularidad impulsada por decisiones y la importancia de no limitar el pensamiento cuando se trata de la gestión de la cadena de suministro.

Discuten los desafíos de los niveles de agregación de datos en la optimización de la cadena de suministro. Vermorel explica que la elección del nivel de agregación depende de la sensibilidad de la industria, ya que algunas industrias pueden requerir una mayor desagregación. También destaca que el nivel diario y el nivel de SKU son los niveles de desagregación más sensatos para la mayoría de las redes de cadena de suministro. Sin embargo, señala que casos excepcionales, como los productos perecederos, pueden requerir puntos de datos más granulares. Vermorel enfatiza que cada decisión arbitraria sobre la agregación de datos tiene pros y contras, y es crucial comprender de dónde provienen esas decisiones. Cuando se le pregunta si se podría reconstruir un nivel de datos más granular a partir del nivel más granular, Vermorel explica que cada vez que se agregan datos, se pierde información. Por lo tanto, cuanto más granulares sean los datos, más preciso será el pronóstico. Sin embargo, los datos más granulares no son datos agregados, sino datos transaccionales en bruto. Explica que la razón por la que las personas se detienen en el nivel de SKU por día es que es el último nivel en el que aún pueden operar con series temporales. Si van más allá de eso, tendrían que renunciar a la perspectiva de series temporales, ya que los datos no están estructurados como una serie temporal.

También discutieron las limitaciones de los modelos de series temporales en la previsión de la cadena de suministro con la presentadora Nicole Zint. Vermorel señala que aunque la industria de la cadena de suministro opera típicamente con un modelo mental de series temporales, las técnicas de series temporales tienden a tener un rendimiento deficiente en datos dispersos, erráticos e intermitentes. Argumenta que hay una asimetría fundamental entre el pasado y el futuro, y que la suposición de que el futuro es exactamente igual al pasado es equivocada. Vermorel también cuestiona la práctica de la agregación de datos, que según él resulta en la pérdida de datos y métricas desalineadas, y sugiere que el único horizonte relevante para la toma de decisiones es el que es relevante para la decisión específica.

Vermorel comienza explicando que los horizontes temporales para la previsión deben extenderse más allá de los tiempos de entrega, ya que no siempre encajan bien con la perspectiva tradicional de series temporales. Argumenta que el horizonte de toma de decisiones debe considerar no solo el período entre ahora y la llegada de un producto, sino también el tiempo que lleva vender los bienes recibidos. El horizonte aplicable depende de factores como la velocidad esperada de liquidación del stock y la variabilidad de la demanda. Si bien no hay un límite claro de hasta qué punto se debe mirar hacia el futuro, Vermorel reconoce que las previsiones se vuelven más difusas a medida que se alejan. En última instancia, el compromiso radica en equilibrar el costo de los recursos informáticos con las posibles mejoras en la cadena de suministro.

Al discutir la granularidad, Vermorel enfatiza que esta debe estar impulsada por las decisiones que una empresa desea tomar. Aconseja no confundir la necesidad de visualización con otros requisitos predictivos y de optimización, ya que la granularidad puede ser arbitraria y puede llevar a la pérdida de datos. En cambio, recomienda centrarse en decisiones que tengan impactos tangibles y financieros en la cadena de suministro, como el reabastecimiento o el ajuste de precios.

Vermorel advierte contra obsesionarse demasiado con los niveles de agregación, que considera un aspecto altamente técnico del problema. Los sistemas informáticos modernos tienen más que suficiente capacidad para manejar varios niveles de granularidad, y no es necesario imponer restricciones arbitrarias en el pensamiento. En el pasado, la agregación de datos para la visualización era un desafío, pero los sistemas modernos pueden manejarlo fácilmente, incluso hasta la granularidad de milisegundos.

El entrevistado también advierte contra confiar únicamente en enfoques tradicionales de cubo de datos para la optimización de la cadena de suministro. Asegura que hacerlo puede imponer restricciones innecesarias y limitar el alcance de las soluciones potenciales. Factores como la perecibilidad, la canibalización, la sustitución y los tiempos de entrega variables deben tenerse en cuenta para tener una visión más completa de la cadena de suministro. Vermorel fomenta una perspectiva más amplia y evitar restricciones arbitrarias que puedan dificultar la resolución de problemas en la gestión de la cadena de suministro.

En resumen, Joannes Vermorel aboga por considerar una gama más amplia de factores al optimizar las cadenas de suministro, ampliar los horizontes de previsión más allá de los tiempos de entrega y adoptar una granularidad impulsada por decisiones. Enfatiza la importancia de no limitar el pensamiento y aprovechar los sistemas informáticos modernos para abordar de manera efectiva los complejos problemas de la cadena de suministro.

Transcripción completa

Nicole Zint: Cuando se trata de la previsión de la demanda, hay una increíble diversidad de diferentes métodos y niveles de agregación de datos que se eligen tanto entre las empresas como dentro de ellas. Algunos hacen previsiones diarias, otros semanales, mensuales o anuales. Algunos hacen previsiones a nivel de SKU, otros a nivel de categoría. Esto plantea la pregunta, ¿cuál es el nivel correcto de agregación de datos? Este es el tema del episodio de hoy. Antes de adentrarnos en la respuesta a esta pregunta, Joannes, ¿cuáles son los diferentes tipos de granularidad para elegir en la previsión de la demanda?

Joannes Vermorel: En la previsión de la demanda, básicamente tienes dos dimensiones principales en el problema. La primera es temporal, que se refiere a si deseas que tus datos transaccionales se agreguen a nivel horario, diario, semanal, mensual o anual. La otra dimensión es típicamente la topología del producto/cadena de suministro, por lo que puedes elegir agregar por SKU, por referencia de producto, por familia de productos, super familia, categoría, etc. También tienes tus ubicaciones donde puedes querer agregar por sitio, por región o por país. Las dos dimensiones principales son el tiempo y la estructura de tu catálogo/red de cadena de suministro, lo que crea una matriz de posibilidades cuando se trata de elegir la granularidad.

Nicole Zint: Cuando hablamos de estas granularidades, ¿de qué tipo de pronósticos estamos hablando? ¿Hay algún tipo específico de pronóstico?

Joannes Vermorel: Lo que tienes es un concepto que se popularizó en los años 90, básicamente bajo el nombre de inteligencia empresarial o hipercubos. Lo que tienes es una forma de representar tus datos históricos como vectores. Eliges un nivel de granularidad, digamos por SKU por semana, y luego para cada SKU individual a nivel semanal, tienes un vector de valores que, debido a la dimensión temporal, se puede interpretar como una serie temporal. Luego puedes pronosticar esta serie temporal en el futuro. Debido a los muchos niveles de agregación potenciales, puede haber muchos pronósticos que se pueden hacer sobre los mismos datos. Entonces, cuando discutimos este problema, estamos hablando de pronósticos de series temporales, al menos esta es una práctica común en la industria.

Nicole Zint: ¿Qué pasa con la línea de tiempo en la serie temporal, están todas equiespaciadas o hay un enfoque diferente?

Joannes Vermorel: “Equispaciado” es un término técnico muy específico, con el que la mayoría de las personas en la industria de la cadena de suministro probablemente nunca hayan considerado trabajar. El equiespacio es una tecnicidad donde dices que tu serie temporal se divide en cubetas que son completamente regulares. Sin embargo, ten en cuenta que esto es un poco una abstracción porque, por ejemplo, los meses no son exactamente regulares en el sentido físico. Los físicos dirían que hay meses que son más largos que otros, por lo que solo es regular según nuestro calendario.

Nicole Zint: Otra pregunta cuando se trata de un mes: tenemos diferentes números de, digamos, viernes o fines de semana en un mes, y si vemos picos en las ventas los viernes, ¿no se verán afectados?

Joannes Vermorel: Aquí estamos llegando a la pregunta: ¿Qué nivel de agregación elijo? Pueden surgir muchas preocupaciones. Obviamente, hay algunos niveles de agregación que tienen ciertos efectos. Si estás mirando a nivel horario, puede ser, para la mayoría de las industrias, increíblemente desagregado y puede que ni siquiera tenga sentido durante la noche porque tal vez hay muchas áreas donde, digamos, el comercio minorista, donde no sucede nada durante la noche. Entonces, puede que ni siquiera tenga sentido.

Luego, de hecho, si eliges la agregación mensual, siempre es complicado porque tienes el hecho de que algunos meses tienen cinco días de un determinado día de la semana, y puedes tener cuatro o cinco. Por lo tanto, ese es un aspecto complicado que realmente introducirá algún tipo de sesgo en la forma en que miras este registro y potencialmente en la forma en que construyes tu pronóstico. Pero también es cierto para otras dimensiones, como si estás mirando por SKU o por producto o por categoría. Todas estas introducen preocupaciones propias.

Nicole Zint: Entonces, cuando se trata de estos diferentes niveles de agregación de datos, ¿no podemos simplemente elegir técnicamente, por ejemplo, SKU por día, que es el nivel más desagregado, y luego reconstruir esencialmente cualquier otro nivel de agregación a partir de eso?

Joannes Vermorel: Primero, sí, hay esta tentación de ir a niveles súper desagregados. En la cadena de suministro, el nivel más sensato de desagregación, en términos de tiempo, es por día. Sin embargo, es una decisión bastante arbitraria. Podríamos haber decidido que era por minuto, y por ejemplo, si estás dirigiendo un centro de llamadas y quieres ver tu tasa de llegada de llamadas entrantes, vas a tener un nivel de observación mucho más granular para las llamadas entrantes. Entonces, esto realmente se trata de qué tipo de cosas tienen sentido para la situación general en la cadena de suministro.

Ahora, si retrocedemos un poco en el tiempo, tenemos que entender un poco de dónde venimos. Echemos un vistazo a una tienda típica con 10,000 SKU en una red minorista típica con 100 tiendas. Entonces, ni siquiera es una red minorista muy grande. Estamos hablando de 10,000 veces 100, lo que equivale a 1 millón de SKU, y luego datos diarios. Entonces, si queremos tener tres años de historial, estamos hablando de mil días. Entonces, estamos hablando de mil millones de puntos de datos. Para representar los datos agregados diarios a nivel de SKU en una red minorista modesta, ya estamos hablando de algo que son mil millones de puntos de datos.

En una computadora, eso ya serían cuatro gigabytes de memoria. Cuando retrocedes un poco en el tiempo, verás que este tipo de capacidad de memoria ni siquiera era accesible antes de los años 90. Por cierto, el término “inteligencia empresarial” como una clase de herramientas de software empresarial surgió en los años 90, precisamente cuando las computadoras de tamaño gigabyte llegaron al mercado. Entonces, las dos cosas iban de la mano. Necesitabas computadoras que pudieran representar cantidades tan grandes de datos.

Nicole Zint: Entonces, esos grandes cubos eran en realidad software diseñado para la computación en memoria, que era simplemente una forma grandiosa de decir aprovechemos esta nueva memoria de acceso aleatorio. Y en base a eso, se convierte en el valor predeterminado, aunque no debemos olvidar que fue bastante arbitrario. Cuando dices que es el nivel más pequeño que tiene sentido para las cadenas de suministro, ¿es precisa esta agregación diaria y nivel de SKU?

Joannes Vermorel: Sí, pero tienes muchos casos particulares. Por ejemplo, si tienes un producto perecedero, la pregunta es si la agregación por día por SKU es suficiente para darte una imagen precisa de tu nivel de stock. Si estás mirando un producto perecedero, la respuesta es no. Puedes tener 10 unidades en stock, pero si 9 de las 10 unidades van a caducar mañana, lo que realmente tienes en stock es principalmente una unidad más nueve que están a punto de desaparecer. Entonces, en este caso, el nivel de stock no es lo suficientemente granular y el nivel de SKU no es lo suficientemente granular. Lo que te gustaría tener sería un nivel de stock con al menos una semana de vida útil y tal vez un nivel de stock con al menos un mes de vida útil. Entonces, introducirías otra dimensión para tener una mejor intuición.

Nicole Zint: Y ¿qué pasa con el tiempo? ¿El nivel diario está bien o deberíamos considerar un nivel más granular?

Joannes Vermorel: El nivel diario podría estar bien, excepto que podría haber tiendas que solo están abiertas, digamos, durante el fin de semana o solo por la mañana. Si no sabes que tienes una tienda que solo está abierta medio día, te falta información. Entonces, tal vez tener un nivel más granular, como la mañana y la tarde, te daría algo más valioso. Cada decisión arbitraria sobre tu nivel de agregación tiene sus pros y sus contras. Mi mensaje aquí es que es bastante arbitrario y no hay una gran verdad en eso, pero es muy interesante entender de dónde vienen esas decisiones.

Nicole Zint: Digamos que encontramos el nivel más granular que está dentro de nuestra razonabilidad de precio. Si tenemos acceso al nivel más granular pero aún queremos ver un pronóstico semanal, por ejemplo, ¿podemos simplemente reconstruir el nivel que queremos obtener simplemente a partir del nivel más granular?

Joannes Vermorel: Absolutamente. Si volvemos al historial transaccional en bruto, cada vez que agregas, pierdes datos en términos de información. No importa qué tipo de agregación estés realizando, siempre puedes reconstruir un nivel superior a partir de los datos más granulares.

Nicole Zint: En realidad, este es un proceso de pérdida, por lo que estás perdiendo información. Por lo tanto, tienes menos información, por lo que tendría sentido que la precisión disminuya, ¿verdad? Cuanto mayor sea la agregación, menos precisa se vuelve.

Joannes Vermorel: Sí, pero lo que tenemos es que esta fue la razón principal por la que queremos tener este tipo de configuración de agregación. Diría que está impulsado por el cubo porque tenemos el tipo de software que opera relativamente rápido. La idea es que cuando tienes un hipercubo, las operaciones de corte y corte se pueden hacer de manera muy eficiente. Esta es una razón muy técnica. Por lo tanto, si quieres pasar de diario a semanal, es una operación muy eficiente que puedes hacer en el cubo.

De hecho, en términos de teoría de la información pura, cada vez que pasamos a un nivel más agregado, estamos perdiendo información. Entonces, en teoría, si queremos tener algo que sea una declaración más precisa sobre el futuro, querríamos operar en los datos más desagregados. Sin embargo, la gente pensaría que los datos más desagregados serían los datos por SKU por día, y yo diría, espera, los datos más desagregados ni siquiera son datos agregados en absoluto. Eso sería el historial transaccional en bruto.

La razón por la que las personas se detienen en por SKU por día es esencialmente porque es el último nivel en el que aún estás operando con series de tiempo. Si quieres ir más allá de eso y lidiar con el historial de transacciones en bruto, entonces, esencialmente, tienes que renunciar a la perspectiva de la serie de tiempo. ¿Por qué? Porque los datos no están estructurados como una serie de tiempo. Es literalmente datos relacionales, por lo que tienes tablas en tu base de datos. Ya no está estructurado como una serie de tiempo, ciertamente no como una serie de tiempo equiespaciada.

Las series de tiempo solo surgen cuando esencialmente construyes vectores donde dices, por período (el período puede ser un día, una semana o un mes), tienes una cantidad, y luego tienes un vector de cantidades. Quieres ampliar esto con un modelo de series de tiempo. Si operas solo con una tabla con, digamos, 100 columnas, esto no es una serie de tiempo; esto es solo una tabla relacional en una base de datos. Esto es muy común, pero no es la serie de tiempo. Es el método de pronóstico elegido en sí mismo el que ahora es otro factor limitante.

La pregunta es, ¿por qué es tan atractivo? La respuesta es que la mayoría de las industrias de la cadena de suministro operan con un modelo mental de series de tiempo. Entonces, obviamente, si has decidido que todo tiene que ajustarse al modelo de series de tiempo, entonces el hipercubo es un factor muy atractivo porque todo lo que estás mirando, siempre y cuando una de las dimensiones sea el tiempo, siempre estás mirando series de tiempo de una forma u otra en varios niveles de agregación.

Pero aquí está el meollo de la cuestión. Aunque, en teoría, la teoría de la información nos diría que cuanto más desagregamos, más información tenemos y, por lo tanto, más podemos saber sobre el futuro. La realidad es que las técnicas de series de tiempo, la mayoría de ellas, no todas, tienden a funcionar muy mal con datos muy dispersos, erráticos e intermitentes. El problema es que cuando te adentras en datos muy desagregados, las técnicas de series de tiempo son menos efectivas.

Nicole Zint: Desde tu perspectiva de tu técnica de series de tiempo, no desde la perspectiva real, la perspectiva real es que tienes más datos, pero desde la perspectiva de tu técnica de series de tiempo, tienes un vector que es más disperso y más disperso, por lo tanto, más ceros. Y las series de tiempo se tratan de más de lo mismo, ¿verdad? Así que asumimos que el futuro es simétrico al pasado. ¿Es ahí donde viene?

Joannes Vermorel: Sí, pero esto es cierto para todos los métodos basados en datos. Así que todos los métodos basados en datos básicamente se basan, de una forma u otra, en la idea de que el futuro será más de lo mismo. Verás, no depende realmente, puedes decir que es machine learning, IA, series de tiempo, lo que sea, siempre es la misma idea. Todos nuestros métodos estadísticos se basan en la idea de que el futuro será más de lo mismo en comparación con el pasado.

Nicole Zint: Pero seguramente, si te vuelves más granular, pierdes tal vez las estacionalidades y cosas así, ¿verdad?

Joannes Vermorel: No, la característica de la serie de tiempo es muy técnica. Es el hecho de que el modelo de series de tiempo te da un modelo altamente simétrico en el sentido de que el futuro, en términos de estructura de datos, se ve exactamente igual que el pasado. Esto es algo muy específico de las series de tiempo. Cuando dices más de lo mismo, sí, pero hago una afirmación sobre el futuro. Esta afirmación no tiene que tener la forma, la forma y el formato exactos en comparación con mis registros históricos. Así que puede ser, pero puede que no.

Con las series de tiempo, es increíblemente seductor, pero creo que también engaña mucho a la gente. Es increíblemente seductor porque esencialmente el futuro y el pasado son exactamente simétricos. Y cuando digo exactamente simétricos, imagina tu hipercubo o tu cubo. Tienes una dimensión para los SKU, una dimensión para el día, una dimensión para algo más, y esencialmente el futuro es simplemente tomar tu dimensión para el día y extender esta dimensión en, digamos, 100 celdas más.

Y luego, aquí está, tienes el futuro, y luego dirías que el pronóstico es simplemente rellenarlo, rellenar los espacios en blanco. Literalmente, dirías que son los mismos datos; hay datos que he observado y luego datos donde voy a completar los espacios en blanco con mi modelo de pronóstico de series de tiempo. Sin embargo, hay una asimetría muy radical y fundamental entre el pasado y el futuro.

Si optas por esta perspectiva clásica de pronóstico promedio de series de tiempo, estás haciendo algo que pretende que el futuro sea exactamente igual que el pasado, en términos de naturaleza, no solo el hecho de que aún no ha sucedido. Literalmente, en cuanto al formato de los datos, en cuanto a cómo pensar en ello, estás diciendo que es completamente igual. Y mi propuesta, que es más una declaración filosófica que científica, es que no, no lo es, es muy diferente.

Nicole Zint: Aún veo muchas solicitudes de propuestas (RFP, por sus siglas en inglés), y le preguntan a los proveedores, ¿pueden darnos todos estos niveles a la vez? Diferentes niveles de agregación, ¿por qué?

Joannes Vermorel: Nuevamente, es una pregunta estándar. La gente insiste en esto porque es lo que están acostumbrados, pero es importante reconocer que diferentes niveles de agregación pueden llevar a resultados e ideas muy diferentes.

Nicole Zint: La falacia aquí es que comienzas con este modelo de series de tiempo, y este modelo de series de tiempo tiene su contraparte en la industria del software con la inteligencia empresarial, donde todo es básicamente un cubo o una versión que se corta o se divide de un cubo. Ahora, la gente se da cuenta de que pierde información cuando va, pero de alguna manera no está realmente segura de por qué. La métrica les dice que su pronóstico muy desagregado es una basura completa. La realidad podría ser que simplemente no están utilizando el método correcto, de hecho, es muy pobre.

Joannes Vermorel: Entonces dicen: “Ok, nuestro pronóstico es muy pobre”. Yo digo: “Bueno, necesitamos la posibilidad de subir a un nivel de agregación más alto. Tal vez sea por semana o tal vez por producto en lugar de por SKU”. Pero no saben cuál quieren elegir. Entonces, cuando le preguntan a un proveedor, quieren mantener sus opciones abiertas, y terminan con RFP semi-ridículas donde tienen más de cien preguntas y quieren tener todos los niveles de agregación.

Simplemente porque desde su perspectiva, están dejando abierta la opción de en qué nivel quieren aplicar el modelo de pronóstico de series de tiempo. Pero aquí, realmente desafío el hecho mismo de por qué deberías incluso agregar tus datos en primer lugar, y por qué tu técnica de pronóstico debería comenzar a descartar datos antes de siquiera comenzar a operar. Estás perdiendo datos, por lo que esto es un problema, y agregar más solo te hace perder más datos.

Y luego, si dices: “Pero espera, no podemos operar a un nivel muy desagregado porque nuestra métrica, que es el porcentaje de error, nos dice que es muy malo”. Decimos: “Sí, pero no estás optimizando el porcentaje de error; quieres optimizar los dólares de error. Pero estás mirando la métrica de porcentajes, por lo que está un poco desalineada con los dólares”.

Nicole Zint: Sí, exactamente. Porque si sigues esta falacia, pasarías de diario a semanal, obtendrías una mejor precisión; luego de semanal a mensual, mejor precisión; luego de semanal a anual. Y luego la gente dice: “Oh, espera, pronóstico anual, ¿qué voy a hacer con el pronóstico anual? Si tomas decisiones semanalmente, ¿cómo te va a ayudar un pronóstico mensual?”

Joannes Vermorel: Ese es el problema. La realidad es que el único horizonte relevante es el que es relevante para tu decisión. Pero veamos una decisión muy simple, como el reabastecimiento de inventario. Danos un ejemplo de cuál es el horizonte relevante. La respuesta es muy complicada. Primero, tendrás los tiempos de entrega, pero los tiempos de entrega no están garantizados. Digamos que tienes un proveedor en el extranjero, por lo que tus tiempos de entrega pueden ser, no es constante, es algo que varía. Entonces, tu tiempo de entrega podría ser algo así como 10 semanas, pero potencialmente con la posibilidad de grandes variaciones.

Algunas de esas variaciones, por cierto, son estacionales, como el Año Nuevo Chino. Las fábricas en China cierran, por lo que obtienes cuatro semanas adicionales de tiempo de entrega. Entonces, tu horizonte, si solo estamos mirando los tiempos de entrega, es algo que varía mucho y necesitaría un pronóstico propio. Por cierto, uno de los problemas con esos modelos de series de tiempo es que siempre estamos mirando algo que es más o menos las ventas. Todo lo demás que necesitas pronosticar, como tus tiempos de entrega, todavía son constantes. Es incluso peor que eso; ni siquiera existen, ¿sabes?

Nicole Zint: Entonces, el cubo ni siquiera representa el tipo de literatura; es algo arbitrariamente elegido. Tu horizonte serían tus tiempos de entrega, pero tus tiempos de entrega merecerían una zona roja de pronóstico que realmente no encaja con esta perspectiva de series de tiempo y software de cubo. Pero, ¿debería tu horizonte para evaluar la validez de tu decisión detenerse solo en el tiempo de entrega?

Joannes Vermorel: No, porque obviamente, si decides que quieres hacer un nuevo pedido ahora, quieres cumplir con la demanda que va a ocurrir entre ahora y la fecha de llegada de tu producto. Pero luego, tendrás que vender lo que acabas de recibir. Para evaluar la relevancia del pedido de compra, debes mirar lo que sucede después. ¿Y qué tan lejos en el futuro deberías mirar? Bueno, depende. Si el pedido que realizas tiene un aumento repentino de la demanda, es posible que realmente recibas los productos y los vendas en dos días. Pero ¿qué pasa si es lo contrario y luego tienes una caída en la demanda? Puedes mantener el stock durante todo un año, obviamente no si es perecedero, pero solo estoy simplificando.

Entonces, el horizonte que es aplicable es algo que depende increíblemente de cómo miras el futuro, y es un pronóstico propio porque es un pronóstico en el que tienes que predecir los tiempos de entrega. Y luego, el horizonte que debemos considerar, incluso si solo estamos mirando la demanda, depende de qué tan rápido esperas liquidar tu stock. Por lo tanto, en última instancia, no hay un límite claro en términos del horizonte aplicable para tu pronóstico. La única preocupación es que cuanto más miramos hacia el futuro, más borroso se vuelve el pronóstico.

Sin embargo, esto es una cuestión técnica y, en algún momento, hay un equilibrio en términos del costo de la CPU versus la mejora marginal potencial para tu cadena de suministro. Pero, ya ves, desde una perspectiva conceptual, no hay límite en cuánto quieres mirar hacia el futuro.

Nicole Zint: Entonces, para concluir, el nivel de granularidad siempre debe estar en el nivel de las decisiones que deseas tomar.

Joannes Vermorel: Sí, diría que tu granularidad va a estar muy impulsada por las decisiones. Pero ten en cuenta que esta noción de tener que agregar hace una suposición sobre el tipo de método que deseas utilizar. Mi sugerencia sería que te centres en la propia decisión que tomas. Las decisiones son las cosas que tienen un impacto tangible en tu cadena de suministro, como tu reordenamiento, subir o bajar el precio y otras acciones que tienen un impacto financiero real en la cadena de suministro. Pero luego, diría que tengas cuidado con la noción misma de granularidad. Esto es muy inventado, muy arbitrario, y no confundas tu necesidad de visualización, que está bien, quieres poder visualizar, con la granularidad que se necesita para la toma de decisiones.

Nicole Zint: Las series de tiempo son una herramienta increíblemente poderosa para visualizar datos. Sin embargo, no confundas esta necesidad de visualización con otros requisitos predictivos y de optimización que no tienen que operar con ningún tipo de granularidad inventada. Cuando digo granularidad inventada, me refiero a cualquier cosa que no sea simplemente el reflejo de los datos tal como existen en tus sistemas empresariales. Cualquier tipo de agregación que agregues va a perder datos.

Joannes Vermorel: Tal vez sea un buen equilibrio en el sentido de que tal vez al agregar, ahorrarás CPU o memoria, pero tal vez no. Esta es una discusión súper técnica y mi sugerencia sería no hacer una especie de optimización prematura. Trata de no pensar de inmediato en esos niveles de agregación como si fueran problemas difíciles; en su mayoría son problemas fáciles cuando se trata de visualización. Con los sistemas informáticos modernos, es muy fácil tener un exceso de capacidades en relación a tus necesidades reales.

En los años 90, era un desafío agregar datos por día, pero hoy en día no lo es. Si hay un proveedor que te dice que tienen un límite de cinco años de historial, esto es simplemente extraño. No hay tal limitación. Hay muchas formas en las que podemos lidiar con cualquier tipo de granularidad, incluso hasta el milisegundo. Sin embargo, no es necesariamente algo que sea súper sensato, y no quieres hacer eso con un cubo real donde estás usando un byte de memoria para cada celda en tu cubo. Este es un aspecto muy técnico.

Los sistemas modernos te darán cualquier tipo de agregación que necesites y más. Esto no es una limitación. No razonemos por implicación, tratando de pensar en todas las técnicas que deseas utilizar basadas en este cubo, como si fuera la única forma de ver el problema. No lo es. Hay muchas cosas que se pierden, como la perecibilidad, la canibalización, la sustitución y los tiempos de entrega variables. El hecho de enmarcar todo en un cubo impone restricciones enormes en lo que puedes pensar incluso sobre tu cadena de suministro, y esto es algo malo. Mi sugerencia es no encerrar tu mente en una jaula. Solo trata de tener una perspectiva amplia porque hay muchas más restricciones arbitrarias que no ayudan a resolver los problemas de tu cadena de suministro.

Nicole Zint: Muchas gracias, Joannes, por compartir tus ideas sobre este tema. Gracias por ver y nos vemos la próxima semana.