00:00:00 Observaciones de apertura por Robert Fildes
00:01:08 Conor Doherty presenta al panel y el tema
00:03:11 La perspectiva de Nicolas Vandeput
00:06:16 La presentación de Sven Crone
00:10:34 La perspectiva de Alexey Tikhonov
00:15:01 Necesidad de automatización en la toma de decisiones
00:20:13 Compartir información entre humanos es una pérdida de tiempo
00:25:29 Perspectiva sobre la intervención humana
00:30:23 Evaluando un forecast
00:35:18 Perspectiva financiera y toma de decisiones
00:40:14 Costo de errores de forecast
00:45:43 Automatización y confianza
00:50:27 IA aumentada y sus aplicaciones
00:55:03 Impacto de la IA en traductores humanos
01:00:16 Importancia de una visión clara en la implementación de la IA
01:06:00 Reflexiones finales y el futuro de los planificadores de la demanda
01:11:50 Pregunta del público: forecast para hospitales
01:15:38 Pregunta del público: reducción del sesgo del modelo y humano

Antecedentes del panel

El panel fue propuesto inicialmente por Robert Fildes (Profesor Emérito de Lancaster University) en respuesta al artículo de Conor criticando FVA. Este artículo fue republicado en la edición Q2 2024 de Foresight (producida por The International Institute of Forecasters, la misma organización que organiza el simposio). Posteriormente, el panel se amplió para incluir a Sven Crone, Nicolas Vandeput y Alexey Tikhonov, con el fin de ofrecer un abanico más equilibrado de perspectivas tanto de la academia como de la industria.

Resumen de la discusión del panel

Grabado en julio de 2024 en el 44º Simposio Internacional sobre Forecasting en Dijon, el panel de cuatro ponentes discutió “Planificación de la Demanda y el Rol del Juicio en el Nuevo Mundo de la IA/ML”. Moderado por el Jefe de Comunicación de Lokad, Conor Doherty, el panel incluyó a Alexey Tikhonov (Lokad), Sven Crone (Lancaster University & iqast) y Nicolas Vandeput (SupChains). La discusión giró en torno a la integración de la IA en la planificación de la demanda, el valor del forecast en toma de decisiones, y el futuro de planificadores de la demanda. Los panelistas compartieron diversas opiniones sobre el rol del juicio humano en la planificación de la demanda, el potencial de la IA para reemplazar a los planificadores de la demanda, y la importancia de la precisión en el forecast.

Resumen Extendido

El 44º Simposio Internacional sobre Forecasting en Dijon, Francia, organizado por el International Institute of Forecasters, presentó un panel de discusión sobre “Planificación de la Demanda y el Rol del Juicio en el Nuevo Mundo de la IA/ML”. La discusión fue moderada por Conor Doherty de Lokad, y los panelistas incluyeron a Alexey Tikhonov de Lokad, Sven Crone de iqast y Nicolas Vandeput de SupChains. La sesión fue presentada por Robert Fildes, Profesor Emérito en Lancaster University.

La discusión comenzó con Nicolas Vandeput exponiendo su visión para la planificación de la demanda en la era del machine learning. Propuso un proceso de cuatro pasos que incluía ver el forecast de la demanda como un juego de información, crear un engine automatizado de machine learning para el forecast de la demanda, permitir que los planificadores de la demanda humanos enriquezcan el forecast con información que no estaba incluida en el modelo, y hacer seguimiento al valor agregado por todos los involucrados en el proceso.

Sven Crone compartió su experiencia en IA y forecast, señalando la lenta adopción de la IA en la planificación de la demanda. Comentó las complejidades de integrar la IA en los procesos de planificación de la demanda y sugirió que la IA podría potencialmente reemplazar a los planificadores de la demanda en el futuro. Sin embargo, también destacó la heterogeneidad del forecast, ya que diferentes industrias requieren enfoques distintos.

Alexey Tikhonov sostenía que la planificación de la demanda es un enfoque obsoleto y que las intervenciones de forecast basadas en el juicio son una pérdida de tiempo. Abogó por el forecast probabilístico, que captura el patrón estructural del riesgo, y criticó la planificación de la demanda por su falta de perspectiva económica y automatización. Además, argumentó a favor de la automatización completa del proceso de toma de decisiones en los supply chains, afirmando que la complejidad y escala de las decisiones requeridas en los supply chains lo hacen indispensable.

Los panelistas también discutieron el valor del forecast en la toma de decisiones. Nicolas Vandeput enfatizó que los forecast se realizan para facilitar la toma de decisiones y abogó por modelos que puedan procesar la mayor cantidad de información posible. También sugirió que, al evaluar un forecast, él se centraría en la precisión del forecast en lugar de en los resultados comerciales, ya que estos últimos pueden verse influidos por muchos otros factores fuera del control del pronosticador.

Sven Crone discutió la perspectiva industrial de la planificación de la demanda, enfatizando la importancia de las decisiones estratégicas a largo plazo y la planificación basada en escenarios. También destacó los desafíos de medir el valor agregado y la importancia del juicio en el proceso.

Alexey Tikhonov cuestionó el valor de un forecast más preciso si no conduce a una decisión diferente. Argumentó que el valor de una decisión no depende únicamente del forecast, sino también de otros factores como los impulsores de la decisión.

Los panelistas también discutieron la confianza en los forecast, sugiriendo Nicolas Vandeput que la única manera de generar confianza en un forecast, ya sea generado por un humano o por una máquina, es hacer seguimiento a la precisión de cada paso del proceso. Sven Crone coincidió en que la confianza es importante y sugirió que una combinación de IA y métodos simples y transparentes podría utilizarse para automatizar partes del proceso.

Los panelistas también discutieron el futuro de los planificadores de la demanda. Sven Crone cree que los planificadores de la demanda seguirán teniendo un rol en el futuro, pero enfrentarán desafíos cada vez mayores debido a la creciente frecuencia de decisiones y a la creciente cantidad de datos disponibles. Nicolas Vandeput ve evolucionar el rol de los planificadores de la demanda para centrarse en recolectar, estructurar y depurar datos e información. Alexey Tikhonov cree que los planificadores de la demanda no podrán competir a largo plazo con los sistemas de inteligencia.

El panel concluyó con una sesión de preguntas y respuestas, en la que los panelistas atendieron preguntas del público sobre temas como las condiciones o requisitos para crear decisiones automáticas en la planificación de la demanda, el rol del juicio en la planificación de la demanda y cómo incorporar el sesgo del juicio humano en el sesgo estadístico para reducir el sesgo general.

Transcripción Completa

Robert Fildes: Soy Robert Fildes y estoy presentando estas dos sesiones. Por razones logísticas, se han intercambiado y pasaremos la próxima hora más o menos hablando sobre el rol cambiante de los planificadores de la demanda y cómo su función podría cambiar sustancialmente debido a los avances en la IA y el machine learning. El panel pronunciará sus palabras de sabiduría en breve. La sesión de Paul Goodwin y mía, donde hablamos sobre mucha evidencia empírica sobre el rol del juicio, se ha cambiado para esta tarde a las 15:10. De todas formas, está en el programa. Sí, ajuste basado en el juicio, hablaremos de eso pero no en esta sala, sino en otra. Así que espero verlos entonces y espero una discusión estimulante y, preferiblemente, controvertida, y paso la palabra al moderador, Conor.

Conor Doherty: Bueno, muchas gracias Robert. Hola a todos, soy Conor, jefe de comunicaciones en Lokad y me complace mucho estar en el escenario acompañado por un ilustre panel de la academia y la industria. A mi izquierda inmediata, Alexey Tikhonov, desarrollador de negocios y productos en Lokad. A su izquierda, el Dr. Sven Crone de Lancaster University, CEO y fundador de iqast, y por último, pero no menos importante, Nicolas Vandeput de SupChains. Ahora, el tema de la discusión de hoy, como pueden ver en la pantalla, es la planificación de la demanda y el rol del juicio en el nuevo mundo de la IA y el machine learning.

Estoy bastante seguro, dado el nivel de participación en el escenario, de que este será un intercambio animado de ideas y creo que cualquier avance en la tecnología generalmente plantea preguntas sobre cómo esos avances impactarán la participación humana. Así que espero con mucho interés escuchar a nuestros tres panelistas discutir eso. Ahora, antes de empezar, el tiempo es un recurso algo escaso hoy, así que un poco de información administrativa. Cada panelista tendrá 5 minutos para presentar su perspectiva respecto al tema. Primero será Nicolas, luego Sven y finalmente Alex.

Posteriormente, haré algunas preguntas diseñadas para desentrañar algunos de los detalles y las implicaciones de sus perspectivas y, dado cómo se desarrolle, si todos seguimos en diálogo, entonces, con suerte, algunas preguntas del público. Lo que diré es: por favor, si es posible, dada la escasez de tiempo, tengan algunas ideas preparadas antes de que se les entregue el micrófono, en vez de un monólogo seguido de un signo de interrogación. Pero con eso, paso la palabra primero a Nicolas; por favor, su perspectiva respecto al tema.

Nicolas Vandeput: Gracias, Conor. Hola a todos. Excelente, tengo las diapositivas. Permítanme presentarles la visión que tengo para la excelencia en la planificación de la demanda en la era del machine learning y cómo, básicamente, pueden integrar el machine learning junto con el enriquecimiento humano para el forecast de la demanda en supply chain. Tienen cuatro pasos en la diapositiva. Permítanme explicarlo.

Lo primero para mí es ver el forecast de la demanda como un juego de información. Básicamente, lo que se quiere hacer, lo que significa es que se desea recopilar la mayor cantidad de datos, información, percepciones, o como se le llame, sobre la demanda futura. Eso podría ser tu calendario de promociones, cuánto de publicidad vas a realizar, datos de ventas, inventario localizado en tu cliente, pedidos que ya hayas recibido de tus clientes por adelantado, todo eso. Y será diferente para algunas industrias, lo cual está totalmente bien, pero básicamente mi punto es que el primer paso es encontrar información sobre lo que se avecina. Eres un periodista, un reportero, un detective; sal y encuentra esta información.

Ahora, una vez que tengamos toda esta información, los datos que pueden ser estructurados deben ser alimentados al machine learning y se quiere crear un engine de forecast de la demanda basado en machine learning que sea automatizado y a prueba de fallos. Por automatizado, me refiero a que es una herramienta, un engine, que no requiere ninguna modificación manual, revisión o ajuste fino por parte de humanos. Puede ser realizado quizás por un equipo de data science o se hace automáticamente, por lo que es completamente automatizado. A prueba de fallos significa que tu engine de machine learning necesita reaccionar a la mayoría de los impulsores de tu negocio, a saber, promoción, precios, faltante de stock, quizás publicidad, tal vez el clima, cosas así, días festivos, y así sucesivamente. Así que es a prueba de la mayoría de los impulsores del negocio y es completamente automatizado, no necesitas tocarlo ni revisarlo.

Una vez que tienes esto, los humanos, es decir, los planificadores de la demanda, aún pueden enriquecer el forecast basándose en la información que han obtenido y que no está incluida en este modelo. Así que, imaginemos, por ejemplo, que llaman a tu cliente y uno de ellos dice: “Bueno, realmente es un momento difícil, no haré pedidos este mes.” El cliente no llamará al modelo de machine learning, el modelo de machine learning no es consciente de eso. El planificador sí lo es. El planificador debería revisar el forecast y modificarlo porque sabe algo que el modelo desconoce.

Paso final, valor agregado del forecast. Este es un paso absolutamente crítico. Incluso empezaría con este. Significa que necesitamos hacer seguimiento al valor agregado por todos en el proceso. Así que debemos rastrear la precisión del forecast antes y después del enriquecimiento para asegurar que, con el tiempo, el enriquecimiento aporte valor. Por supuesto, todos pueden tener suerte o mala suerte en ocasiones, lo cual está totalmente bien. No todo enriquecimiento individual agregará valor, pero lo que queremos demostrar y mostrar a lo largo del tiempo es que, en promedio, estos enriquecimientos aportan valor. Así que vale la pena nuestro tiempo. Bueno, esa fue mi visión en cuatro pasos sobre cómo integrar el machine learning y los planificadores de la demanda.

Conor Doherty: Bueno, muchas gracias, Nicolas. Ahora paso la palabra a Sven.

Sven Crone: Gracias. Sí, gracias. Soy Sven Crone de Lancaster University, profesor asistente allí con probablemente casi dos décadas de investigación en IA y forecast. Así que estoy completamente parcial hacia la IA, tengo que decirlo desde el principio. He estado intentando hacer que la IA funcione en el forecast durante muchos, muchos años. Solo para que estén al tanto de mi sesgo fundamental. Al mismo tiempo, creamos una pequeña empresa en la que hemos estado tratando de ayudar a grandes empresas multinacionales a aprovechar la nueva tecnología y, mirando hacia atrás en esas décadas, ha sido extremadamente difícil. Creo que hoy tenemos que abordar, con suerte en el panel, algunos elefantes en la habitación.

Aunque la visión ha existido por muchos años, podemos reemplazar la estadística con IA, podemos reemplazar eso con estadísticas. En realidad, no hemos sido tremendamente transformadores en lo que respecta a los procesos de planificación de la demanda, creo yo. Así que ese es mi sesgo fundamental. Al observar esto, algo de la experiencia que puedo compartir es que hemos entrenado a muchos planificadores de la demanda intentando hacerles apreciar algunos de los algoritmos de suavizamiento exponencial y de ARIMA que existen. Puedo decirles que no es un ejercicio agradable. Son lentos para adoptar algunos de ellos. Es un ejercicio agradable con la demanda, pero es muy difícil lograr que acepten algunas de las tecnologías más simples. Así que creo que más adelante hablaremos un poco sobre lo que sucede si esa tecnología se vuelve aún más avanzada y las personas tienen que interactuar con ella.

Pero el estado actual, hace aproximadamente 10 años, había un uso muy limitado de IA, aunque las redes neuronales han existido durante casi 60 años, remontándose ciertamente a algunas de las primeras innovaciones, en los años 80. Pero la adopción ha sido comparativamente lenta. En los últimos dos o tres años, realizamos encuestas de forma regular en conferencias de profesionales. Acabábamos de hablar en una conferencia de profesionales, el ASM, en Bruselas, y realizamos una encuesta en la audiencia. Preguntamos cuántas personas estaban realmente operando en vivo con un proof of concept en IA y ML, y aproximadamente el 50% de la audiencia estaba presente. Esto representa un aumento desde el 5 al 10% de hace 10 años. Ahora, el 50% está realizando un proof of concept. Aún no están en producción, pero bastantes ya lo están, y ya vimos algunas grandes compañías que lo están probando. Así que, no hay miedos en la audiencia, además de algunos otros, por lo que se presentan casos de estudio realmente interesantes. Pero lo que también es sorprendente es que, al igual que muchos proyectos que tienen éxito, otros fracasan.

Así que tuvimos una gran parte de la audiencia en la que los proyectos de IA no tuvieron éxito y pienso que es exactamente esa intersección entre incorporar una tecnología en un proceso de planificación de la demanda que es mucho más que solo el paso de forecast. Si analizamos la industria, debemos considerar la gestión de datos maestros, la limpieza de datos, la priorización, las métricas de error, la ejecución de un modelo estadístico, y luego, potencialmente, analizar errores, identificar alertas y ajustar en consecuencia. Y, por cierto, incluso si se cuenta con un proceso estadístico base de forecast completamente desarrollado —el cual, incluso hoy, la mayoría de las compañías no tienen— Gartner presenta un hermoso panorama de madurez de las diferentes etapas de la madurez de S&OP.

Muy pocas empresas están en el nivel cuatro; la mayoría se encuentra entre el uno, dos y tres. Incluso si cuentas con un proceso estadístico que limpia el historial de series de tiempo de forma automática o manual, eso es una decisión basada en el juicio. Qué algoritmo elegir es una decisión. Qué metaparámetros permitirle buscar es una decisión basada en el juicio. Así que hay mucho juicio involucrado, pero creo que, tradicionalmente, pensamos en el juicio como el ajuste final de un forecast estadístico base que es o no comprendido. Y, mirando hacia el futuro, no he visto mucho movimiento o innovación en lo que respecta a innovar el proceso de S&OP tal como fue diseñado por O.W., y veo a ejecutivos seriamente descontentos con la falta de progreso, o al menos con la falta de progreso percibida, aunque a menudo sí se avanza en el desarrollo de los procesos.

Pero, ya sabes, creo que hubo un CEO de Unilever que dijo que debemos deshacernos de la planificación de la demanda, que no funciona durante los tiempos de COVID. Se avecinan desafíos reales para que los planificadores de demanda conserven sus trabajos y, a menos que aprovechen la IA —y creo que existe un escenario realista en el que la IA, como dijiste, si logras hacer todo esto, podrá reemplazar a los planificadores de demanda incluso en los pasos de ajuste basados en el juicio—, aún no hemos llegado a ese punto. Así que espero con interés conocer sus opiniones.

Conor Doherty: Bueno, gracias, Sven. Alexey, tus pensamientos, por favor.

Alexey Tikhonov: Gracias. Mi propuesta será radicalmente diferente. Creo que primero necesitamos ampliar el alcance, ya que la planificación de la demanda existe en la supply chain y el objetivo de la supply chain es tomar decisiones bajo incertidumbre, decisiones rentables bajo incertidumbre y bajo la presencia de restricciones. En cuanto a este objetivo, mi postura es que la planificación de la demanda es un enfoque obsoleto y las intervenciones de forecast basadas en el juicio son un despilfarro, incluso si ayudan a mejorar ligeramente la precisión del forecast. ¿Por qué es así?

La planificación de la demanda es un enfoque obsoleto porque presupone que necesitamos separar el forecast de la toma de decisiones. Esta separación conduce inevitablemente a la elección de herramientas simples, ya que introducimos una interfaz de humano a humano. Tenemos que transmitir la información de una manera muy sencilla y elegimos forecasts puntuales porque todos pueden comprender forecasts puntuales. Los cálculos de las métricas de precisión son simples, por lo que podemos debatir sobre esos puntos y ajustarlos al alza o a la baja. Pero, desafortunadamente, esta elección de herramientas nos impide tomar decisiones rentables.

Para tomar una decisión rentable, necesitamos evaluar los riesgos financieros y los retornos financieros. Solo podemos hacer eso si capturamos el patrón estructural del riesgo. Hasta donde yo sé, solo existe una herramienta que logra eso. Se llama forecast probabilístico, en el que, en lugar de predicciones puntuales únicas, se ofrece una opinión fundamentada acerca de cómo se ven todos los futuros posibles y cuáles son las probabilidades de los diferentes futuros.

No me refiero solo a la demanda. Existen otras incertidumbres, por ejemplo, puede haber incertidumbres en el lead time que debes tener en cuenta. Esto es especialmente relevante si se trata de bienes enviados desde el extranjero. Luego, podrías tener incertidumbre en el rendimiento si estás manejando la producción de alimentos. Puede haber incertidumbre en las devoluciones si se trata de ecommerce. Así que hay múltiples fuentes de incertidumbre y se requieren herramientas específicas, llamadas modelado probabilístico, para combinar todas esas incertidumbres y poder derivar decisiones en etapas posteriores.

La planificación de la demanda solo nos ofrece una versión del futuro, que es una predicción puntual, es decir, el escenario más probable. Pero nos interesan las colas de esta distribución, porque los riesgos se concentran en dos extremos. Entonces, la perspectiva de la planificación de la demanda nos lleva inevitablemente a considerar solo una opción de decisión. Tienes un forecast puntual, aplicas ya sea una fórmula de safety stock o una inventory policy simple, y derivar una decisión. ¿Pero es rentable esta decisión? ¿Qué pasa si la modifico hacia arriba o hacia abajo? ¿Cómo varía mi rentabilidad esperada? No puedo hacer eso porque mis predicciones son predicciones puntuales. No indico ninguna probabilidad sobre esos escenarios.

El tercer problema con la planificación de la demanda es que la perspectiva económica está completamente ausente. Hablamos de la precisión del forecast en porcentajes o, si usamos diversas métricas que abordan la precisión en unidades, carecemos de la perspectiva financiera. Por ello, lo que necesitamos es estimar el costo esperado, las recompensas esperadas y, además, calcular factores secundarios, como cómo comparar las decisiones de inventario para diferentes productos. Cada minorista sabe, por ejemplo, que tener pañales en stock es mucho más importante que contar con chocolate premium, ya que si no tienes el primer producto, tus clientes se decepcionarán y perderás la lealtad.

La planificación de la demanda nos impide una automatización extensa. ¿Qué vamos a automatizar? Vamos a automatizar la producción de las decisiones finales, no solo el forecast. Necesitamos automatizar toda la cadena. Debemos convertir nuestros datos transaccionales sin procesar en decisiones accionables que ya respeten todas las restricciones de decisión, tales como las cantidades mínimas de pedido (MOQs) y otros factores de decisión como los descuentos por cantidad.

Y, por último, pero no menos importante, debe existir propiedad. Actualmente, no hay propiedad sobre las decisiones finales porque tenemos este proceso de transición del forecast a un equipo diferente, y luego ellos derivan la decisión, y se produce un juego de culpas. “Oh, tomamos esta decisión porque tu forecast fue inexacto o hubo algún aumento basado en el juicio en el forecast, y por ello nos condujo a una decisión equivocada.”

Para resumir, la perspectiva de la planificación de la demanda es obsoleta y tenemos algo mejor. Gracias.

Conor Doherty: Bueno, vamos a estar de acuerdo hoy, pero no en todo. ¿Puedo responder a eso? Porque creo que estoy totalmente de acuerdo contigo en algunos aspectos. Pienso que mencionaste el forecast puntual versus por intervalo o de distribución de probabilidad, ¿cierto? Pero existen muchos paquetes de software que han estado haciendo eso durante muchos años, aunque los profesionales lo ignoren. Sin embargo, creo que todos entendemos el valor de comunicar no solo el valor de la demanda, sino también el riesgo asociado.

SAS lo ha estado haciendo desde hace mucho tiempo, Forecast Pro lo ha estado haciendo e incluso Forecast X lo ha estado haciendo, pero se ignora ampliamente. Entonces, ¿por qué se ignora? Probablemente deberíamos hablar sobre por qué los planificadores de demanda no entienden los forecasts por intervalo. Quiero decir, eso sería interesante. La otra cosa que mencionaste, y que también considero un buen punto, es que a menudo existe una desconexión entre la planificación de la demanda y la planificación de inventario, la planificación de la supply network y la planificación de la producción, lo cual sería beneficioso para derivar una solución holística.

Pero si piensas en grandes compañías multinacionales, creo que los procesos están establecidos de tal forma que, en realidad, se toman decisiones que involucran a decenas de miles de empleados, quienes intervienen y no comparten su conocimiento de manera libre. Y, en tercer lugar, pienso que debemos reflexionar sobre lo que consideramos. Creo que todos tenemos antecedentes diferentes al abordar la planificación de la demanda. Yo provengo de multinacionales industriales, ya sabes, quizás de compañías de transporte multinacionales, de bienes de consumo de alta rotación, de farmacéutica. Probablemente tú tengas una visión y un bagaje más orientados al retail, donde estas cosas pueden agruparse.

Pero lo que observamos, quiero decir, hay libros muy buenos de Charlie Chase, de SAS. Creo que ha escrito sobre la planificación del suministro impulsada por la demanda. Se trata de la reconciliación entre la demanda y el suministro. Es tanto un proceso para compartir información y expectativas como para la gestión del riesgo, en concreto, la gestión del riesgo a largo plazo en S&OP, abarcando aproximadamente de 6 a 18 meses. S&OE se centra en un horizonte de uno a cuatro meses, y es ese intercambio de información lo que también puede ser invaluable, independientemente de cuál sea el forecast final único.

Así que no discrepo de que algunas áreas aún tienen mucho camino por recorrer en lo que respecta a la integración en la toma de decisiones. Pero creo que la planificación de la demanda cumple más de un propósito. Sin embargo, pienso que, por el interés del tema, hoy nos estamos centrando en la automatización. Tal vez se utilice IA en el contexto de la automatización y nos enfoquemos predominantemente en la precisión. Pero muy pocas personas realmente se fijan en el intercambio de información. Hay algunos artículos interesantes sobre la robustez del forecast. Quiero decir, ¿qué sucede si modificas tu forecast constantemente con un modelo de machine learning muy reactivo y la planificación de la producción se vuelve caótica porque lo acumulan durante el lead time, resultando en exceso de inventario o faltante de stock, y se generan órdenes de producción?

Así que creo que, si podemos enfocarnos quizá en el proceso de planificación de la demanda y en la contribución del forecast en la planificación de la demanda —ya que lo demás es planificación de supply, planificación de red y planificación de producción—, nuestra discusión se complicará. Pero estoy totalmente de acuerdo contigo en que eso sería algo importante.

Alexey Tikhonov: Quizás con un comentario breve. Sí, mi postura no es que necesitemos un mejor intercambio de información o un mejor forecast. Mi postura es que necesitamos automatizar por completo la parte de la toma de decisiones. No deberíamos permitir que los profesionales de supply chain participen en el proceso de forecast, porque las supply chain son inmensamente complejas. Estamos hablando de compañías como, incluso si tomas empresas medianas, de unos 100 millones en facturación, en retail tendrán decenas de miles de SKUs, cientos de tiendas. Multiplicas una por otra y, para cada ubicación de SKU, debes tomar una decisión a diario.

Incluso si tienes ciclos de decisión predefinidos, como “tomo esta decisión una vez a la semana”, es mejor que recalculen esas decisiones a diario. ¿Por qué? Porque el ancho de banda humano es limitado. Necesitas una computadora que revise, por ejemplo, “Está bien, si hay un pico de demanda, es mejor que lo sepa antes de mi ciclo de decisión habitual, ya que espero que la demanda sea más suave.” Así que necesitas reproducir esas decisiones a diario, aunque la gran mayoría serán decisiones triviales, como “hoy no realizamos una compra”.

El ancho de banda humano es muy limitado y, cuando hablamos de compartir información entre humanos, estamos perdiendo tiempo. Necesitamos automatizar tanto como sea posible. Debemos ser capitalistas. Necesitamos construir activos, robots de toma de decisiones. Solo entonces podremos obtener rentabilidad de las supply chains.

Nicolas Vandeput: ¿Te importaría volver a mi diapositiva por un minuto? Me gustaría estructurar eso. Comenzaré desde mi marco y me gustaría hacerlo aún más extremo para continuar la discusión a partir de ahí. Creo que todos estamos de acuerdo en que hacemos forecasts únicamente porque queremos tomar grandes decisiones. Y diríamos, bueno, tal vez este tipo de forecast sería mejor, este tipo de forecast, esta granularidad, este horizonte, forecast puntual y así sucesivamente. Pero todos concordamos en que hacemos forecasts porque en algún momento necesitamos tomar una decisión.

Ahora, ¿por qué estamos tan inclinados hacia la automatización, todos nosotros aquí? Es porque tenemos que hacer tantos forecasts y tantas decisiones a gran escala, y no queremos variabilidad. Si tienes un humano, surge el problema de la variabilidad. Tienes el inconveniente de que hay tantos forecasts y decisiones por tomar, y demás. La manera en que veo los forecasts, nuevamente, se reduce a cuánta información puedes procesar y qué tan bueno eres procesándola. Así que quiero tener un modelo que sea lo mejor posible para manejar la mayor cantidad de información posible.

La tecnología que tenemos podría cambiar en 10 años. Podríamos tener un modelo único que pueda hacer frente a toda la información disponible en el mundo. Tomemos un ejemplo muy simple: la pandemia de COVID-19. Imaginemos que es mediados de marzo de 2020. Si tienes un motor de forecast, incluso con la mejor tecnología de aprendizaje que tenemos hoy, sabes, como humano, que el COVID llegará y el estado del mundo y de la ciudad cambiará en las semanas siguientes. Tu modelo no es consciente de eso.

Ahora, podrías tener un forecast puntual, podrías tener un forecast probabilístico, pero tú, como humano, aún necesitas enriquecerlo y revisarlo porque tienes acceso a información a la que tu modelo no tiene acceso. Así que, para mí, la discusión de si debería ser un forecast puntual no tiene interés en este debate, porque la conclusión sigue siendo la misma. Se trata de cuánta información puedes aportar a tu modelo, tanto como sea posible.

Y si no puedes alimentar cierta información a tu modelo, entonces es momento de que un humano la enriquezca. Y por eso siempre tiene sentido contar con un único y último humano que sea capaz de revisar alguna decisión o algún forecast basado en información que el modelo no puede procesar.

Sven Crone: Creo que estamos hablando de diferentes industrias aquí. Cuando hablamos de planificación de demanda, estoy completamente de acuerdo contigo en que, si estás en el ámbito del retail y tienes decenas de miles de decisiones que tomar a diario, entonces necesitas un grado significativo de automatización.

Pero trabajamos con minoristas en el Reino Unido de manera bastante extensa desde hace algún tiempo e incluso allí se realizan ajustes en los surtidos para aspectos en los que predomina la incertidumbre, como los efectos de condiciones climáticas extremas o el efecto de los cierres por COVID en gel de ducha versus papel higiénico en Alemania.

Pero si observas a un fabricante farmacéutico, por ejemplo, que tiene quizás entre dos y 400 productos básicos, son bastante manejables por un humano. Quiero decir, ¿cómo es que todas estas empresas se las arreglan? Realizamos encuestas y aproximadamente el 50% de las compañías utilizan medidas estadísticas muy simples. Se las arreglan, son rentables, están creciendo, son ágiles en su supply chain, y todos tienen incorporado el S&OP.

Así que hay todo un espectro de problemas que manejamos y creo que esa es una de las cosas que siempre me encanta de esta conferencia. Todos estos diferentes enfoques de forecast se reúnen. Tenemos personas que nos muestran la carga eléctrica de medidores inteligentes. Sí, tienes cientos de miles de medidores inteligentes con forecast minuto a minuto, en el cual no es factible la intervención humana.

Pero si tienes muy pocos artículos importantes, que, ya sabes, entiendes realmente bien, digamos en una empresa farmacéutica, sabes, observamos las vacunas, por ejemplo, que están bien entendidas. Creo que sí, existen diferentes enfoques de la planificación de la demanda.

Lo que estamos haciendo en forecast es tan heterogéneo como lo son los productos y los mercados, y esa es su belleza. Por eso todos nos sentamos en el bar y hablamos de forecast, hablamos de cosas completamente diferentes. Pero estoy totalmente de acuerdo contigo, así que, si hablamos del sector retail, estoy seguro de que la automatización es factible.

Estamos de acuerdo en discrepar en que el mundo es lo suficientemente grande para todos los diferentes paquetes de software, de modo que existan soluciones especializadas. Por eso, grandes compañías como SAP tienen soluciones especializadas para el retail y funcionarán de manera diferente que para bienes de consumo y farmacéuticas en la industria o en otras áreas. Así que creo que estamos de acuerdo, simplemente venimos de puntos de vista distintos.

Conor Doherty: Alex, ¿deseas comentar?

Alexey Tikhonov: Solo un pequeño comentario. No puedo estar de acuerdo con la propuesta de que las personas necesitan intervenir en el proceso de forecast. Donde las personas pueden aportar valor, lo hacen en las entradas de este motor de decisiones para aclarar data semantics, para aportar más datos, para explicar al ingeniero que está elaborando todos esos algoritmos o el motor de decisiones, cómo se utilizan los datos en el negocio para que tenga una mejor comprensión del panorama.

Y luego pueden aportar valor al final, revisando las decisiones que el motor de decisiones está generando y detectando aquellas decisiones insanas o inexactas, en su opinión, para luego reconsiderar esta receta numérica y averiguar qué está mal. ¿Cuáles son los supuestos erróneos? ¿Por qué está tomando la decisión equivocada? Porque si intervienen en el proceso, tocan el forecast o sobreescriben la decisión, esto equivale a que se consumen recursos en lugar de invertirse. Ante todo, necesitas analizar de qué maneras puedes mejorar esta robotización ya que, si lo haces manualmente, estarás perdiendo tiempo.

Y por cierto, deberías partir de las decisiones, no del forecast. Porque, ¿qué pasa si tuviera un MOQ de 100 unidades y te acercas y dices: “Oh, ahora tengo un mejor forecast. En vez de 50 unidades de demanda, son 55.” Pues, sigo teniendo un MOQ, así que, desde mi perspectiva, ambos forecast son algo irrelevantes a pesar de que, sí, uno es más preciso. Sigo tomando la misma decisión y el hecho de que hayas invertido más recursos en producir un forecast potencialmente más preciso, pero más costoso computacionalmente. Por lo tanto, lograste una mejor precisión del forecast pero, en general, estamos en una situación negativa porque seguimos tomando la misma decisión mientras invertimos más recursos.

Por eso estoy en contra de intervenir manualmente en los pasos del proceso. Revisa toda la receta para mejorar la automatización y hacerla más robusta, más fiable, más sensata.

Sven Crone: Es una lástima que no hayamos tenido la discusión previa con Robert y Paul, quienes probablemente, en la tarde, estaban analizando el forecast value added, porque tenemos mucha evidencia de que, además de los métodos estadísticos avanzados, el juicio puede aportar un valor significativo adicional.

Y creo que la pregunta planteada hoy es, ¿puede el machine learning superar el value add de la estadística y el juicio, o es lo mismo? Y luego, creo que la cuestión del costo total de propiedad es relevante, ¿verdad? ¿Cuál es más eficiente?

Estoy bastante seguro de que Nicolas tiene numerosos ejemplos que has mencionado antes o has reportado, donde en realidad estás automatizando todo el proceso y está aportando más valor que realizar ajustes basados en el juicio. Pero pasemos tal vez a la siguiente pregunta.

Conor Doherty: Bueno, en realidad es más bien una transición, que sigue siendo una especie de puente. Es para avanzar hacia, creo, la pregunta fundamental, porque al escucharte, casi parece haber un desacuerdo instrumental, pero sí un acuerdo en general.

Y en realidad, voy a dirigirme a ti, Nicolas, primero. Algo que dijiste antes, dijiste —y nuevamente, perdóname si lo parafraseo de forma incorrecta—, usamos forecast para tomar mejores decisiones. Eso significa que el forecast es instrumental en un proceso más amplio, lo cual plantea la pregunta: ¿dónde reside el valor?

Porque si utilizas el forecast como una herramienta para lograr algo más grande, ¿dónde está el valor? ¿Está el valor en la herramienta que construye la casa o en la estructura de la casa? En esa analogía, la casa representaría la decisión.

Nicolas Vandeput: Creo que tienes dos preguntas importantes con el forecast. La primera es: ¿es tu forecast preciso o no? Y, de nuevo, podríamos debatir sobre cómo se mide la precisión, debates muy interesantes, pero ese no es el tema de hoy. Imaginemos que el primer paso es simplemente evaluar cuán preciso o bueno es.

La segunda pregunta es, bueno, ¿basado en un forecast dado, qué tan buena es tu empresa tomando la decisión correcta? Ahora, desafortunadamente, el equipo encargado de esto es diferente, con distintas entradas, diferentes salidas y KPIs distintos.

Desde el punto de vista de la supply chain, no culparía a los forecasters o a las personas que elaboran el motor de forecast por decisiones malas o por KPIs relacionados con decisiones, porque ellos no tienen influencia sobre eso. Al mismo tiempo, podrías tener un forecast muy malo y contar con un tomador de decisiones que tuvo suerte o es extremadamente bueno tomando decisiones acertadas a pesar de un forecast deficiente.

Así que podrías obtener KPIs muy buenos, KPIs de negocio. De nuevo, podríamos debatir qué KPI es relevante o no, pero podría presentarse en ambas direcciones. Para mí, cuando quiero evaluar un forecast, no me fijo en el resultado del negocio. Me concentro puramente en la precisión del forecast, porque sé que el resultado del negocio puede estar determinado por tantas otras cosas que están totalmente fuera del control de quien realiza el forecast, ya sea máquina o humano.

Ahora, lo que es muy interesante, y lo he simulado para algunos clientes, es que, dependiendo de la calidad de tu forecast, de nuevo podríamos debatir cómo medir la precisión, pero dependiendo de eso y, especialmente, del sesgo —por ejemplo, ¿estás muy sesgado hacia el under forecasting o cuentas con una herramienta que está debidamente calibrada, espero que así sea?— el motor de optimización de supply chain resultante podría optar por una política muy diferente.

Así que la política óptima o la manera ideal de tomar decisiones podría cambiar dependiendo de la calidad del forecast. Esto también significa que, si hoy pasas de un forecast que sobreestima todo de manera extrema porque tu proceso está tan influenciado políticamente, a un forecast que en realidad fue generado mediante machine learning, necesitarás, al mismo tiempo, revisar cómo se toman las decisiones en tu supply chain.

Las personas confían en la herramienta del proceso. Históricamente, el forecast siempre fue 30% demasiado alto. Así que, si cambias eso ahora, también necesitas cambiar el proceso de supply chain. Ambos deben estar integrados. Pero desde el punto de vista de la supply chain, evaluaría los KPIs de forma independiente en la medida de lo posible.

Conor Doherty: Gracias. Sven, ¿tus pensamientos? Solo para reiterar la pregunta, si el forecast es una herramienta para lograr otra cosa, ¿dónde atribuyes el valor? ¿Está en la calidad de la decisión o en la calidad del forecast? Defínelos como prefieras.

Sven Crone: Creo que ya hemos tocado ese tema. Para mí, la planificación de la demanda, o siguiendo la definición de Gartner de planificación de la demanda y el proceso de Oliver Wight, lo abordamos desde una perspectiva industrial. Tomemos las industrias farmacéutica y de bienes de consumo, que normalmente miran horizontes mucho más largos de lo que tú contemplas. Se consideran, por ejemplo, periodos de 6 a 18 meses. Las decisiones costosas son las estratégicas. Se identifican planes a largo plazo, se definen forecasts, se realizan actividades de cierre de brechas, y se intenta conciliar la supply y la demanda en un horizonte mucho más amplio. No cuentas con información promocional, ni con información meteorológica, ni con información de disruption. Por lo tanto, esto se enmarca muy bien en la planificación basada en escenarios y en la planificación end-to-end de escenarios que deben materializarse en determinadas posiciones de inventario.

Pero esa es una posición a largo plazo. Si lo miras, creo que la mayor parte de la industria todavía tiene, por ejemplo, un período congelado de tres meses. Es decir, se presta atención al marco temporal fuera de ese lapso. S&OE, por otro lado, que recientemente ha sido adoptado por Gartner, lo aborda de manera muy diferente. Así que, para el horizonte a largo plazo, pienso que la transparencia y la comunicación son aspectos importantes para prepararse ante, ya sabes, presupuestos cambiantes, realineación de presupuestos, conciliación del valor del volumen. Es un proceso muy agregado. Se observa en niveles altos de la jerarquía, se consideran los mercados, los canales, pero no se analizan productos individuales.

Luego, bajas al trabajo diario, y eso es S&OE. En S&OE, estoy de acuerdo, tienes decisiones automatizadas, decisiones estandarizadas; la precisión es importante, la transparencia sigue siendo crucial —aunque a menudo se pasa por alto— y, por supuesto, la robustez. Pero creo que el 85% de todas las presentaciones en esta conferencia hablan de precisión. Hay una sesión entera sobre robustez, lo cual es bueno ver. Sin embargo, pienso que la innovación más importante para medir todo el proceso es el forecast value add. Se trata, en realidad, de analizar los componentes individuales y ver cómo aportan valor. Esa es una perspectiva muy enfocada en la gestión, porque quieres invertir recursos donde realmente se añade valor.

Desafortunadamente, no abarca aspectos como la gestión de datos maestros. Es difícil de medir. Tampoco integra elementos como la depuración de datos, lo cual considero instrumental para lograr cualquier cosa en el forecast estadístico. Y se centra, al final, en el aspecto humano. Pero tenemos dificultad para medir el value add, porque si hablamos de la precisión del forecast, normalmente ponderado por costo y volumen para verlo en agregado, ¿están tomando las mejores decisiones con métricas de error de las que los académicos ni se inmutarían? Lo que realmente se analiza es cuál es el value add. Sin embargo, tenemos muchos planificadores de la demanda que en realidad eligen un algoritmo estadístico en la herramienta. Pueden sobreescribir la elección, pero ese valor se atribuye al algoritmo estadístico. Así que creo que hoy en día hay mucho valor en el juicio y se puede medir. Además, pienso que la mayoría de las empresas lo han adoptado, y el value add es una buena herramienta para ello. Y, nuevamente, miro al largo plazo y mucho menos al corto, donde el desempeño del inventario debería estar vinculado, etc.

Conor Doherty: Bien, gracias.

Alexey Tikhonov: Creo que cuando hablamos de cambios en la precisión del forecast, de mejoras potenciales, y lo relacionamos con el proceso de forecast value added, estamos confundiendo los términos, porque el nombre más acertado sería forecast accuracy added, no value. Porque value, cuando hablamos de value, para mí, inmediatamente provoca una perspectiva financiera. Y la perspectiva financiera se rige por las decisiones. Los resultados de tu negocio dependen únicamente de las decisiones que tomas y de lo bien que las ejecutas. Así que no hay nada más involucrado en esta perspectiva, solo las decisiones y lo bien que sean ejecutadas.

Cuando consideramos las decisiones, por ejemplo, tengo un forecast número uno que me conduce a tomar la decisión A, y un forecast número dos que es más preciso. Sé cuánto, conozco la diferencia en precisión. Pero la pregunta es: ¿este forecast diferente y más preciso me lleva a una decisión distinta? Si no, entonces resulta ineficiente, a pesar de ser más preciso. Así que, a pesar de un value aparente mejor, tenemos un neto negativo desde la perspectiva financiera. Y, si la decisión es diferente, ¿cómo evaluamos que esta discrepancia en la decisión, este cambio —como pasar de la decisión A a la decisión B— nos genere cuánta ganancia adicional en comparación con la diferencia en la inversión de recursos? Para mí, es una pregunta abierta. Podemos usar ambos modelos de forecast para evaluar los retornos potenciales de ambas decisiones, pero sigue siendo una cuestión de especulación, porque no contamos con dos universos alternativos para probar dos decisiones. Finalmente, tenemos que elegir solo uno.

Y aún más, el valor de la decisión no depende únicamente del forecast per se. Hay otras consideraciones, como los impulsores de la decisión. Por ejemplo, trabajamos con Air France, su ala MRO para repuestos de aeronaves. Y hace poco mismo, implementamos un motor de decisión con ellos y hace poco se realizó una gran compra desencadenada por un robot que adquirió varias docenas, creo, de unidades de potencia auxiliar para una aeronave que en total suman varios millones de euros, desencadenada por un robot. Y la gente dijo, “Oh, debe ser un error.” Pero cuando empezaron a inspeccionar, resultó que alguien del otro lado cometió un error y estableció el precio bastante por debajo del precio promedio del mercado. Y el robot lo detectó e inmediatamente ejecutó órdenes. No tiene nada que ver con la precisión del forecast, pero esta decisión tiene un valor enorme.

Así que ya ves, nos estamos enfocando en la precisión del forecast, pero hay tantas otras cosas que pueden influir en el valor de la decisión. Así que creo que cuando hablamos de valor monetario, no deberíamos centrarnos únicamente en el forecasting. Debemos observar todo el proceso de cómo derivamos las decisiones, qué se tiene en consideración, cuál es nuestro proceso de decisión, qué cosas son importantes y cuáles son de preocupación secundaria.

Sven Crone: Solo para añadir, estoy de acuerdo, y mencionaste eso antes en la primera ronda, que debería haber una decisión de inventario y luego evaluarla en decisiones de inventario. Y creo que, para ser justos, en la academia, la mayoría de las personas, o toda la gama de revistas, han tomado esto como buena práctica o como práctica mínima. Así que, si observas las revistas en economía de la producción y en ISER, la Inventory Society, eso es buena práctica. Verás bastantes presentaciones de académicos aquí que en realidad miden el costo de la decisión en curvas de compensación sobre service level y lead times y en realidad proporcionan el inventory cost asociado con ello. Eso es algo que no veo en la práctica en absoluto.

Es muy difícil hacerlo en la práctica, es difícil, pero es posible. Tienes que hacer suposiciones, por supuesto. La supply chain es compleja, pero estoy totalmente de acuerdo contigo. El costo de la decisión debería ser bueno. Pero eso nos remite a Granger 1969, funciones de loss functions asimétricas. Normalmente no tenemos el costo de la decisión, así que tenemos que suponer algo. Lo que veo como una gran brecha, y quizá una omisión, es que esta comunidad no ha logrado establecer el vínculo entre la precisión del forecast, sin importar cómo se mida, y el costo de la decisión asociado con ello.

Así que, en realidad, tuvimos un proyecto de investigación. Hay muy pocas empresas; Johnson and Johnson lo ha divulgado en el pasado. Así que un punto porcentual en la precisión del forecast, típicamente medido como weighted cost-weighted MAPE, equivale a 8 millones de dólares estadounidenses en inventario de productos terminados y costos de producción acelerada en centros de distribución, y así sucesivamente. Tenían toda una línea de cómo lo establecieron. Recientemente presentamos algo en lo que hicimos una simulación bottom-up con TESA. Hay algunas calculadoras en la web en las que no confío completamente, pero creo que es algo importante, que los errores de forecast son costosos, puramente por la decisión en los safety stocks y el inventario en el siguiente paso inmediato, sin siquiera llegar a la planificación de la producción, la adquisición de materias primas y decisiones a largo plazo.

Así que creo que eso es una verdadera omisión. Por eso pienso que los equipos de demand planning en las empresas siguen siendo demasiado pequeños. Si supieran lo costosas que son sus decisiones, lo valioso que es el forecasting, veríamos muchos más recursos allí. Pero, y por cierto, TESA, fue aproximadamente, claro, depende del tamaño de la empresa, fue, no se nos permite decir el número, es un Bugatti Veyron. Los Bugatti Veyron tienen un precio bastante rígido, así que son 1.5 millones por punto porcentual de precisión en inventario, traducción directa. Y ahora estamos trabajando con algunas otras empresas para establecer esto, dada la inferioridad de los modelos de inventario. Pero esto es algo realmente importante. Estás resolviendo el problema directamente y mostrándoles el costo de la decisión. Pero cuando el proceso está desacoplado, aún puedes hacerlo. Y creo que ese es el elemento faltante. Pero estoy completamente de acuerdo. El costo de inventario o de la decisión sería ideal. El inventario es un vínculo directo que se puede y se debe hacer, y lo están haciendo los académicos.

Conor Doherty: Quiero avanzar y unir algunos puntos que se han planteado, particularmente en torno a las suposiciones. Quiero decir, suposiciones: si esa es una suposición de un demand planner, como, “Oh, esto está mal, necesito hacer una sobrescritura manual”, eso es una suposición. Una suposición entra en la construcción de un forecast o de un modelo automatizado. Es decir, estas son distinciones. Las rosas con cualquier otro nombre, pero mi pregunta es, ¿es razonable esperar, para la dirección, o para personas sin formación en los temas de los que hablamos hoy, que tengan el mismo nivel de confianza en la automatización, como en un forecast generado automáticamente, versus un forecast que ha pasado por tu escritorio, por ejemplo? Y lo siento, o por el escritorio de Nicolas, o de Alex.

Nicolas Vandeput: Si no te importa volver a mi diapositiva, la pregunta más común, si la resumo en pocas palabras, es “¿Cómo puedo confiar en machine learning?” Y podrías cambiar machine learning por herramientas estadísticas. Me gusta cambiar esta pregunta a, “Sí, pero ¿cómo confías en los humanos?” Porque la gente dice, “Está bien, Nicolas, ¿cómo puedo confiar en ti? ¿Cómo puedo confiar en tu machine learning?” Y yo digo, “¿Cómo puedes confiar en tu equipo?” Y esa es, creo, la verdadera pregunta. Y para mí, solo hay una forma de rastrear eso y responderla. Se llama forecast value added. Y la idea es, realmente, intentaré explicarlo en tan solo unas pocas oraciones. Quieres rastrear la precisión de cada paso en tu proceso. Eso puede ser un humano, puede ser una máquina, o puede ser la información de tu cliente, el forecast que proviene de tu cliente. En cada paso, vas a rastrear la precisión antes del paso y la precisión después del paso.

A medida que haces eso, y también te aconsejaría que compares la precisión global de tu proceso con un benchmark estadístico, que podría ser cualquier modelo simple que puedas encontrar gratis. A lo largo de semanas, meses o días, dependiendo de tu horizonte, realmente puedes demostrar que alguna parte de tu proceso, ya sea humana o de máquinas, está agregando valor y es precisa. Esta es la única forma de hacerlo. Y llegaría incluso a decir que, si no haces eso, es como si no tuvieras las luces encendidas en la habitación. Estás a oscuras. No tienes ni idea.

Y cuando las empresas me contactan para impulsar proyectos de mejora en demand planning, la primera pregunta es, “¿Rastreas forecast value added?” Porque si no lo haces, no hay forma de saber si mi modelo está agregando valor y si lo estamos haciendo bien o mal. Así que este es el primer paso para responder a la pregunta, “¿Cómo sabes si puedo confiar en machine learning?” Es la misma pregunta que, “¿Cómo sabes si puedo confiar en los humanos?” Y la respuesta es, necesitas rastrear forecast value added.

Alexey Tikhonov: Creo que es importante cambiar el foco hacia las decisiones. ¿Cómo puedo confiar en un forecast? No sé si un forecast es bueno o malo a menos que vea qué decisión recomienda, qué decisiones puedo derivar utilizando este forecast. Y desde esa perspectiva, los humanos, los profesionales, a menudo tienen muy buena intuición. Si produces decisiones disparatadas, ellos lo señalarán y te dirán por qué. Por ejemplo, si tu orden de compra es demasiado grande, te dirán cuál debería ser, cuál es el rango aproximado para una buena compra y por qué piensan de esa manera. Así que, rastrear la precisión del forecast, sí. Incluir humanos en el proceso de hacer sobrescrituras judgmentales del forecast, como ya dije, resulta ser un desperdicio, prácticamente, porque esas intervenciones tienen tiempos de expiración muy cortos.

Puedes hacer sobrescrituras, pero no duran otro año. Probablemente tendrán un impacto en tu próxima orden de compra, pero no en la que venga después. Así que, involucras un recurso muy costoso, un recurso muy poco fiable, porque también deberíamos discutir —no tenemos tiempo— pero deberíamos hablar sobre cuál es el proceso detrás de esas sobrescrituras judgmentales. Son de naturaleza semi-cuantitativa. No existe un proceso riguroso como para un forecast generado automáticamente, en el que podamos inspeccionar, descomponer y ver qué está mal, si es que lo está. Entonces, necesitas automatizar tanto como sea posible. ¿Y cómo se gana la confianza? Bueno, de la misma manera en que confías en tu aplicación meteorológica. Si produce forecasts consistentes, si dice que hay una alta probabilidad de lluvia y, sí, la mayoría de las veces llueve cuando dice que lloverá. O con tecnologías diferentes como los filtros de spam.

Piensa en cuando apenas se introdujeron en los clientes de correo electrónico. Revisábamos la bandeja de spam con mucha frecuencia porque el porcentaje de correos mal clasificados era bastante alto. Hoy en día, solo reviso la bandeja de spam cuando sé que una persona que aún no está en mi lista de contactos me envió un correo y no lo he recibido. Y voy, sí, está allí, y hago clic en “no es spam”, y nunca volverá a ir a spam. Ya ves, la confianza se gana con el tiempo, y necesitas un proceso. Lo llamamos optimización experimental, cuando ajustas este motor de decisión. Una vez que comienza a producir resultados coherentes, lo único que necesitas hacer es rastrear las métricas. Sí, rastreas la precisión del forecast. Si cambia drásticamente, necesitas que un ingeniero, junto con los profesionales, inspeccione lo que está sucediendo detrás de escena. Pero nunca deberías intervenir manualmente en esta cadena de decisión. Quieres arreglar lo que está roto y luego dejarlo funcionar, muy parecido a lo que haces con las máquinas. Les haces mantenimiento y luego conduces tu auto.

Sven Crone: Sí, creo que la confianza es una cuestión importante, ¿verdad? Quiero decir, mirando atrás en los últimos 10, 20 años, muchas empresas han intentado ponerse en funcionamiento, por ejemplo, en el contexto del forecasting con forecasting estadístico. ¿Y por qué existe tal escepticismo? ¿Por qué tantas empresas lo han iniciado y detenido, iniciado y detenido, iniciado y detenido? Todos sabemos acerca del overfitting. Todos sabemos cómo realizamos estos experimentos en sandbox con todas las variables futuras, donde hay que tener mucho cuidado al diseñar cosas en una prueba de concepto, luego en un estudio piloto, ejecutándolos lado a lado en lugar de descartar esto. Y, de hecho, la mayoría, con tantos grados de libertad y meta parámetros y tantos indicadores líderes que pueden filtrarse en alguna descomposición, es muy, muy fácil prometer un nivel de precisión que luego no se ve materializar. Prometimos cierta precisión, y luego llegó COVID, y la dirección no entendió por qué no estábamos alcanzando ese nivel de precisión. Para nosotros, estaba claro. Para ellos, no. Pero digo, ya ves, se perdió la confianza.

La confianza, no creo, en general, que la aceptación de la tecnología sea un tema en los Sistemas de Información, ¿verdad? La aceptación de la tecnología es un gran problema. Hay conferencias enteras analizando cómo se puede transmitir esto. Y creo que una forma es que tiene algo que ver con la aceptación general de la tecnología. Como, ya sabes, la mayoría de nosotros seríamos escépticos si te subes a un coche sin conductor en San Francisco, al menos las primeras veces. Quizás no, pero en quizá 20 años, todos estarán contentos con ello. Entonces, eso es lo que dijiste, ya sabes, la usabilidad, que no ves que pasa nada, y así sucesivamente, y de esa manera se puede construir la confianza. También tienes que comunicar las cosas. Pero no creo que la respuesta sea explainable AI. Todos dicen que el algoritmo tiene que explicarse a sí mismo. Quiero decir, he tratado de explicar con empeño lo que hace un gamma factor de 0.4 sobre más de 12 índices estacionales que cambian con el tiempo, ¿verdad? Ningún directivo lo entiende. Pero el directivo superior tiene que tener, ya sabes, él tiene que tomar la decisión finalmente. ¿Confía en esta inversión significativa en inventario? ¿Confía en que su equipo trabaje de manera efectiva y eficiente?

Y creo que por ello, hemos perdido mucha confianza en la estadística, posiblemente con algunas implementaciones de software inferiores que en su momento eran lo último en tecnología, pero que no lo fueron, algunas de ellas sobreparametrizaron en una única muestra. Hay mucha evidencia aquí sobre la selección de modelos. Así que muchas de estas innovaciones no han sido adoptadas, sino principalmente por empresas jóvenes e innovadoras. Un paso intermedio que hemos visto funcionar para generar confianza en la medicina, por ejemplo, es un estudio de caso increíble sobre la detección de cáncer de mama a partir de imágenes. Y la máquina, el algoritmo, fueron significativamente más precisos, con una tasa de verdaderos positivos mucho mayor y una tasa de falsos positivos mucho menor, ya sabes, con un costo increíble de vidas individuales asociado a ello. Y los médicos no lo adoptaron. Justo en la década de 1980, no adoptaron algunos de los procesos de decisión porque no confiaban en ellos. Confiaban en sí mismos más que en los demás.

Las soluciones que estamos construyendo ahora, cuando la AI puede hacer corrección de outliers, en realidad resaltamos el outlier para el plan de demanda. La AI puede hacer selección de modelos, pero preferimos resaltar el ranking de lo que creemos que es significativo. Tratamos de explicar lo que vemos en los datos, de modo que pensamos que esto es altamente estacional y presenta una interrupción. Así que esta herramienta aumentada, también para los médicos, básicamente, en lugar de darte una clasificación, en realidad resaltaba en la imagen dónde se detecta probablemente el cáncer, y no solo te daba una respuesta de verdadero o falso, cáncer o no, sino que te daba una probabilidad de que fuera cáncer, lo cual permitía, en situaciones críticas, ordenar por probabilidad y no solo mirar aquellos que son claramente cáncer y los que son claramente no cáncer, sino examinar los que eran inciertos. Y ahí es cuando los médicos pudieron realmente utilizar su experiencia, la experiencia, y de repente tuvieron una aceptación masiva.

Así que creo que tiene mucho que ver con el diseño de los sistemas, el diseño del proceso de decisión y no se trata de toda automatización, porque tenemos ABC y XYZ y new products y productos finales, ya sabes, no, no se puede —no se debe— automatizar todo, sino automatizar algunas partes con AI, automatizar otras partes con métodos muy simples que quizás sean transparentes, y automatizar otras con algoritmos que sean robustos. Pero creo que, por ahora, para el nivel actual de aceptación y escepticismo hacia la tecnología, aunque a todos nos encanta GPT para planificar nuestra próxima fiesta de cumpleaños, probablemente el augmented AI sea un buen paso para lograr la aceptación y luego podamos automatizar completamente con AI.

Conor Doherty: Comenta sobre eso. Bueno, solo para retomar ese punto, porque nuevamente, ambos plantearon muy buenos puntos allí. Pero solo quiero desmenuzar una de las comparaciones. Entonces, creo que Alexey, diste el ejemplo de usar una aplicación de weather forecast, lo cual es, quiero decir, la meteorología —la base de la meteorología ha sido el forecast probabilístico por bastante tiempo—. Y luego lo comparaste con un vehículo autónomo, o al menos lo comparaste de forma indirecta. Y creo que tomaremos eso y trataremos de plantear una pregunta. Entonces, para usar el ejemplo de Alex, si a todos en la sala se les dijera que deben tomarse unas vacaciones la próxima semana y su único destino es Bermudas. El weather forecast dice que va a haber un tsunami la próxima semana. ¿Vas a pagar con tu propio dinero? ¿Vas a invertir financieramente tu tiempo, esfuerzo y energía volando a Bermudas? La mayoría de la gente diría que no. Ahora, toma esa misma perspectiva, que es finanzas y forecast probabilístico, reúne a todas esas mismas personas en una empresa y di: aquí hay una lista priorizada de decisiones ajustadas por rango y riesgo que fue generada por un algoritmo. Oh, no, absolutamente no, no confío en eso. Entonces, nuevamente, ¿es una falta selectiva de confianza? Sus comentarios.

Alexey Tikhonov: Podría hacer un comentario breve. Creo que el verdadero problema con que los humanos se resistan a la adopción de nuevas tecnologías en general, cuando hablamos de automatización, es el miedo a volverse irrelevantes y ser desplazados. Y, de hecho, lo que sucede normalmente es justamente lo contrario. Sí, automatizamos algunas partes en las que los humanos simplemente no son financieramente eficientes. Por ejemplo, solíamos tener traductores para varios idiomas que traducían nuestro propio sitio web porque publicábamos mucho y, en conjunto, probablemente gastamos algo así como 400,000 Euros en varios años. Y ahora, cada vez que publicamos algo, se traduce mediante LLMs.

Tenemos programas que toman una página markdown como entrada y producen una página markdown en la que toda la sintaxis, los short codes y todo lo demás permanece intacto, y solo se traducen las partes relevantes a otros idiomas. Los costos han bajado inmensamente, como dos órdenes de magnitud, ahora es 100 veces más barato. Entonces, ¿deberíamos pagar 100 veces más a un traductor humano? No. Ahora, ¿todavía necesitamos traductores humanos? Sí, por ejemplo, si quieres elaborar un documento legal, más te vale usar un traductor humano, porque una sola palabra, una sola coma, puede costarte una tremenda cantidad de dinero. Entonces, ¿necesitamos traductores humanos? Sí, todavía los necesitamos, pero en áreas diferentes y probablemente habrá más necesidad de traductores humanos en este ámbito legal que antes.

Y lo mismo se aplica a los supply chains. Por ejemplo, hay áreas enteras que permanecen intactas debido a la falta de recursos humanos disponibles. Muy a menudo, cuando deseas realizar un pedido, no sabes de antemano si existe un MOQ, por lo que necesitas recuperar esa información. Puedes usar humanos, puedes usar un copiloto como IA, pero aún necesitas a un humano para extraer información que está mal estructurada y alimentarla en tu motor de decisiones, de modo que se produzca una decisión conforme al MOQ. Así que, creo que todavía necesitamos humanos, pero para diferentes tipos de tareas que evolucionarán.

Sven Crone: Creo que mencionaste una parte importante cuando se trata de la aceptación de algunas de estas técnicas de traducción automática, ya que han existido desde hace tiempo. IBM usaba redes neuronales allá por 1982, ¿verdad? Así que, han estado ahí, pero la tasa de traducción o el índice de error estaba en torno al 90% de identificación. Por lo tanto, un humano tendría que intervenir y cambiar bastantes letras, bastantes palabras. Cada décima palabra estaría equivocada y eso significaba que era inaceptable, porque estaba por debajo de un umbral considerado suficientemente bueno.

Y ahora, si logras esa precisión, no necesariamente a nivel humano, pero sí por encima de un umbral, de repente se produce una adopción masiva de la tecnología. En forecast, somos bastante culpables de esto, porque hemos visto implementaciones con el uso descuidado de modelos multiplicativos en series de tiempo con ceros. Y si tienes 10 ejemplos sobre 100 series de tiempo que explotan una vez al año, tienes cero aceptación porque se pierde la confianza.

Así que, en realidad, tienes que alcanzar la robustez para permitir que se lleve a cabo la automatización. Creo que es un buen punto. Y, normalmente, hemos intentado construir modelos precisos en lugar de modelos robustos que funcionan mal. Las redes neuronales siempre tienen este problema. Además, creo que todos somos parciales porque estamos bastante inclinados hacia la tecnología, no tanto como mi hermano menor, por ejemplo, que simplemente ama la tecnología. Así que, también hay una consideración de edad. Pero, ¿qué genera confianza? Creo que en una reunión de alto nivel directivo, sé que una compañía de software muy grande está analizando activamente modelos de LLMs y hubo una decisión reciente. Creo que Eric Wilson del IBF, The Institute of Business Forecasting, tiene un blog y son bastante categóricos en que la IA no reemplazará el proceso de demand planning y que todos conservarán su trabajo.

Pero recientemente hubo ejemplos en los que, en realidad, en una sala de juntas, un modelo LLM entrenado con la mayoría del conocimiento que se le proporcionó —la información promocional, las interrupciones, el supply chain— y al final se obtuvo un forecast, y el CEO le preguntó al modelo LLM por qué era así. Y la gente tenía puntos de vista diferentes. Marketing tenía un punto de vista, Finanzas tenía otro. El modelo LLM fue el único capaz de dar un argumento comprensible de por qué ese es el número correcto. Y creo que hay otro sesgo, pero si puedes contar una historia destacada sobre las cosas, la gente confiará en ello. Así que, esto también introduce confianza, incluso si está equivocado.

Entonces, creo que ser capaz de argumentar por qué es así para un demand planner en un contexto de mil productos —te sientas allí con el CEO para argumentar de forma comprensiva por qué crees que en seis meses será el doble, y no lo recuerdas. Has estado ocupado trabajando todo el mes en todos estos números, analizándolos a fondo, traduciendo esos números en valor, y luego obteniendo ajustes descendentes por canal, y al final, obtienes un número. Pero el modelo LLM fue capaz de argumentar por ello y creo que, ahí, probablemente veremos quién dirá que un modelo LLM no puede leer todas las reuniones de ventas y de cuentas clave, que no puede captar toda la información del funnel, que puede justificar el funnel, que lo puede alinear con los supply values y, en realidad, llegar a un ajuste que es mejor que el de un humano porque simplemente puede manejar muchos más datos. Creo que ahí es donde podríamos saltarnos la necesidad de confianza y pasar directamente a la precisión. Pero hay evidencia de que estos pueden generar confianza, porque finalmente pueden explicar lo que está sucediendo.

Nicolas Vandeput: Entonces, veo una pregunta interesante y creo que finalmente encontramos nuestro tema en el que no estoy de acuerdo.

Lo primero que me gustaría abordar es la gestión del cambio con respecto a la adopción de machine learning para forecast. Como con cualquier tecnología, hay personas que se oponen totalmente y hay otras que están más a favor. Y lo veo en LinkedIn cada vez que publico; siempre recibo a algunas personas del mismo lado diciendo que esto nunca va a funcionar, que jamás lo harían. ¿Sabes qué? Dejé de intentar convencerlos. Está bien, quédense donde están y yo trabajaré con personas que quieren hacer mejores supply chains.

Ahora, he visto múltiples clientes, he conocido grandes líderes, líderes promedio y líderes deficientes. Para mí, si quieres implementar con éxito un proceso automatizado —y podemos hablar de demand planning con machine learning, pero podríamos discutir cualquier proceso— necesitas, como líder en la sala, dar una visión clara a todos sobre cuál será su rol en el futuro. Voy a volver al demand planning, pero, de nuevo, esto se aplica a cualquier proceso. Si le dices a tu demand planner, “tu trabajo, y por el que te pago, es cambiar el forecast y modificar y ajustar los modelos”, eso es lo que la gente hará. Y eso tiene que cambiar. Tiene que cambiar a que tu trabajo es asegurarte de que los datos que ingresan al motor de forecast de la demanda sean lo mejor posible, y tu trabajo es encontrar información más allá de lo que se alimenta al modelo y, basándote en ello, quizá enriquecer el forecast si es necesario. Si no dices eso, la gente seguirá modificando el forecast día tras día, porque simplemente sentirán que, si no lo hacen, no pueden justificar su salario. Así que, de nuevo, para la adopción es extremadamente claro que debemos dar una imagen precisa, lo cual se relaciona con mi diapositiva sobre revisión basada en insights y recolección de insights, y así sucesivamente, acerca de lo que la gente debería hacer.

Ahora, algo que me gustaría añadir es la explicabilidad. Creo que es un tema abierto y yo mismo estoy aprendiendo sobre ello, pero diría que, para mí, la explicabilidad no es necesaria en absoluto. No sé cómo funciona un auto, pero lo uso y nunca intento enviar un correo a Mercedes para decir, “Bueno, nunca lo volveré a usar si me explican cómo funciona.” Nunca lo haría. No sé cómo funciona internet, no sé cómo funciona esta cosa, no tengo ni idea, y aún así lo uso.

Si un supply chain depende de la explicabilidad o de la narrativa, o de contar historias, para usar el forecast y confiar en el forecast, nunca podrás escalar, porque eso significa que tu supply chain y tu proceso dependen de que algún humano tenga capacidades de persuasión para influir en otros y que usen tu forecast porque tienen una buena historia. Para mí, necesitas confiar en el forecast porque la precisión, sin importar cómo se mida, es fiable y, con el tiempo, ha sido precisa o la decisión ha sido significativa a largo plazo. Confías en las cosas, confías en el proceso, en las personas, en los modelos, porque cuantitativamente es genial, no porque la historia tenga sentido. Si solo te fías de la historia, será un fracaso. He visto a tantos consultores ganar proyectos porque la historia tenía sentido y, luego, nunca generaba valor, porque, en realidad, una vez que haces el modelo, no crea ningún valor. Pero la historia es bonita, así que por eso trataría de mantenerme lo más alejado posible de la narrativa.

Conor Doherty: ¿Más comentarios? No hay obligación.

Alexey Tikhonov: Pocas palabras sobre la explicabilidad y sobre entender qué está pasando, cómo se producen las decisiones, cómo se generan los forecast.

Solo puedo hablar de lo que hacemos en Lokad. Abordamos los problemas con un principio de corrección por diseño. Uno de los problemas que sabemos que tendrá la gente es la falta de confianza porque no entienden cómo funcionan las cosas. Por eso usamos lo que llamamos un elemento de “white boxing”. Siempre que es posible, utilizamos modelos explícitos en los que se entiende lo que significan los parámetros, en lugar de alguna ingeniería de características opacas. De esta forma, la gente puede comprender lo que está pasando. Estos modelos no son drásticamente difíciles de comprender. Invito a la audiencia a ver nuestra participación en la competencia M5 de forecast. El equipo de Lokad fue clasificado como número uno en el desafío de incertidumbre. Si ves la conferencia impartida por nuestro CEO, Joannes Vermorel, verás que el modelo es bastante simple. Te sorprenderá cómo este modelo simple pudo alcanzar resultados state-of-the-art. No es necesario usar una IA de bleeding-edge para lograr un extra por ciento de precisión en el forecast. En el supply chain, quieres estar aproximadamente en lo correcto, no precisamente equivocado. Por eso elegimos, por ejemplo, métodos probabilísticos, ya que pueden mostrarte la estructura de la incertidumbre y, luego, cuando tienes impulsores económicos, puedes traducir esa estructura de incertidumbre en la estructura de riesgos financieros, y puedes tomar decisiones bien fundamentadas que estén ajustadas al riesgo en lugar de simplemente decisiones clasificadas en función de alcanzar un objetivo de nivel de servicio. Creo que la gente puede comprender la historia a nivel general, como qué haces y por qué lo haces. Pero, a un nivel más detallado, si tienen curiosidad, también pueden hacerlo, aunque es casi inconsecuente una vez que entiendes lo general. Una vez que ves que las decisiones son sensatas, ¿por qué te gustaría profundizar? Por ejemplo, normalmente la gente usa computadoras, pero no les interesa cómo se asigna la memoria, cómo tu memoria de acceso aleatorio está aprovechando los cálculos. A nadie le interesa eso. Lo mismo ocurre con los chips de computadora en tu auto. Sí, tienes un robot que se encarga de los cambios de marcha, pero normalmente a nadie le interesa eso. No es relevante. No hará que tu conducción sea más segura si lo sabes.

Así que, creo que en realidad tienes que alcanzar la robustez para permitir que se lleve a cabo la automatización. Creo que es un buen punto. Y, normalmente, hemos intentado construir modelos precisos en lugar de modelos robustos que funcionen mal. Las redes neuronales siempre tienen este problema. Además, creo que todos somos parciales porque estamos bastante inclinados hacia la tecnología, no tanto como mi hermano menor, por ejemplo, que simplemente ama la tecnología. Así que, también hay una consideración de edad. Pero, ¿qué genera confianza? Creo que en una reunión de alto nivel directivo, sé que una compañía de software muy grande está analizando activamente modelos de LLMs y hubo una decisión reciente. Creo que Eric Wilson del IBF, The Institute of Business Forecasting, tiene un blog y son bastante categóricos en que la IA no se hará cargo del proceso de demand planning y que todos conservarán su trabajo.

Pero recientemente hubo ejemplos en los que, en una sala de juntas, un modelo LLM entrenado con la mayoría del conocimiento que se le proporcionó —la información promocional, las interrupciones, el supply chain— y, al final, se obtuvo un forecast, y el CEO preguntó al modelo LLM por qué era así. Y la gente tenía puntos de vista diferentes. Marketing tenía un punto de vista, Finanzas otro. El modelo LLM fue el único capaz de dar un argumento comprensible de por qué ese es el número correcto. Y creo que hay otro sesgo, pero si puedes contar una historia sobresaliente sobre las cosas, la gente confiará en ello. Así que, esto también introduce confianza, incluso si está equivocada.

Sven Crone: Creo que, al observar la disponibilidad de datos y la tasa de adopción tecnológica, definitivamente habrá trabajo para los demand planners por mucho más de cinco años. Estoy bastante seguro. Además, la presión para reestructurar las empresas o innovar no es tan grande. Si miras todas estas iniciativas de digitalización, para la mayoría de las compañías ni siquiera tienen cloud storage. Quiero decir, es sorprendente cómo algunas de las multinacionales más grandes de Europa han logrado operar tan bien.

Así que, probablemente se deba a las personas increíbles que están ahí. Pero veo que, a largo plazo, realmente estamos en riesgo si no adoptamos, si los software vendors no adoptan, si no automatizas, si no apoyas decisiones —decisiones significativas como la corrección histórica—, ya sabes, y pienso que la explicabilidad es importante, no para entender “Así es como funciona una red neuronal”, sino “Estas son las variables de entrada que se le suministraron”, y poder responder a la pregunta: “¿Has considerado que la promoción se ha trasladado de la semana 5 a la semana 12?” Creo que esas son las preguntas que debes responder. Son preguntas mucho más simples.

Pero realmente creo que que, a largo plazo, con más datos disponibles, será muy difícil para los demand planners. Así que, debido a que la frecuencia de la decisión está aumentando, pasamos de mensual a semanal y posiblemente a intra-semanal forecasting para también alinearnos con los minoristas. Veo muchas más promociones, muchas más disrupciones ocurriendo. Hay tantas disrupciones que será prácticamente, se volverá increíblemente difícil para los planificadores abordar tanta información en tan poco tiempo. Y por lo tanto, realmente no creo que a largo plazo puedan competir en el nivel de precisión y fiabilidad con los modelos de machine learning si todos los datos están disponibles.

Conor Doherty: Gracias, Sven. Tus pensamientos finales, Nicolas.

Nicolas Vandeput: Para resumir en tan solo un minuto, ¿cuál es el rol de los demand planners en los próximos años y cómo va a evolucionar? Para mí, se trata de personas que van a pasar la mayor parte de su tiempo recolectando, recopilando, estructurando y limpiando datos, información e insights, alimentando la mayor parte de ello a los modelos de machine learning. Se automatizará el forecast de la demanda y la información, los insights que no se puedan alimentar a los modelos de machine learning, serán aún usados por estos planificadores para hacer un enriquecimiento manual de estos forecast. Pero estos planificadores no dedicarán tiempo a señalar outliers ni a corregirlos manualmente. No dedicarán tiempo a ajustar modelos, revisar o afinar los parámetros de los modelos ni nada por el estilo, ni siquiera a seleccionar modelos. Para mí, estas tareas deben estar 100% automatizadas. Los humanos no deberían hacer eso. Los planificadores se enfocarán en encontrar, recolectar y limpiar información e insights.

Conor Doherty: Gracias. Y Alexey, ¿tus pensamientos finales?

Alexey Tikhonov: Creo que actualmente, la planificación de la demanda ocupa un nicho de productos de software llamados sistemas de inteligencia, ya que típicamente hay tres tipos de software empresarial: sistemas de registros, que son ERPs y otros sistemas transaccionales; sistemas de reportes, que son aplicaciones de business intelligence; y sistemas de inteligencia. Este es un campo emergente. Esos son los sistemas que pueden automatizar la toma de decisiones, como es uno de los que Lokad está entregando a sus clientes. Y actualmente, los demand planners están tratando de competir en este campo.

Mi entendimiento es que a largo plazo, no pueden competir, perderán. ¿Por qué? Porque los humanos son seres grandiosos, son súper inteligentes. Pueden, si consideramos una sola decisión, superar a un robot porque siempre aportarán un insight mayor, algo que un robot no conoce, como información adicional. Pero esto no es escalable. Los humanos son costosos. Estamos hablando de supply chains de escala inmensa, por lo que no podemos escalar esto. Y esa es la razón principal por la que, a largo plazo, serán desplazados. Por las mismas razones, como en París, ya no tenemos portadores de agua, tenemos agua corriente. ¿Por qué? Porque es más barato. Sí, aún hay algunos países subdesarrollados donde, en pequeños pueblos, todavía hay gente transportando agua en cubos porque, debido a las economías de escala, el agua corriente aún no es una opción. Pero incluso en esos pueblos, en algún momento, tendrán agua corriente. Así que a largo plazo, no tienen lugar. Y en este momento, algunas empresas ya se han deshecho de ellos.

Conor Doherty: Muchas gracias a todos en el escenario por sus insights y sus respuestas. En este punto, cederé la palabra. ¿Alguien tiene alguna pregunta? Y me apresuraré a pasar el micrófono. Por supuesto, estará justo atrás. Bueno, no deberían ser tantas filas. Robert, ¿quién tenía la mano levantada?

Audience Member (Bahman): Gracias a todos. Mi nombre es Bahman. Soy de la Universidad de Cardiff. Solo quiero hacer un comentario muy breve. Mencionaron decisiones rentables. Solo quería destacar, y de hecho, este es un punto sobre lo que Sven también mencionó acerca del espectro. Hay miles de supply chains que no se tratan de obtener ganancias. Así que, creo que es importante considerar eso.

Entiendo que el panel se centró más en el supply chain, pero existe un espectro completo de demand planning. Si lo piensas, hay millones de hospitales en el mundo haciendo demand planning, y están manejando una o dos o tres series temporales. Así que, mi pregunta es más sobre en qué consisten las condiciones o cuáles son los requisitos para crear decisiones automáticas, dado que las decisiones se basan en el forecast como un insumo. Hay muchos otros insumos, algunos de ellos pueden ser forecast, pero la mayoría probablemente no lo sean.

Sven Crone: Intentaré responder a eso. Los hospitales, por ejemplo, tienen un gran stock de replenishment, productos importantes como sangre, productos menos importantes y así sucesivamente, ya sabes, medicinas para el tratamiento del cáncer, algunos de estos son make to order, make to stock. Creo que nos enfocamos mucho, ya que mi experiencia no es en hospitales o sistemas de salud. Nos concentramos mucho en la industria, en el lado industrial, ya sabes, quiero decir, ¿qué industria? supply chain management, logística, la cual probablemente está definida por Gartner; ahora estamos hablando de compañías multinacionales muy grandes que implementan estos procesos bien definidos que han sido probados y comprobados, que miden el forecast value added.

Creo que tienes razón, probablemente es aplicable a muchas otras industrias, farmacias y hospitales, y así sucesivamente. Pero tengo poca evidencia sobre la adopción allí, pero creo, ya sabes, para la industria de supply chain logística, que es aproximadamente un sexto del PIB global del mundo, ¿verdad? Así que estamos hablando de un sexto del PIB global que está impulsado principalmente por compañías muy grandes. Allí realmente nos preocupa la falta de innovación en relación con estas cosas. Pero eso no significa que no deba aplicarse en otros lugares.

Audience Member (Bahman): Quiero decir, tal vez la mejor terminología sería supply chain de servicio. Por ejemplo, en hospitales, tienes demand planning para servicios de emergencia. No se trata necesariamente de productos, sino del servicio en sí. Así que, creo que mi pregunta es más sobre la toma de decisiones automática, porque, como dije, existe un espectro, ya sabes, desde los departamentos de emergencia, que en realidad manejan una sola serie temporal, y este es quizás el caso en el que no se manejan millones o miles de series temporales. Entonces, la pregunta es, ¿cuáles son los requisitos para crear una toma de decisiones automática?

Sven Crone: Creo que tienes razón. Quiero decir, es un tema muy interesante, hay muchas áreas interesantes en las que en la comunidad de forecasting no hemos prestado tanta atención como a otras, ¿verdad? Si observas los 10,000 artículos en neural network forecasting, creo que la mitad son sobre electricidad, ¿no? Pero muy pocos son sobre farmacéuticos. Así que es un buen punto. Creo que deberíamos prestar más atención a lo importante.

Conor Doherty: Perdona por interrumpirte, Nicolas, puedes responder la siguiente pregunta. Quiero ceder la palabra a la siguiente pregunta.

Audience Member: Hola, gracias por una discusión tan maravillosa. Mi pregunta es más sobre el rol del juicio. Así que, mi pregunta es: cada experto tiene diferentes juicios. Entonces existe un patrón de sesgo que se genera a partir del juicio humano y existe un patrón de sesgo que se genera a partir de los modelos de AI o ML, sea cual sea el modelo estadístico. Entonces, ¿cómo podemos incorporar el sesgo del juicio humano en el sesgo estadístico para reducir el sesgo general cuando estamos haciendo demand planning? Gracias.

Nicolas Vandeput: Gracias por tu pregunta. Es un caso habitual en el que trabajo con supply chains. Una de las primeras cosas que hacemos es analizar históricamente cómo se desempeñó tu forecast. Si tuvieron un sesgo muy alto o muy bajo, under forecasting o over forecasting, siempre se reduce a una historia. La gente hace over forecast porque quiere estar en el lado seguro, probablemente porque el proceso de supply no es bueno y realmente no saben cómo manage inventory. Así que, en lugar de cambiar las políticas o el objetivo de safety stock, confían en un forecast muy alto. Tal vez también tengan un forecast muy alto porque quieren ser optimistas, quieren ajustarse al presupuesto, y así sucesivamente.

Por otro lado, el under forecasting podría suceder porque la gente quiere superar el forecast para obtener un bono. Así que, usualmente, si tu supply chain genera un sesgo muy alto, es un problema de incentivos incorrectos o de un proceso de supply defectuoso y necesitas desconectar eso, reentrenar a la gente, tal vez mejorar tu proceso de supply y, posiblemente, hacer imposible que algunas personas cambien el forecast si tienen un incentivo directo para hacerlo alto o bajo. Eso es parte del proceso, por lo que debemos enfocarnos en personas que no tengan incentivos para hacer forecasts altos o bajos.

La parte del modelo, si tienes un modelo que genera, a lo largo del tiempo, forecasts muy altos o muy bajos, demasiado altos o demasiado bajos, no estoy diciendo que un mes esté mal, claro, lo que digo es que, durante múltiples periodos, tienes el mismo problema, lo cual es muy probablemente un problema debido a cómo optimizas tu motor de modelo, y muy probablemente debido a que el KPI que se usa para optimizar el modelo no es el correcto. Apostaría a que se basa en MAPE, pero ese es otro tema.

Conor Doherty: ¿Puedes darle a Alexey la oportunidad de dar un pensamiento final, ya que debemos terminar pronto?

Sven Crone: Solo quiero agregar algo a lo que dijo Nicolas. Cuando hablamos de que los LLMs quizá tomen el control de hacer ajustes de juicio, realmente no profundizamos en cómo funciona eso. Pero hay mucha evidencia hoy en día de que no se utiliza un solo LLM para entrenar con todos los datos y obtener un único valor. En realidad, tendrías personas en las que entrenarías estos. Tendrías un LLM de supply chain, un LLM de finance, un LLM de CEO, un LLM de marketing y uno de key account management, todos entrenados con datos diferentes. A menudo, estos sesgos provienen de diferentes costos asociados con las decisiones para key account versus supply chain. Pero a menudo, tienes información diferente y lo que realmente observan puede conducir a una toma de decisiones mejorada si, en realidad, tienes agentes que conversan entre sí y debaten a favor de un proceso consolidado.

No es raro ver buenas prácticas en S&OP donde alcanzan un consenso y ese consenso es más preciso que la decisión de un único LLM. Es realmente escalofriante porque los sesgos están presentes, las tomas de decisiones están ahí y luego hay alguien al final que decide basándose en ponderar la información. Es fantasmal.

Conor Doherty: Alex, la última palabra para ti y luego finalizaremos.

Alexey Tikhonov: Sobre la misma pregunta, creo que el sesgo es un problema desde la perspectiva del forecast puntual. Típicamente, la razón por la que quieres que tu forecast tenga un sesgo intencional es porque tu forecast resulta algo ingenuo al capturar la estructura del riesgo. Predices el escenario futuro más probable y luego asumes que los residuos del modelo están distribuidos normalmente, lo cual nunca es el caso. Por eso introduces el sesgo que desplaza tu predicción hacia donde se concentra la mayor parte del riesgo. Por ejemplo, hacia la cola derecha, como cuando quieres forecast la probabilidad de cola de no alcanzar tus objetivos de nivel de servicio y, por lo tanto, desplazas el sesgo.

Cuando cambias a una perspectiva probabilística, ya no necesitas este sesgo porque lo que obtienes es una opinión sobre el futuro que se expresa como: este futuro con esta probabilidad, ese futuro con esta probabilidad. Tan pronto como entrenas los parámetros que capturan la estructura del riesgo con suficiente precisión, entonces todo lo que necesitas adicional es una perspectiva económica, como costos, ganancias y algunos impulsores de orden superior, tales como aquellos que te permiten tomar decisiones de compensación. Por ejemplo, ¿debería comprar una unidad extra de este bien versus una unidad extra de ese bien, dado que tu presupuesto siempre está limitado? Con una perspectiva probabilística, no tienes este problema porque no se necesita sesgo.

Conor Doherty: Con esa nota, soy consciente de que nos hemos excedido un poco en el tiempo. Para quien quiera hacer preguntas de seguimiento, lo intentaremos en la esquina del escenario. Pero, una vez más, Sven, Nicolas y Alexey, muchas gracias por acompañarnos y disfruten el resto del día. Gracias.