00:00:07 Introducción al tema del aprendizaje automático en la industria de la cadena de suministro.
00:00:46 Introducción al invitado Alexander Backus, quien es el líder de datos y análisis en IKEA.
00:02:20 Explicación del concepto de profecía autocumplida.
00:03:03 Discusión sobre cómo una profecía autocumplida afecta la cadena de suministro, como los objetivos comerciales y la influencia de la demanda y la oferta.
00:07:14 Explicación de cómo los bucles de retroalimentación en la cadena de suministro hacen que el mundo sea más complejo y cómo un exceso de cierto producto puede influir en sus ventas.
00:08:53 Discusión sobre los bucles de retroalimentación en las cadenas de suministro y la influencia del comportamiento humano en ellos.
00:10:41 Uso de datos de ventas en la previsión de la demanda y las posibles consecuencias de utilizar un enfoque ingenuo.
00:13:08 Problema de pronóstico cero en los sistemas de aprendizaje automático y el efecto látigo.
00:15:17 Explicación del sesgo de falta de stock y técnicas para lidiar con él.
00:17:22 Discusión sobre la prevalencia de las faltas de stock y la efectividad del método para lidiar con el sesgo de falta de stock.
00:18:15 Explicación de cómo la percepción del cliente sobre un producto puede afectar la demanda y el impacto de los niveles de stock en las ventas.
00:20:17 Explicación del enmascaramiento de pérdidas y su propósito.
00:20:26 Explicación de cómo darle al modelo acceso a los niveles de stock puede ayudarlo a comprender el efecto de las fluctuaciones de los niveles de stock en las ventas.
00:22:14 Discusión sobre las limitaciones de utilizar un modelo de aprendizaje automático para la inferencia causal y los efectos de las variables de confusión.
00:25:54 Explicación de cómo la previsión probabilística puede ayudar a reducir el impacto de la falta de pronóstico al reconocer la “imprecisión” de la información disponible.
00:27:04 Explicación de los beneficios de utilizar un modelo de previsión probabilística.
00:28:44 Ventajas de utilizar un modelo de previsión probabilística en lugar de un pronóstico puntual.
00:30:42 Bucles de retroalimentación y cómo afectan el pronóstico.
00:34:35 Cómo los precios pueden afectar el pronóstico.
00:36:32 Explicación de la observabilidad parcial y su desafío en la creación de un modelo para la gestión de la cadena de suministro.
00:37:04 Comparación con el concepto de retroalimentación de bandit y su conocida aplicación en los sistemas de recomendación de comercio electrónico.
00:37:17 Discusión sobre las limitaciones del aprendizaje supervisado en la predicción del impacto de las decisiones en la gestión de la cadena de suministro.
00:38:01 Explicación del algoritmo de aprendizaje por refuerzo basado en políticas.
00:41:06 Discusión sobre los desafíos en la aplicación del algoritmo de aprendizaje por refuerzo en la gestión de la cadena de suministro del mundo real y la solución de comenzar con el aprendizaje fuera de línea a partir de datos históricos.
00:44:55 Discusión sobre cómo los hábitos y las prácticas pasadas afectan los movimientos de precios en una empresa.
00:46:41 Explicación de la explotación y la exploración en el aprendizaje por refuerzo.
00:50:57 La necesidad de reconocer los bucles de retroalimentación en el pronóstico como un cambio de paradigma.
00:52:45 Los desafíos técnicos y culturales para incorporar la inteligencia artificial en los procesos empresariales.
00:53:57 Discusión sobre los desafíos en la modelización y toma de decisiones en la industria de la cadena de suministro.
00:54:55 Reconocimiento de la existencia de bucles de retroalimentación en el proceso de la cadena de suministro.
00:55:06 Avanzar hacia un enfoque basado en decisiones en lugar de un enfoque basado en pronósticos.
00:57:27 La tendencia en la industria de la cadena de suministro, especialmente entre las grandes empresas de comercio electrónico.
01:01:03 Qué cualidades se buscan al incorporar nuevas personas para trabajar en los desafíos de la cadena de suministro en IKEA.

Resumen

En una entrevista moderada por Nicole Zint, Joannes Vermorel, fundador de Lokad, y Alexander Backus, líder de Datos y Análisis en IKEA, discuten la aplicación del machine learning y la inteligencia artificial en la industria de la cadena de suministro. La entrevista destaca el impacto de las profecías autocumplidas y los bucles de retroalimentación en la gestión de la cadena de suministro y enfatiza los desafíos de utilizar modelos de machine learning en el pronóstico. La entrevista también explora enfoques para evitar el problema de pronóstico cero, como el uso de pronóstico probabilístico, y la importancia de reconocer la incertidumbre en el pronóstico de la cadena de suministro. Los panelistas enfatizan la necesidad de abrazar la incertidumbre, avanzar hacia modelos de toma de decisiones, e incorporar cambios de manera gradual para mejorar la gestión de la cadena de suministro.

Resumen Extendido

En esta entrevista, Nicole Zint modera una discusión entre Joannes Vermorel, fundador de Lokad, y Alexander Backus, líder de Datos y Análisis en IKEA, sobre la aplicación del machine learning y la inteligencia artificial en la industria de la cadena de suministro. Discuten el concepto de profecía autocumplida y su impacto potencial en las cadenas de suministro, el papel de los bucles de retroalimentación y los desafíos de utilizar modelos de machine learning en el pronóstico.

Una profecía autocumplida es una predicción que directa o indirectamente se convierte en realidad debido a la retroalimentación entre la creencia y el comportamiento. En la gestión de la cadena de suministro, los pronósticos pueden afectar los procesos de toma de decisiones y, en última instancia, cambiar el futuro. Vermorel señala que las profecías autocumplidas no son inherentemente buenas ni malas; simplemente hacen que la situación sea más compleja.

Los bucles de retroalimentación son frecuentes en las cadenas de suministro, ya que los seres humanos reaccionan a los pronósticos, lo que luego puede afectar las predicciones futuras. Vermorel destaca cómo estos bucles pueden manifestarse de diversas formas, como ajustar precios o ubicaciones de productos en función de los niveles de stock. También señala que los competidores pueden alterar sus estrategias en respuesta a los pronósticos de una empresa, creando bucles de retroalimentación adicionales.

Backus explica que los datos de ventas son una entrada clave para los modelos de aprendizaje automático en la previsión, pero las ventas no son lo mismo que la demanda. Los datos de ventas pueden verse influenciados por la oferta y otros factores, mientras que la demanda es una cantidad no observada que debe inferirse. Él enfatiza la importancia de distinguir entre los dos y considerar su interacción en el proceso de previsión.

Los modelos de aprendizaje automático pueden ser problemáticos en la previsión de la cadena de suministro si no están diseñados para tener en cuenta los bucles de retroalimentación y las profecías autocumplidas. Backus menciona el “efecto látigo”, donde pequeñas desviaciones en la cadena de suministro pueden ser amplificadas por el sistema. Esto puede llevar a efectos perjudiciales, como ventas en espiral o predicciones inexactas. Contrasta la predicción del clima, que no está influenciada por el comportamiento humano, con la predicción de los resultados comerciales, que están sujetos a estos complejos bucles de retroalimentación.

Para mitigar los desafíos planteados por los bucles de retroalimentación y las profecías autocumplidas, Vermorel sugiere que las empresas deben abrazar la complejidad de los sistemas de la cadena de suministro y reconocer que los pronósticos puntuales pueden ser insuficientes. En su lugar, deben buscar comprender y anticipar los posibles impactos de sus pronósticos en el comportamiento humano y los procesos de toma de decisiones.

En resumen, la entrevista explora las complejidades de utilizar el aprendizaje automático e IA en la gestión de la cadena de suministro, destacando la importancia de comprender las profecías autocumplidas y los bucles de retroalimentación para mejorar la precisión de la previsión y la toma de decisiones.

El problema de la previsión cero ocurre cuando un sistema ordena menos stock debido a una disminución percibida en la demanda, lo que provoca una disminución aún mayor de la demanda y una disminución continua de los pedidos. Para evitar este problema, Vermorel sugiere eliminar el sesgo de faltante de stock cambiando la métrica utilizada en el modelo de previsión. Un enfoque es anular las mediciones en los días con faltantes de stock. Este método funciona bien cuando los faltantes de stock son relativamente raros, pero es menos efectivo en industrias con altas tasas de faltantes de stock.

Otro enfoque es dar al modelo de aprendizaje automático acceso a datos históricos y futuros de niveles de stock, lo que le permite aprender el efecto de las fluctuaciones en los niveles de stock en las ventas o la demanda futura. Este método requiere alimentar todas las decisiones y factores que afectan la demanda, como promociones, precios, capacidad, restricciones de almacén y fuerzas del mercado, en el modelo de previsión.

Sin embargo, Backus advierte que el uso de un modelo de aprendizaje automático estándar sin toda la información necesaria puede llevar a errores, como confundir la causa y el efecto de los cambios en los niveles de stock y las fluctuaciones de la demanda. Para evitar estos problemas, sugiere utilizar la previsión probabilística, que reconoce la imprecisión de la información disponible y evita converger en una confianza absoluta en que la demanda sea cero.

La previsión probabilística distribuye las probabilidades en muchos valores, lo que dificulta converger en una confianza absoluta en la demanda cero. Este enfoque evita que el inventario se congele en cero al estimar probabilidades no nulas para la demanda futura. También tiene en cuenta la asimetría entre atender a un cliente y mantener stock adicional por un día extra, favoreciendo niveles de servicio más altos.

A pesar de sus ventajas, la previsión probabilística no es una solución perfecta. Todavía puede subestimar la demanda futura en casos de faltantes de stock repetidos. Sin embargo, proporciona un método más sólido para gestionar el inventario y evitar el problema de la previsión cero.

En conclusión, adoptar técnicas de aprendizaje automático y previsión probabilística puede ayudar a los profesionales de la cadena de suministro a predecir mejor la demanda y gestionar los niveles de inventario. Al considerar diversos factores que influyen en la demanda y tener en cuenta las incertidumbres en los datos disponibles, las empresas pueden tomar decisiones más informadas y mejorar su rendimiento de la cadena de suministro.

Joannes Vermorel enfatizó la importancia de reconocer la incertidumbre en la previsión de la cadena de suministro, ya que es irrealista modelar perfectamente los eventos futuros. Habló sobre el concepto de previsión probabilística, que refleja la incertidumbre inherente de los eventos de la cadena de suministro, y cómo difiere de las previsiones puntuales. Las previsiones probabilísticas, explicó, involucran distribuciones de probabilidad, lo que hace que el futuro se vea muy diferente al pasado. También mencionó los bucles de retroalimentación como una dimensión adicional para enriquecer las previsiones al hacerlas dinámicas y condicionales al comportamiento futuro.

Alexander Backus estuvo de acuerdo con los puntos de Vermorel y explicó cómo dar acceso a los modelos a decisiones anteriores, como la fijación de precios, puede aliviar los problemas con la previsión. Presentó el concepto de observabilidad parcial, que implica observar solo el efecto de una decisión sin conocer el contrafactual. Con el fin de predecir mejor el impacto de las decisiones, Backus sugirió reformular los problemas de aprendizaje automático para generar decisiones óptimas en lugar de predicciones sobre el futuro. Este enfoque se llama aprendizaje por refuerzo.

La conversación gira en torno a los desafíos de la previsión y la toma de decisiones en la gestión de la cadena de suministro debido a los bucles de retroalimentación, los datos limitados y las decisiones no aleatorias. Enfatizan la necesidad de aceptar estos bucles de retroalimentación y avanzar hacia un modelo que genere decisiones en lugar de previsiones. La tendencia entre las empresas con mentalidad tecnológica como Amazon y Alibaba es abandonar la idea de una previsión perfecta y centrarse en la toma de decisiones. A pesar de los desafíos existentes, los panelistas están de acuerdo en que la industria debe trabajar para incorporar estos cambios de manera gradual para mejorar la gestión de la cadena de suministro.

Vermorel destaca la importancia de aceptar la incertidumbre y la complejidad irreducible de las cadenas de suministro, que están compuestas por humanos, máquinas y procesos. Aboga por ser aproximadamente correcto en lugar de exactamente equivocado. Backus enfatiza la necesidad de contar con un gran talento en ciencia de datos para enfrentar los desafíos dentro de grandes corporaciones como IKEA, haciendo hincapié en el potencial de impacto global y la importancia de desafiar el statu quo.

Transcripción completa

Nicole Zint: Bienvenido Alexander Backus, que nos acompaña hoy en nuestras oficinas. Alexander es un experto en este campo y es el líder de Datos y Análisis en IKEA. Entonces, como siempre, nos gustaría comenzar dejando que nuestros invitados se presenten. Alexander, si lo deseas, tienes la palabra.

Alexander Backus: Gracias, Nicole. Gracias por tenerme aquí. Es genial estar aquí en París contigo. Mi nombre es Alexander Backus y lidero el análisis de datos en el dominio de operaciones de inventario y logística de IKEA Inka Group Digital. Gestiono un grupo de científicos de datos, ingenieros de datos y analistas de datos que trabajan en equipos de productos interfuncionales con la misión de optimizar la planificación de las operaciones de logística de inventario. Tengo experiencia en ciencia de datos y he trabajado como consultor para grandes empresas como KLM Airlines, Heineken, Vodafone Ziggo y ING Bank. Después de hacer un PGD en Neurociencia Cognitiva, creo que trabajar en la cadena de suministro como científico de datos es un campo realmente emocionante porque combina muchas condiciones favorables para la ciencia de datos. Hay muchos datos, hay un impacto en la toma de decisiones del mundo real, por lo que es algo tangible, y no solo afectas a la línea de fondo, sino que también ayudas a crear un mundo más sostenible reduciendo el desperdicio en la cadena de suministro. Así es como terminé aquí.

Nicole Zint: Antes de adentrarnos en estos temas, expliquemos primero el concepto que vamos a discutir. Comencemos: ¿Qué es una profecía autocumplida?

Alexander Backus: La idea es que el pronóstico que haces para optimizar tu proceso empresarial realmente afecta a cierto proceso de toma de decisiones. Se toma una decisión basada en tu pronóstico, al menos eso es lo que quieres. Cuando eso sucede, significa que tu pronóstico en sí está cambiando el futuro y también está cambiando los datos que se utilizan para pronosticar la próxima vez. Esto puede plantear ciertos desafíos. Esencialmente, una profecía autocumplida es cuando una predicción ocurre porque fue predicha. Entonces, afectas al futuro porque pensaste que sería de cierta manera. No solo estás afectando al futuro, sino que también creas una realidad donde el pronóstico se convierte en la verdad, y eso puede suceder de varias maneras. Por ejemplo, si tienes un pronóstico de tu negocio o tus ventas, esto puede convertirse en el objetivo para tu negocio.

Nicole Zint: Entonces, las personas de marketing toman ciertas decisiones, dicen, está bien, debemos alcanzar este objetivo porque ahora estamos un poco bajos, así que necesitamos vender un poco más y necesitamos hacer algunas promociones. Entonces, en realidad, el pronóstico que hiciste se ha convertido en el objetivo que ha llevado a la toma de decisiones en el camino, lo que afecta cuál será el resultado final de las ventas en este ejemplo. Y eso puede suceder de muchas maneras. Otro ejemplo es cuando tienes un cierto pronóstico que hace que asegures una determinada capacidad de entrega o capacidad de selección en tus almacenes, y eso tiene un impacto en el tiempo de entrega. Entonces, cuando un cliente mira tu sitio web de comercio electrónico y ve que el tiempo de entrega es muy alto o muy bajo, puede ir en cualquier dirección; eso realmente influye en la demanda de los clientes.

Alexander Backus: Exactamente, la demanda influye en tu oferta y la oferta influye en la demanda. Va en ambas direcciones, y ese es en realidad el efecto al que estás aludiendo, Joannes. Cuando se trata de los pronósticos que se convierten en objetivos comerciales, ¿cómo ves que eso afecta al negocio en sí? ¿Cuáles son las desventajas cuando el pronóstico es algo a lo que las personas apuntan en lugar de mirar realmente el rendimiento de su cadena de suministro?

Joannes Vermorel: No hay desventajas en sí mismas. Es más bien una cuestión de que así es como opera la cadena de suministro. Sabes, los bucles de retroalimentación están por todas partes. Estamos tratando con asuntos humanos esenciales donde lo que sorprende a los profesionales es que en muchas escuelas de ingeniería e incluso en muchas empresas, las personas abordan los pronósticos como el enfoque del pronóstico del movimiento de los planetas, algo donde tienes un marco muy claro donde tienes observaciones pasadas y puedes hacer una afirmación sobre la posición futura del planeta. Pero tú, como pronosticador, no tienes ningún impacto en esos elementos que se observan, como los planetas.

Nicole Zint: ¿Entonces quieres decir que una profecía autocumplida no es necesariamente buena ni mala, simplemente es?

Joannes Vermorel: Sí, exactamente. No puedes pretender que no afecte, pero ciertamente hace que la situación sea más compleja y complicada, en realidad un poco de ambas. Y por lo tanto, donde se vuelve un poco desconcertante es que muchas empresas tienen dificultades para aceptar cualquier cosa que no sea un pronóstico puntual o pronóstico puntual. Digamos, tienes un futuro; eso es todo. Y es esencialmente algo que es completamente simétrico al pasado. Tienes tus observaciones pasadas y te gustaría tener un futuro que sea tan limpio y ordenado como el pasado, esencialmente más de lo mismo.

Nicole Zint: Sí, más de lo mismo pero también realmente lo mismo en naturaleza. Así que tienes una visión perfectamente clara sobre el pasado y una visión perfectamente clara sobre el futuro. Y por cierto, en el caso del movimiento de los planetas, siempre y cuando no estés mirando millones de años hacia adelante, puedes tener una visión completamente perfecta de la posición de esos planetas dentro de un siglo a partir de ahora.

Joannes Vermorel: Ahora, donde se vuelve interesante es que en la cadena de suministro, tienes bucles de retroalimentación por todas partes. Cada vez que te comprometes con un producto comprando mucho, de hecho, creas expectativas y las personas sienten que tienen que vender el producto, y harán lo que sea necesario para que la empresa no se quede con un exceso de stock masivo que no hayan logrado vender. Se organizarán para que este suministro masivo se transforme en ventas masivas, o al menos eso es lo que intentarán hacer. Ajustan el precio según la cantidad que tienen en stock, o a veces cosas aún más mundanas. Si hay tiendas, si tú

Nicole Zint: En una dirección ligeramente diferente, solo para establecer una diferenciación más grande, ves esos bucles de retroalimentación, están por todas partes y no son malos. Simplemente están presentes, y nuevamente la razón principal es porque en el medio tenemos seres humanos que pueden pensar y actuar en función de esas mejoras sobre el futuro. Entonces, siempre que haya humanos en el proceso, siempre que estés haciendo una afirmación sobre el futuro, las personas reaccionarán de acuerdo con esas afirmaciones. Las cadenas de suministro son muy complejas, por lo que esas reacciones pueden tomar muchas formas. Pero todas las cadenas de suministro tienen en común tener muchas personas, y a veces, por ejemplo, el bucle de retroalimentación también toma la forma de anunciar una escasez de algo. Entonces las personas se apresuran a comprar ese algo, y así puedes tener una escasez creada por el hombre solo por el efecto psicológico.

Joannes Vermorel: Exactamente. Y la idea de que si anuncias una escasez, es muy probable que causes una escasez, no es nada nuevo. Es relativamente predecible, pero no obstante, es difícil anticipar todas esas señales porque de repente tienes que ser perfecto. Sí, y de repente tienes que modelar, de alguna manera, la psicología de las personas que están en medio de la cadena de suministro.

Nicole Zint: Joannes, sigues mencionando estos bucles de retroalimentación. Alexander, ¿puedo preguntarte qué datos reales se retroalimentan en estos sistemas para que nuestros espectadores lo entiendan? Entonces, ¿en qué punto de la cadena de suministro retroalimentamos los datos?

Alexander Backus: Buena pregunta. Creo que una fuente muy importante para hacer cualquier tipo de pronóstico es tu datos de ventas, y estos son también los datos clave que se ven afectados por los efectos que acabamos de mencionar. Entonces, si volvemos a lo que Joannes estaba explicando, el enfoque ingenuo para el pronóstico de la demanda, o el pronóstico empresarial en general, es donde tomas un modelo de aprendizaje automático supervisado y comienzas a tratarlo como un problema básico de regresión. Entonces dices: “De acuerdo, solo voy a predecir esta cantidad basándome en datos históricos utilizando un algoritmo de aprendizaje supervisado”. Y luego, si tomas ese modelo que está entrenado para predecir ventas futuras y ahora piensas en los ejemplos de los bucles de retroalimentación que discutimos, puedes tener casos perjudiciales o degenerados aquí. Entonces, donde tu modelo predice una baja demanda o bajas ventas, seamos muy cautelosos de no confundir los dos, pero ignoremos por un momento que las ventas no son demanda.

Y así te llevará a una situación en la que predices bajas ventas, por lo que también haces una planificación de capacidad baja, y por lo tanto también vendes menos, y luego irás bajando hasta llegar a cero. Entonces, el modelo comenzará a aprender que la demanda está cayendo, pero está cayendo. Y también puede suceder lo contrario, en realidad. También puede aumentar en espiral en ese sentido.

Joannes Vermorel: Sí, existen estos efectos perjudiciales si usas un modelo de aprendizaje automático para aprender del pasado y predecir el futuro de esta manera más ingenua que puede salir completamente mal aquí.

Nicole Zint: Suena un poco como el efecto látigo, donde un error en una cadena de suministro o una desviación de la norma se amplifica por el sistema. Y también mencionaste el hecho de que las ventas no son necesariamente demanda, porque puedes vender 50 unidades de tu stock, pero si la demanda era de 100, solo se registrará que tus ventas son 50. Esa distinción está relacionada con el núcleo de este problema.

Alexander Backus: Sí, la demanda en sí misma es, por supuesto, una cantidad no observada. No puedes medirla, así que necesitas inferirla. Y los datos de ventas son lo más cercano a eso, pero definitivamente no es todo.

Nicole Zint: Entonces, estamos discutiendo la idea de que los pronósticos producidos pueden influir en la demanda y las ventas, creando un bucle de retroalimentación. Algunos han descrito la diferencia entre predecir el clima y predecir los negocios, donde predecir el clima no lo afecta, mientras que predecir los negocios puede tener un impacto real. Alexander, ¿podrías ampliar sobre este bucle de retroalimentación y cómo evitamos el problema de pronóstico cero que mencionaste?

Alexander Backus: Ciertamente. Cuando un modelo de aprendizaje automático aprende a partir de sus propios datos de salida, puede amplificar las desviaciones de la norma. Por ejemplo, si la demanda disminuye un poco por cualquier motivo, el modelo puede indicarle al sistema que ordene menos. Como resultado, la demanda disminuye aún más porque se ordena menos, y luego el modelo sugiere ordenar aún menos, lo que lleva a un problema de pronóstico cero. Este problema es particularmente común en el pronóstico de series de tiempo. Joannes, ¿cómo evitamos este problema con los sistemas de aprendizaje automático?

Joannes Vermorel: El pronóstico cero es algo que obtienes cuando no eliminas el sesgo de faltante de stock, que puede ser bastante fuerte. Si te quedas sin stock, observas ventas cero, pero eso no significa que no haya demanda cero. Tenemos al menos tres técnicas en producción en Lokad para lidiar con el sesgo de faltante de stock. Un enfoque implica cambiar la métrica que estás optimizando con tu modelo de pronóstico. En lugar de aplicar la métrica de manera uniforme a lo largo del tiempo, anulas las mediciones en los días en que tienes faltantes de stock. Es un enfoque rudimentario, pero puede funcionar.

Nicole Zint: ¿Qué métrica se usa típicamente inicialmente que sugieres cambiar?

Joannes Vermorel: Hay miles de métricas, pero las más simples son L1, L2 o incluso MAPE. La pregunta es si aplicas la métrica de manera uniforme a lo largo del tiempo. La respuesta típicamente es no, no quieres aplicarla de manera uniforme. Quieres anular tus mediciones en los días en que tienes faltantes de stock.

Nicole Zint: Entonces, ¿anular significa eliminar la contribución de un día en el que hubo un faltante de stock?

Joannes Vermorel: Sí, eliminas la contribución de un día cuando sabes que tu señal está fuertemente distorsionada. Funciona bien cortar esa señal, pero es un enfoque bastante rudimentario.

Nicole Zint: No si tus faltantes de stock resultan ser muy frecuentes. Para muchas empresas, los faltantes de stock son estadísticamente relativamente raros. Tienen un nivel de servicio de más del 95%, por lo que este tipo de método funciona bien si los faltantes de stock son algo excepcional, como un desastre natural que ocurre con bastante poca frecuencia.

Joannes Vermorel: No, me refiero a una tienda de mercancía en general, como un supermercado. Tienen un nivel de servicio del 95% o más todos los días, eso está bien. Donde no funcionaría sería, por ejemplo, para una tienda de lujo. En este caso, una tienda de lujo, solo para darte una idea, típicamente tendría, digamos, 500 artículos de un catálogo de 5,000. Por definición, tienes más del 90% de faltante de stock todo el tiempo. En este caso, no tiene mucho sentido. Como ves, realmente depende de la industria. Hay industrias como, por ejemplo, la alimentación, donde esperas niveles de servicio muy altos. Tu surtido está orientado hacia cosas que se supone que debes tener. Por ejemplo, si tu supermercado suele vender un paquete de botellas de soda, deberías poder entrar a la tienda con la confianza de que encontrarás esas unidades. A veces no lo harás, pero esos eventos serán raros. Entonces, nuevamente, depende de los sectores en los que estés mirando.

Nicole Zint: Ok, y esencialmente, las ventas pueden enviar una señal equivocada sobre la demanda, como explicaste. Si las ventas son cero, se puede asumir erróneamente que significa cero demanda, pero en realidad podría ser porque no tienes ese stock. De hecho, puede haber una demanda muy alta en eso. Y lo contrario también es cierto. Si tienes un faltante de stock para otro producto que resulta ser un buen sustituto, entonces puedes ver que las ventas de un artículo aumentan mientras que solo reflejan el hecho de que te estás quedando sin stock de algo que es un sustituto cercano. Sin embargo, la percepción del cliente podría ser que es un mal servicio.

Joannes Vermorel: Sí, porque los clientes podrían estar dispuestos a aceptar el sustituto, pero aún podrían pensar que es una opción inferior. Entonces, nuevamente, lo interesante es considerar al agente, los clientes, y lo que piensan, y tratar de ajustar tu modelización de la demanda para capturar la línea básica de pensamiento que va a tener tu base de clientes.

Nicole Zint: ¿Cómo evitamos este problema de pronóstico cero para que no se asuma que cero ventas significa cero demanda?

Alexander Backus: Jiran ha mencionado simplemente no tener en cuenta esa señal, evitar esos días. En términos técnicos, eso se llama enmascaramiento de pérdidas.

Joannes Vermorel: Sí, básicamente eliminas la contribución de ese punto de datos. Otra técnica sencilla es darle al modelo acceso a los niveles de stock históricos y tal vez algunas proyecciones futuras, para que puedas entender cómo estas ventas son influenciadas por los niveles de stock.

Alexander Backus: El modelo puede aprender entonces cuál es el efecto de ciertas fluctuaciones en los niveles de stock en las ventas o la demanda futura si lo modelas. Esencialmente, el efecto de las decisiones.

Joannes Vermorel: Sí, eso es a donde todos quieren llegar, donde tomas todas las decisiones que se han tomado basadas en tus pronósticos anteriores y las alimentas como entrada a tu modelo de pronóstico.

Nicole Zint: Cuando lo entrenas, no solo son las decisiones de stock las que impactan los niveles de stock, sino que también pueden ser decisiones de marketing, como incluso un objetivo establecido por la dirección del negocio. Ellos dicen: “Oye, esto es cuánto queremos vender”. Eso es una decisión en sí misma porque tenemos todas estas fuerzas del mercado.

Alexander Backus: Sí, fuerzas del mercado. Pones todo eso en el pronóstico como una entrada, como promociones, datos de precios y datos de capacidad. La capacidad también puede influir en la demanda. Si los tiempos de entrega se disparan, la gente busca alternativas. Esencialmente, todas las restricciones en el negocio, almacenes y todo lo que pueda afectar la demanda, sirven como señales de entrada a tu modelo. Luego, el modelo puede aprender de la historia cuál es el efecto de estas señales en la demanda y corregirlo en consecuencia.

Este es un paso interesante en tu modelización porque hay muchas cosas de las que debes tener cuidado aquí. Un paso interesante adicional es que los usuarios comerciales quieren usar tu modelo para hacer lo que se llama, en términos técnicos, inferencia causal. Quieren ajustar cosas como: “¿Qué sucede si hacemos esta promoción o si reducimos los niveles de stock? ¿Qué sucede con la demanda?” Es como una simulación.

Para que esto funcione, debes tener mucho más cuidado en la modelización. Si lo haces de la manera que expliqué, tu modelo puede aprender fácilmente efectos como que cuando el stock es bajo, la demanda es alta, simplemente porque alguna campaña de marketing, que es la causa real, hizo que el stock disminuyera y la demanda aumentara. Confunde el concepto. Eso se llama confusor o causalidad inversa. Un modelo de aprendizaje automático estándar, sin tener toda la información que necesita, cometerá este tipo de error.

Un ejemplo clásico es cuando intentas predecir si hará calor. Puedes predecirlo por el número de ventas de helados. Bueno, por supuesto, ese es un ejemplo típico de causalidad inversa. Pero tal vez redujeron sus precios o tuvieron un faltante de stock, y esa fue la razón real. Hay muchas cosas posibles.

Pero debes tener cuidado. Esta es una forma de comenzar a darle a tu modelo más información sobre las decisiones que se tomaron sobre él y asegurarte de que aprenda cómo relacionarse. Sin embargo, esto seguirá siendo bastante desafiante para el propio modelo aprender estas relaciones, especialmente si hay muchos pasos intermedios donde no tienes datos. Si das un pronóstico, no es uno a uno que alguien en el negocio lo tome y tome decisiones al respecto. Se agregará información, se realizarán cambios por parte de los planificadores en el negocio, y luego estarás ciego a eso en cierta medida. Nuevamente se vuelve problemático y complejo.

Antes de adentrarnos en cómo abordamos realmente estos nuevos desafíos que enfrentamos al crear un…

Nicole Zint: El aprendizaje automático es un modelo más inteligente que produce decisiones y aprende. Alexander, ¿cómo afecta cada decisión al negocio y cómo podemos compararlas para encontrar qué decisiones debemos tomar? No solo queremos pronosticar, sino también comprender los pasos intermedios. Pero antes de adentrarnos en eso, Joannes, mencionamos un poco antes este modelo de pronóstico cero, que es un concepto importante en este modelo de aprendizaje automático. ¿Cuál es la diferencia en los enfoques de pronóstico que tomamos en Lokad? ¿Los pronósticos probabilísticos ayudan a resolver el problema del pronóstico cero y amplifican, como discutimos, estas desviaciones de la norma que se convierten en errores más grandes? ¿Cómo cambia eso el pronóstico probabilístico?

Joannes Vermorel: El pronóstico probabilístico es muy interesante en este sentido y más generalmente para el ciclo de retroalimentación. Hay dos razones completamente diferentes para esto. La primera es la idea de que introducimos una noción de borrosidad, por lo que intentamos ser al menos aproximadamente correctos en lugar de exactamente incorrectos.

Cuando se trata de situaciones con pronósticos cero, por ejemplo, lo que sucede es que cuando tienes pronósticos probabilísticos, reconoces que la calidad de la información que tienes tiende a ser bastante borrosa. No tienes una visión perfecta de lo que está sucediendo y, por lo tanto, será mucho más difícil, numéricamente hablando, converger hacia una confianza absoluta de que la demanda realmente es cero. Entonces, no es que el modelo de pronóstico probabilístico sea mucho mejor, es simplemente que se dispersará y evitará quedar bloqueado en esta posición cero. Considera todas las probabilidades en muchos valores y cuando agregas al mix el hecho de que típicamente tienes asimetrías fuertes entre poder servir o simplemente poder servir una unidad versus mantener una unidad adicional en stock durante un día adicional, típicamente en muchas situaciones, estás muy a favor de mantener una unidad adicional durante un día en lugar de correr el riesgo de quedarte sin stock. El compromiso está muy orientado hacia niveles de servicio más altos.

Por lo tanto, lo que obtienes de los pronósticos probabilísticos es una situación en la que tienes probabilidades dispersas. No tienes tu pronóstico, que es tu declaración numérica sobre el futuro, que simplemente colapsa rápidamente hacia un estado degenerado, que es decir que la demanda futura será cero. Sufrirá problemas, por lo que si tienes faltantes de stock repetidos, el pronóstico probabilístico no es mágico. Es muy probable que subestimes la demanda futura real. Sin embargo, es muy probable que evites que el inventario se congele en cero simplemente porque aún estás estimando que hay una probabilidad no nula de tener una o dos o tres unidades de demanda. Ese es el primer argumento; evita amplificar en una dirección.

Alexander Backus: Sí, también es importante considerar que, especialmente cuando tenemos ciclos de retroalimentación, las situaciones son muy difíciles de controlar por completo. Es mejor tener algo que no se amplifique en una dirección, como mencionó Joannes.

Nicole Zint: Fingir tener un dominio completo de todo. Nuevamente, no estamos hablando del movimiento de los planetas. Fenómenos donde una inexactitud del 30 al 60 por ciento no es nada sorprendente.

Joannes Vermorel: Entonces estamos hablando de un grado de inexactitud en el tipo de declaración numérica que hacemos sobre el futuro que es muy alto. El pronóstico probabilístico al menos ofrece algo que refleja esta enorme incertidumbre ambiental que tenemos. Nuevamente, estamos tratando de modelar a los humanos, ya sabes, personas que pueden reaccionar. Es muy, muy difícil y lo primero que hay que reconocer es que no tienes el control. Quiero decir, esas personas, esos clientes, esos proveedores, esos competidores, son inteligentes, están jugando sus propios juegos, ya sabes, están haciendo muchas cosas. Sería, diría yo, un poco de arrogancia afirmar que puedes modelar perfectamente lo que va a suceder. Esa sería la base de la novela de ciencia ficción de Asimov, donde puedes tener una modelización estadística perfecta del futuro de grandes civilizaciones. Es extremadamente difícil y muy probablemente poco realista.

Joannes Vermorel: El pronóstico probabilístico también es de gran interés por una razón completamente diferente. La segunda razón es que, a diferencia del pronóstico puntual donde tienes una simetría completa entre el pasado y el futuro, con el pronóstico puntual, tienes básicamente una medición por día por SKU, eso serían tus ventas, por ejemplo, o tu demanda, y cuando proyectas hacia el futuro, terminas con una medición por día por SKU. Por lo tanto, el pronóstico es muy similar a tus observaciones pasadas. Sin embargo, cuando entras en el ámbito del pronóstico probabilístico, de repente, lo que estás viendo es una distribución de probabilidad o una serie de distribuciones de probabilidad. Y así, tienes esta asimetría muy fuerte entre el pasado y el futuro. De repente, el futuro es completamente diferente al pasado. En el pasado, tienes observaciones, son únicas, no hay incertidumbre o si la hay, es solo la incertidumbre de la propia medición. Quiero decir, puede haber un error de escritura en tu registro de ventas, pero en términos de orden de magnitud, esto es muy, muy pequeño. Esto casi siempre se puede aproximar en la cadena de suministro como ninguna incertidumbre en comparación con el futuro, donde la incertidumbre es vasta y son tus distribuciones de probabilidad.

Joannes Vermorel: Y así, lo que es muy interesante, y eso me lleva al bucle de retroalimentación, es que el bucle de retroalimentación es otra dimensión adicional. Es una forma de enriquecer el pronóstico para hacerlo más robusto, pero de una manera muy diferente porque si el pronóstico probabilístico se trataba de introducir probabilidades, el bucle de retroalimentación se trata de hacer del pronóstico una función de orden superior. Entonces, fundamentalmente, tu pronóstico de repente no es un resultado, ni siquiera una distribución de probabilidad, es un mecanismo en el que puedes inyectar una política, una especie de reacción, y obtendrás un resultado diferente. Así que ves, se convierte de alguna manera en algo donde simplemente sabes que si alguien actúa, e incluso esa persona puede ser tú mismo de cierta manera, aún tendrás un impacto en el pronóstico.

Nicole Zint: Entonces, la situación se vuelve más dinámica y holística cuando entras en el ámbito de los bucles de retroalimentación. ¿Puedes explicar cómo esto afecta el pronóstico y cómo se vuelve más esquivo?

Joannes Vermorel: Cuando entras en el ámbito de los bucles de retroalimentación, estás tratando con algo dinámico que necesita un ingrediente funcional en su núcleo, como una política. Esta política dicta cómo reaccionas en términos de inventario, precio y diferentes factores que representan tu pronóstico. El pronóstico se vuelve más esquivo porque ya no es un objeto simple. Está afectado por estos bucles de retroalimentación, y cuando la gente dice “pronóstico”, generalmente piensa en un pronóstico puntual. Cuando entramos en el ámbito de los pronósticos de políticas, ya estamos ampliando lo que la gente puede pensar. Cuando decimos que va a ser distribuciones de probabilidad, se vuelve mucho más difícil de visualizar.

Por ejemplo, el hecho de que tus precios vayan a evolucionar para ayudar a mantener el flujo de mercancías en tu cadena de suministro. Si una empresa está a punto de sufrir una escasez masiva, la respuesta más natural es aumentar gradualmente el precio para que la escasez sea menos grave. Por el contrario, si estás a punto de sufrir una situación de exceso de existencias masivo, la respuesta natural es bajar el precio para aumentar la demanda y liquidar el exceso de existencias. El pronóstico que tienes sobre el futuro depende de tu política de precios en estos ejemplos. Cuando empiezas a pensar en bucles de retroalimentación, tu pronóstico se vuelve condicional, teniendo en cuenta una política que está bajo tu control hasta cierto punto.

Nicole Zint: Alexander, ¿estás de acuerdo con las fortalezas y diferencias que Joannes acaba de mencionar con respecto al enfoque de pronóstico probabilístico en comparación con una serie temporal?

Alexander Backus: Sí, darle a tu modelo acceso a decisiones anteriores como los precios puede aliviar este problema. Joannes habló sobre series temporales y pronósticos probabilísticos en ese sentido. Sin embargo, no solo tenemos el efecto de tu pronóstico que afecta las decisiones futuras y los datos de entrenamiento; también tenemos lo que se llama observabilidad parcial. Esto significa que solo observas el efecto de la decisión que se toma y no sabes qué habría pasado si tuvieras más capacidad o más inventario. Eso es un contrafactual. El desafío es crear un modelo lo suficientemente bueno como para predecir con precisión el impacto de todas las decisiones.

Este fenómeno es muy conocido en los sistemas de recomendación de comercio electrónico y es discutiblemente menos conocido en la cadena de suministro. Se llama retroalimentación de bandas. El término proviene de las máquinas tragamonedas de brazo múltiple, una configuración de máquinas tragamonedas en un casino donde solo observas la recompensa que obtienes de la máquina tragamonedas o qué brazo tiras.

Nicole Zint: Y luego ese es el mismo efecto, y el sistema de recomendación es similar a eso porque si muestras un cierto anuncio, no sabes qué habría pasado si hubieras mostrado uno diferente al cliente. Ha habido enfoques de modelado específicos que son adecuados para esto, y la configuración de aprendizaje supervisado ingenuo del que hablé al principio en realidad no es adecuada para esto. Entonces, esto no es bueno para predecir el efecto de la acción. Más bien, lo que quieres hacer es reformular tu problema de aprendizaje automático, para que el modelo no genere una predicción sobre el futuro; debe generar una decisión óptima. Y esto es a lo que Joannes también se refirió, se llama una política. Entonces, aprendes un modelo que dice esto es lo que debes hacer. Este es el anuncio que debes mostrar, o en un contexto de cadena de suministro, este es el inventario que debes mover de A a B, esta es la cantidad de capacidad que debes reservar. Entonces, las cosas reales que afectan directamente a tu cadena de suministro en lugar de un pronóstico por sí solo, a partir del cual tomas las decisiones por tu cuenta que la máquina no sabe qué decisiones tomaste. En teoría, podrías saltarte por completo todo el pronóstico y simplemente decir esto es lo que debes hacer.

Alexander Backus: Hay algoritmos específicos de aprendizaje automático, y la clase más amplia se llama aprendizaje por refuerzo. Ahí es donde tomas una acción en el mundo real, observas el efecto de eso, y debes enmarcarlo en términos de recompensas, recompensas financieras. Y eso es cuando obtienes la retroalimentación y luego actualizas tu modelo en función de esa retroalimentación. Mencionaste recompensas financieras, entonces, ¿es un ejemplo si, digamos, tomas la decisión de pedir esta cantidad de stock, y luego observas cómo se desempeña la cadena de suministro, cuánto dinero entra en la cuenta, y luego eso se retroalimenta en el sistema para que entienda, bueno, cuando tomamos estas decisiones, este fue el resultado, y así continúa a partir de eso.

Joannes Vermorel: Sí, ese tipo de refuerzo financiero u objetivo financiero puede ser más complejo, teniendo en cuenta los costos de almacenamiento, oportunidades perdidas, y demás. Hay mucho que se puede elaborar sobre eso, o podemos dejarlo así. Entonces, eso es lo que optimizas con este algoritmo de aprendizaje por refuerzo. De esa manera, aprendes directamente la política, las decisiones que debes tomar. Así que de alguna manera abrazas esta profecía autocumplida en lugar de evitarla, de la que comenzamos a hablar al principio de nuestra discusión. Entonces, no es bueno ni malo; simplemente no se puede ignorar. Y esa es una forma de evitar esto, tener este modelo que tiene en cuenta las decisiones y aprende del impacto de las decisiones anteriores para crear decisiones cada vez mejores.

Alexander Backus: Deberíamos pensar un poco en las implicaciones de eso porque eso significa que también deberías poder experimentar. Y eso es, en esta configuración, por supuesto, muy desafiante si el modelo necesita aprender y ver qué sucede si hace A o B.

Nicole Zint: Entonces, ¿por qué esto no se ha aplicado antes, o no se aplica en todas partes?

Alexander Backus: Bueno, esta es una de las razones. Y además, los algoritmos típicos de aprendizaje por refuerzo aprenden de manera en línea, es decir, toman una acción y luego aprenden de la retroalimentación de recompensa que obtienen de eso. Esto es problemático en entornos del mundo real donde hay mucho riesgo involucrado, y también no tienes

Nicole Zint: No tienes algo con qué iniciar este algoritmo, para que produzca cosas sensatas en primer lugar. Comienza de forma aleatoria. O necesitas tener un entorno de simulación muy bueno, que es lo que a menudo se ve en otros entornos de aprendizaje por refuerzo como AlphaZero, que aprende a jugar ajedrez de Google DeepMind. Tienen una simulación, por lo que tienen una simulación por computadora donde este algoritmo de aprendizaje por refuerzo puede jugar. Entonces, esencialmente, no sacrificas la cadena de suministro de otra persona.

Alexander Backus: Exactamente, no quieres conejillos de indias. Pero esto es algo así como un problema del huevo y la gallina en nuestro caso aquí porque entonces necesitas un modelo muy preciso de la realidad. Y si tienes eso, entonces ya has resuelto el problema. Entonces, necesitas una cadena de suministro en primer lugar para hacer eso, y no quieres hacer eso. Necesitas un modelo de tu cadena de suministro. Si tienes eso, no deberías necesitar entrenar, y ya deberías poder descubrir la oportunidad. Volvamos a donde comenzamos.

Sí, pero hoy en día hay una dirección prometedora donde aprendes a partir de datos históricos. Se llama aprendizaje por refuerzo fuera de línea, donde básicamente aprendes a partir de decisiones históricas que se tomaron. Aunque no estén tan bien distribuidas como te gustaría, aún es posible entrenar algoritmos basados en datos del mundo real que se han recopilado anteriormente.

Nicole Zint: ¿Como un punto de partida?

Alexander Backus: Sí, como un punto de partida. Y a partir de ahí, puedes avanzar sin sacrificar tus suministros hacia configuraciones más en línea, o entrenarlo fuera de línea antes de lanzarlo en lotes. Hay varias opciones allí, pero esto también conlleva sus propios desafíos. Joannes, ¿qué opinas de lo que acaba de describir Alexander: comenzar fuera de línea, aprender a partir de datos anteriores y, en esencia, la máquina evita este problema del huevo y la gallina, se vuelve lo suficientemente buena como para aplicarse a una cadena de suministro real, por lo tanto, tiene más datos reales con los que trabajar, y seguir adelante desde allí? ¿Qué opinas al respecto?

Joannes Vermorel: La eficiencia de los datos es casi siempre una preocupación para cualquier tipo de algoritmo de aprendizaje automático en la cadena de suministro porque nunca tienes el lujo de tener una cantidad gigantesca de datos, al menos no a la granularidad en la que se deben tomar las decisiones. En las decisiones de la cadena de suministro, generalmente se deben tomar a nivel de SKU. Y debido al hecho de que se realiza un agrupamiento, incluso si estamos mirando el SKU en una tienda, no va a ser millones de unidades por día. Y si estamos mirando el SKU en una fábrica, entonces habrá grandes lotes, y será por lotes de, digamos, 10,000 unidades. Y nuevamente, no va a ser millones de lotes por día. Por lo tanto, la cantidad de observaciones relevantes sigue siendo relativamente limitada.

Ese es un aspecto que siempre es un desafío para el aprendizaje por refuerzo porque no tenemos tantos datos. Un simulador es de gran interés, pero también fue un punto en el que me referí brevemente en una de mis conferencias. Esencialmente, hay una dualidad entre un pronóstico probabilístico y un simulador. Si tienes un pronóstico probabilístico, siempre puedes muestrear observaciones y, por lo tanto, obtener tu simulador a partir de tu pronóstico probabilístico. Y si tienes un simulador, simplemente puedes ejecutar muchas simulaciones y calcular las probabilidades respectivas, y vuelves a tu pronóstico probabilístico. Por lo tanto, hay una dualidad muy fuerte.

Sí, eso es interesante, pero eso depende de tener un pronóstico probabilístico muy preciso, lo cual es muy desafiante.

Nicole Zint: La observabilidad parcial es un desafío especialmente difícil de resolver porque cuando tomas un conjunto de datos, digamos, por ejemplo, quieres investigar los movimientos de precios. La empresa podría haber operado de una manera específica durante la última década en la que no estaban haciendo movimientos de precios al azar; tenían hábitos muy arraigados. Por ejemplo, a veces los hábitos son tan fuertes que crean problemas cuando se trata de diferenciar cuál es la causa real de algo.

Joannes Vermorel: ¿Qué pasa si la empresa, cada año a fines de enero, decide tener las primeras ventas del año? Tienen una práctica donde agregan grandes descuentos en una amplia variedad de productos a fines de enero, lo cual observarás como un aumento de la demanda a fines de mes. Pero, ¿cuál es el efecto de la estacionalidad? ¿Observarían un pico de demanda a fines de mes incluso sin los descuentos? ¿Y cuál es la proporción del impacto que proviene solo de los descuentos?

Alexander Backus: Ese es el problema, de hecho. Las decisiones no se tomaron al azar, por lo que lo que observas refleja bastante extensamente las prácticas habituales. Una forma en que el aprendizaje por refuerzo aborda eso es introduciendo una mezcla de exploración versus explotación. La explotación es hacer lo mejor en función de lo que has observado, y la exploración es probar algo nuevo, pero con la expectativa de que, debido a que es parcialmente aleatorio, será inferior.

Joannes Vermorel: Entonces, ¿por qué probarías algo que sabes que probablemente será inferior? La respuesta es, bueno, porque es la única forma en que finalmente puedes descubrir algo que resulta ser superior. Esa es la idea de sacrificar, esencialmente, es una inversión para la investigación y el desarrollo. Y eso podría ser algo que en realidad no puede tomar formas muy mundanas. Podría ser, por ejemplo, que digamos que estás en una tienda, estás vendiendo velas.

Alexander Backus: Y te das cuenta, ¿qué pasaría si intentaras vender las mismas velas pero a un precio cuatro veces más alto o cuatro veces más bajo? Ambas opciones pueden ser válidas. Tal vez si haces un pedido a granel muy grande a uno de tus proveedores y aumentas en gran medida la cantidad, podrías potencialmente reducir mucho el precio de un producto básico. Estoy tomando una vela a propósito, por lo que podrías tener un precio mucho más bajo, y tal vez multiplicarías por 10 la demanda que observaste.

Joannes Vermorel: Eso sería un intercambio valioso. O tomar otro camino completamente diferente y decir: “Voy a optar por algo mucho más premium, agregar sabor o fragancia, y algo más, un mejor empaque, y multiplicar el precio por cuatro”. En lugar de tener una décima parte de la demanda que solía tener, todavía tengo la mitad de la demanda pero por un producto que tiene un precio mucho más alto.

Alexander Backus: Sin embargo, si miramos la historia, lo más probable es que las variaciones que hemos observado sean solo pequeñas variaciones en comparación con el punto de referencia. Nuestra historia no abarca estos escenarios más locos, por así decirlo.

Joannes Vermorel: Sí, y nuevamente, puede tratarse de qué pasa si tomas un producto y dices: “Voy a introducir cinco variantes de cinco colores diferentes”.

Nicole Zint: Sabes, ¿cuál es el grado de canibalización que observaré, o en realidad estoy tocando nuevos mercados? Nuevamente, si tomo velas y digo que voy a introducir múltiples colores para las velas, ¿en qué medida se canibalizarán esas velas de diferentes colores entre sí y en qué medida satisfaré realmente una demanda completamente nueva?

Joannes Vermorel: No lo sé, y tal vez este grabador me dé una idea de esto. Pero en gran medida, por lo general lo que vemos es que, siempre que las empresas comienzan a introducir algún tipo de aleatoriedad impulsada por máquinas, hay muy poca aleatoriedad. Es mucho más una cuestión de patrones de hábito. Y nuevamente, también se reduce a la forma en que operan esas empresas. Cuando, por ejemplo, hay una decisión de precios, generalmente no es solo una persona la que se le ocurrió la idea. Hay un método para ello, y las personas han sido entrenadas para decir: “En este tipo de situación, deberías hacer un descuento en el producto porque es la práctica habitual y tiene sentido”. Está bien, pero también significa que la mayoría de las variaciones de precios que observas en los datos históricos siempre siguen un pequeño número de patrones que son precisamente los métodos que están en vigor.

Alexander Backus: Pero seguramente, eso sigue siendo un buen punto de partida, ¿no? Como mencionaste, ¿qué más se puede hacer? O sacrificas la cadena de suministro o creas una gran simulación, pero eso también se basa en la idea de que tienes buenos datos para trabajar. Pero, como mencioné, si lo hacemos de manera offline, si observamos nuestro historial de ventas existente o los datos que tenemos, aunque pueda haber esta desventaja de que no podamos ver esta gran desviación de la norma para observar las diferentes consecuencias de eso, ¿sigue siendo el punto de partida correcto, en tu opinión?

Joannes Vermorel: Creo que el punto de partida correcto es ligeramente diferente. El punto de partida correcto es reconocer primero que siempre que tenemos bucles de retroalimentación, esto es fundamental. Si reconocemos que esos bucles de retroalimentación son reales y queremos abordarlos, es un cambio de paradigma en la forma en que abordamos la previsión en sí misma. Ves, ese es un verdadero punto de partida. El resto son tecnicismos. Hay muchos modelos. Los modelos más simples de aprendizaje por refuerzo, como los bandits, pueden ser increíblemente simples. Algunos son increíblemente complejos, pero esos son tecnicismos. Lo que observé en las cadenas de suministro del mundo real es que el mayor desafío para comenzar a abrazar algo tan simple como esos bucles de retroalimentación es reconocer que realmente tendrán consecuencias profundas en las propias previsiones. Las previsiones nunca van a ser las mismas, y no estoy diciendo cuantitativamente. Estoy diciendo en términos de paradigma, no puedes mirar esas previsiones de la misma manera. Esto ni siquiera es el mismo objeto. Esto es algo de una naturaleza diferente, y eso es muy difícil porque generalmente, la pregunta que recibo es: “¿Será más precisa mi previsión?” Uno de los desafíos es, tan pronto como comenzamos a mirar esos bucles de retroalimentación, ¿cómo mides la precisión cuando tienes bucles de retroalimentación? Esa es una pregunta en sí misma. Es una pregunta difícil.

Alexander Backus: Sí, si puedo agregar algo a eso, creo que hemos estado discutiendo los desafíos técnicos y los desafíos de disponibilidad de datos. Pero estoy completamente de acuerdo con Joannes en que la razón principal por la que no se ha aplicado o adoptado en entornos empresariales es también porque tiene un impacto profundo en tu proceso empresarial. Entonces, en este tipo de entorno teórico…

Nicole Zint: Entonces, ¿quiénes crees que son los jugadores más orientados tecnológicamente en la industria del comercio electrónico?

Joannes Vermorel: La tendencia es, creo, si miro a los jugadores más agresivos y orientados tecnológicamente, serían dd.com, Amazon.com, Alibaba.com. Ya sabes, esas empresas de comercio electrónico que están a la vanguardia de su juego. Sí, son realmente excelentes en lo que hacen. Son muy, muy efectivos.

Alexander Backus: Estoy de acuerdo con eso. Esas empresas son definitivamente líderes en la industria cuando se trata de tecnología e innovación.

Nicole Zint: Entonces, el mundo ha cambiado mucho a lo largo de los años. ¿Qué opinas, Joannes, sobre el mundo en el que vivimos hoy?

Joannes Vermorel: Bueno, no es tan simple como solía ser. El mundo todavía está progresando, pero hemos tenido muchas sorpresas en los últimos años. Está claro que no estamos al final de la historia donde todo es predecible. El mundo es caótico y tenemos que aceptar la incertidumbre y complejidad de los seres humanos, las máquinas y los procesos en las cadenas de suministro. No podemos tener un control completo, por lo que mi enfoque es ser aproximadamente correcto para capturar todo en lugar de estar exactamente equivocado.

Nicole Zint: Esa es una perspectiva realmente interesante. Y tú, Alexander, ¿qué tipo de talento buscas al incorporar nuevas personas a tu equipo?

Alexander Backus: En IKEA, siempre estamos buscando talento en ciencia de datos para resolver desafíos en una gran corporación. Tenemos muchos datos y potencial para tener un impacto a escala global, por lo que necesitamos desafiar el statu quo.

Nicole Zint: Gracias a ambos por sus ideas. Ha sido un placer tenerlos con nosotros hoy.

Joannes Vermorel: Sí, gracias.

Alexander Backus: Gracias por recibirme.