Uno de los ámbitos de investigación de Lokad consiste en revisar algo simple (y fundamental) e intentar mejorarlo un poco (y hacerlo un poco más simple). Este enfoque tiende a ser exactamente lo contrario de la mayoría de los artículos de investigación, que suelen ser versiones más complejas de algún trabajo anterior. Por lo tanto, por defecto, nos esforzamos por lograr una mayor simplicidad en lugar de una mayor sofisticación. Uno de los ingenieros de I+D de Lokad, Antonio Cifonelli, aplicó este enfoque en su tesis doctoral, abordando el venerable modelo de suavizado exponencial para dotarlo de mejores atributos, es decir, hacerlo más explicable.

Dos figuras de una tesis doctoral sobre Probabilistic Exponential Smoothing para la IA Explicable en el dominio de la cadena de suministro.

La explicabilidad, como una cualidad de un modelo, a menudo se malinterpreta tanto en su naturaleza como en su intención, al menos en lo que respecta a las cadenas de suministro. Tener un modelo explicable no significa obtener resultados que puedan ser fácilmente comprendidos o validados por una mente humana. Esto sería muy defectuoso, dado que media docena de operaciones de punto flotante ya son suficientes para confundir a la mayoría de las personas, incluidas aquellas que se consideran cómodas con los números. La mente humana simplemente no es (naturalmente) hábil cuando se trata de aritmética básica; después de todo, fue el primer dominio en ser superado por las máquinas durante la década de 1950. Además, la explicabilidad no tiene la intención de hacer que el modelo sea confiable, al menos no del todo. Hay instrumentos más confiables (backtesting, cross-validation, etc.) para evaluar si un modelo debe ser confiable o no. Ser capaz de construir una narrativa sobre el modelo y sus resultados no debe considerarse un motivo suficiente para confiar en él.

Desde la perspectiva de Lokad, el objetivo de la explicabilidad es preservar la posibilidad de operar la cadena de suministro a través de una variante del modelo cuando se enfrenta a una interrupción que invalida el modelo original. Las interrupciones en la cadena de suministro son variadas: guerras, aranceles, confinamientos, quiebras, tormentas, litigios, etc. Cuando ocurre una interrupción, el modelo predictivo se vuelve inválido de formas sutiles pero importantes. Sin embargo, esto no significa que todos los patrones capturados por el modelo dejen de ser relevantes. Por ejemplo, el perfil de estacionalidad del modelo puede permanecer completamente sin cambios.

Como tal, un modelo explicable debe proporcionar formas a un Supply Chain Scientist para modificar, ajustar o distorsionar el modelo original con el fin de obtener una variante que refleje adecuadamente la interrupción. Naturalmente, se espera que estos cambios sean estimaciones aproximadas, de naturaleza heurística, ya que los datos precisos aún no están disponibles. Sin embargo, como dice el mantra adoptado por Lokad, es mejor estar aproximadamente correcto que exactamente equivocado.

Para obtener más detalles sobre cómo podrían ser los modelos explicables, consulta el manuscrito de doctorado del Dr. Cifonelli a continuación.

Autor: Antonio Cifonelli

Fecha: Diciembre 2023

Resumen:

El papel clave que la IA podría desempeñar en la mejora de las operaciones comerciales se ha conocido desde hace mucho tiempo (al menos desde 2017), pero el proceso de penetración de esta nueva tecnología ha encontrado ciertos obstáculos dentro de las empresas, en particular, los costos de implementación. Las empresas siguen aferradas a sus sistemas antiguos debido a la energía y el dinero necesarios para reemplazarlos. En promedio, se tarda 2.8 años desde la selección del proveedor hasta la implementación completa de una nueva solución. Hay tres puntos fundamentales a considerar al desarrollar un nuevo modelo. Desalineación de expectativas, la necesidad de comprensión y explicación, y problemas de rendimiento y confiabilidad. En el caso de los modelos que tratan con datos de la cadena de suministro, existen cinco problemas específicos adicionales:

  • Manejo de incertidumbre. La precisión no lo es todo. Los tomadores de decisiones buscan una forma de minimizar el riesgo asociado con cada decisión que deben tomar en presencia de incertidumbre. Obtener un pronóstico exacto es ventajoso; obtener un pronóstico bastante preciso y calcular sus límites es realista y apropiado.
  • Manejo de datos enteros y positivos. La mayoría de los artículos vendidos en el comercio minorista no se pueden vender en subunidades, por ejemplo, una lata de comida, una pieza de repuesto o una camiseta. Este aspecto simple de la venta resulta en una restricción que debe cumplirse por el resultado de cualquier método o modelo dado: el resultado debe ser un número entero positivo.
  • Observabilidad. La demanda del cliente no se puede medir directamente, solo se pueden registrar las ventas y utilizarlas como un indicador de la demanda.
  • Escasez y parsimonia. Las ventas son una cantidad discontinua: un producto puede venderse bien una semana y luego no venderse en absoluto la siguiente. Al registrar las ventas por día, se condensa un año completo en solo 365 (o 366) puntos. Además, una gran proporción de ellos será cero.
  • Optimización just-in-time. El pronóstico es una función clave, pero es solo un elemento en una cadena de procesos que respaldan la toma de decisiones. El tiempo es un recurso valioso que no se puede dedicar por completo a una sola función. Por lo tanto, el proceso de toma de decisiones y las adaptaciones asociadas deben llevarse a cabo dentro de un marco de tiempo limitado y de manera suficientemente flexible para poder interrumpirse y reiniciarse si es necesario para incorporar eventos inesperados o ajustes necesarios.

Esta tesis se enmarca en este contexto y es el resultado del trabajo realizado en el corazón de Lokad, una empresa de software con sede en París que tiene como objetivo cerrar la brecha entre la tecnología y la cadena de suministro. La investigación doctoral fue financiada por Lokad en colaboración con la ANRT bajo un contrato CIFRE. El trabajo propuesto tiene como objetivo ser un buen compromiso entre las nuevas tecnologías y las expectativas empresariales, abordando los diversos aspectos presentados anteriormente. Hemos comenzado a hacer pronósticos utilizando métodos básicos, como la familia de suavización exponencial, que son fáciles de implementar y extremadamente rápidos de ejecutar. Como se utilizan ampliamente en la industria, ya han ganado la confianza de los usuarios. Además, son fáciles de entender y explicar a un público no especializado. Al aprovechar técnicas de IA más avanzadas, se pueden superar algunas de las limitaciones de los modelos utilizados. El aprendizaje cruzado demostró ser relevante. enfoque para extrapolar información útil cuando el número de datos disponibles era muy limitado. Dado que la suposición gaussiana común no es adecuada para datos de ventas discretos, propusimos utilizar un modelo asociado con una distribución de Poisson o una distribución binomial negativa, que se ajusta mejor a la naturaleza de los fenómenos que buscamos modelar y predecir. También propusimos utilizar la simulación para lidiar con la incertidumbre. Mediante simulaciones de Monte Carlo, se generan, muestrean y modelan varios escenarios utilizando una distribución. A partir de esta distribución, se pueden deducir intervalos de confianza de diferentes tamaños y adaptados. Utilizando datos reales de la empresa, comparamos nuestro enfoque con métodos de vanguardia como el modelo Deep Auto-Regressive (DeepAR), el modelo Deep State Space (DeepSSMs) y el modelo Neural Basis Expansion Analysis (N-Beats). Dedujimos un nuevo modelo basado en el método Holt-Winter. Estos modelos se implementaron en el flujo de trabajo de Lokad.

Jurado:

La defensa tuvo lugar frente a un jurado compuesto por:

  • M. Massih-Reza AMINI, Profesor en la Université Grenoble, Alpes, Rapporteur.
  • M.me Mireille BATTON-HUBERT, Profesora en la École des Mines de Saint-Étienne, Rapporteur.
  • M.me Samia AINOUZ, Profesora en INSA Rouen, Normandie, Examinadora.
  • M. Stéphane CANU, Profesor en INSA-Rouen, Normandie, Director de tesis.
  • M.me Sylvie LE HÉGARAT-MASCLE, Profesora en Paris-Saclay, Examinadora.
  • M. Joannes VERMOREL, CEO de Lokad, Miembro invitado.

Descargar la tesis (PDF)