Suavizado Exponencial Probabilístico para IA Explicable en el ámbito de la supply chain
Uno de los ámbitos de investigación de Lokad consiste en revisar algo simple (y fundamental) e intentar mejorarlo un poco (y simplificarlo un poco). Este enfoque tiende a ser exactamente lo opuesto a la mayoría de los artículos de investigación, que suelen ser versiones más complejas de trabajos previos. Así, por defecto, nos esforzamos por una mayor simplicidad más que por una mayor sofisticación. Uno de los ingenieros de I+D de Lokad, Antonio Cifonelli, aplicó este enfoque en su disertación doctoral, abordando el venerable modelo de suavizado exponencial para dotarlo de mejores atributos—es decir, para hacerlo más explicable.

La explicabilidad, como cualidad de un modelo, se entiende con frecuencia de manera errónea tanto en su naturaleza como en su propósito—al menos en lo que respecta a la supply chain. Tener un modelo explicable no consiste en obtener resultados que puedan ser comprendidos o validados fácilmente por la mente humana. Esto sería muy defectuoso dado que media docena de operaciones de punto flotante ya son suficientes para confundir a la mayoría de las personas, incluso a aquellas que se sienten cómodas con los números. La mente humana simplemente no es (naturalmente) experta cuando se trata de aritmética básica; después de todo, fue el primer ámbito en ser superado por las máquinas durante la década de 1950. Además, la explicabilidad no pretende hacer que el modelo sea digno de confianza—bueno, no del todo. Existen instrumentos más confiables (backtesting, cross-validation, etc.) para evaluar si se debe confiar o no en un modelo. Ser capaz de construir una narrativa sobre el modelo y sus resultados no debería considerarse sede suficiente para la confianza.
Desde la perspectiva de Lokad, el objetivo de la explicabilidad es preservar la posibilidad de operar la supply chain mediante una variante del modelo cuando se enfrenta a una disrupción que invalida el modelo original. Las disrupciones en la supply chain son diversas: guerras, aranceles, confinamientos, quiebras, tormentas, litigios, etc. Cuando ocurre una disrupción, el modelo predictivo se vuelve inválido de maneras sutiles pero importantes. Sin embargo, esto no significa que todos los patrones capturados alguna vez por el modelo dejen de ser relevantes. Por ejemplo, el perfil de estacionalidad del modelo puede permanecer completamente sin impacto.
Como tal, un modelo explicable debería proporcionar formas para que un Supply Chain Scientist modifique, ajuste o distorsione el modelo original con el fin de obtener una variante que refleje adecuadamente la disrupción. Naturalmente, se espera que estos cambios sean estimaciones aproximadas—heurísticas en naturaleza—ya que los datos precisos aún no están disponibles. No obstante, como dice el mantra adoptado por Lokad, es mejor equivocarse aproximadamente que equivocarse exactamente.
Para más detalles sobre cómo podrían ser los modelos explicables, consulta el manuscrito doctoral del Dr Cifonelli a continuación.
Autor: Antonio Cifonelli
Fecha: diciembre 2023
Resumen:
El papel clave que la IA podría desempeñar en la mejora de las operaciones empresariales se conoce desde hace mucho tiempo (al menos desde 2017), pero el proceso de penetración de esta nueva tecnología ha encontrado ciertos obstáculos en las empresas, en particular, los costos de implementación. Las empresas permanecen apegadas a sus sistemas antiguos debido a la energía y el love money requeridos para reemplazarlos. En promedio, se necesitan 2.8 años desde la selección del proveedor hasta el despliegue completo de una nueva solución. Hay tres puntos fundamentales a considerar al desarrollar un nuevo modelo: la desalineación de expectativas, la necesidad de comprensión y explicación, y problemas de rendimiento y confiabilidad. En el caso de los modelos que manejan datos de la supply chain, existen además cinco asuntos específicos:
- Gestión de la incertidumbre. La precisión no lo es todo. Los responsables de la toma de decisiones buscan una manera de minimizar el riesgo asociado a cada decisión que deben tomar en presencia de incertidumbre. Obtener un forecast exacto es ventajoso; obtener un forecast bastante preciso y calcular sus límites es realista y adecuado.
- Manejo de datos enteros y positivos. La mayoría de los artículos vendidos en el comercio minorista no se pueden vender en subunidades, por ejemplo, una lata de comida, una pieza de repuesto o una camiseta. Este simple aspecto de la venta resulta en una restricción que debe ser satisfecha por el resultado de cualquier método o modelo: el resultado debe ser un entero positivo.
- Observabilidad. La demanda del cliente no se puede medir directamente, solo se pueden registrar las ventas y usarlas como un sustituto de la demanda.
- Escasez y parsimonia. Las ventas son una cantidad discontinua: un producto puede venderse bien una semana y luego nada la siguiente. Al registrar las ventas por día, un año entero se condensa en tan solo 365 (o 366) puntos. Además, una gran proporción de ellos será cero.
- Optimización just-in-time. El forecasting es una función clave, pero es solo un elemento en una cadena de procesos que soporta la toma de decisiones. El tiempo es un recurso precioso que no se puede dedicar íntegramente a una sola función. Por lo tanto, el proceso de toma de decisiones y las adaptaciones asociadas deben llevarse a cabo dentro de un plazo limitado y de manera lo suficientemente flexible como para poder ser interrumpido y reiniciado, si es necesario, para incorporar eventos inesperados o ajustes necesarios.
Esta tesis encaja en este contexto y es el resultado del trabajo realizado en el corazón de Lokad, una empresa de software con sede en París que tiene como objetivo cerrar la brecha entre la tecnología y la supply chain. La investigación doctoral fue financiada por Lokad en colaboración con la ANRT bajo un contrato CIFRE. El trabajo propuesto pretende ser un buen compromiso entre las nuevas tecnologías y las expectativas empresariales, abordando los diversos aspectos presentados anteriormente. Hemos comenzado a realizar forecast utilizando métodos básicos —la familia del suavizado exponencial—, los cuales son fáciles de implementar y extremadamente rápidos de ejecutar. Dado que se utilizan ampliamente en la industria, ya han ganado la confianza de los usuarios. Además, son fáciles de entender y explicar a un público no especializado. Al explotar técnicas de IA más avanzadas, se pueden superar algunas de las limitaciones de los modelos utilizados. El cross-learning demostró ser un enfoque relevante para extrapolar información útil cuando la cantidad de datos disponibles era muy limitada. Dado que la común asunción gaussiana no es adecuada para datos de ventas discretos, propusimos utilizar un modelo asociado ya sea a una distribución de Poisson o a una distribución Binomial Negativa, que se corresponde mejor con la naturaleza de los fenómenos que buscamos modelar y predecir. También propusimos utilizar simulación para abordar la incertidumbre. Empleando simulaciones de Monte Carlo, se generan, muestrean y modelan una serie de escenarios utilizando una distribución. A partir de esta distribución, se pueden deducir intervalos de confianza de diferentes tamaños y adaptados. Utilizando datos reales de la empresa, comparamos nuestro enfoque con métodos de última generación como el modelo Deep Auto-Regressive (DeepAR), el modelo Deep State Space (DeepSSMs) y el modelo Neural Basis Expansion Analysis (N-Beats). Se dedujo un nuevo modelo basado en el método Holt-Winter. Estos modelos se implementaron en el flujo de trabajo de Lokad.
Jurado:
La defensa tuvo lugar ante un jurado compuesto por:
- M. Massih-Reza AMINI, Profesor en Université Grenoble, Alpes, Ponente.
- M.me Mireille BATTON-HUBERT, Profesora en École des Mines de Saint-Étienne, Ponente.
- M.me Samia AINOUZ, Profesora en INSA Rouen, Normandie, Examinadora.
- M. Stéphane CANU, Profesor en INSA-Rouen, Normandie, Director de tesis.
- M.me Sylvie LE HÉGARAT-MASCLE, Profesora en Paris-Saclay, Examinadora.
- M. Joannes VERMOREL, CEO de Lokad, Miembro invitado.