00:00:09 Introducción y antecedentes de Nicolas Vandeput.
00:01:21 El libro de Nicolas: Data Science for Supply Chain Forecast.
00:03:29 Progreso en las herramientas estadísticas de código abierto.
00:05:36 Facilidad de experimentación con herramientas modernas de forecast.
00:06:17 Impacto amplio del software open source en la industria.
00:08:03 Uso de Python y R para ciencia de datos.
00:10:35 Impacto de las herramientas open source en los proveedores.
00:13:22 Rol de los proveedores en las soluciones de forecast.
00:14:26 Aplicación de la teoría en entornos de producción.
00:15:38 Pasar a producción: desafíos con los datos.
00:16:29 Manejo de problemas de datos en supply chain.
00:18:05 Consolidación de datos para mejores decisiones.
00:19:56 Necesidad de una cultura de datos en supply chain.
00:22:14 Educación para una mejor gestión de supply chain.
00:24:01 La regla de optimización y la importancia de medir.
00:24:15 Desventajas del open source en supply chain.
00:25:37 El futuro rol de Lokad y el valor de los especialistas.
00:28:34 Desafíos de la evolución de Python y open source.
00:31:37 Fomentando comienzos simples en ciencia de datos.

Resumen

Nicolas Vandeput y Joannes Vermorel discuten el rol transformador de ciencia de datos en el forecast de supply chain. Vermorel enfatiza el enfoque de Lokad en proporcionar una capa analítica para la toma de decisiones en supply chain, mientras aborda los desafíos de los toolkits estadísticos open source en rápida evolución. Vandeput asegura que su libro simplifica las complejidades de la ciencia de datos y del machine learning para el forecast de supply chain, alentando a los lectores a comenzar con modelos básicos y añadir progresivamente complejidad. Ambos coinciden en la importancia del aprendizaje continuo y la adaptación en este campo tan dinámico. Vandeput espera que su libro empodere a los lectores para aplicar con confianza la ciencia de datos en sus operaciones de supply chain, marcando una nueva era de toma de decisiones cuantitativa y basada en datos.

Resumen Ampliado

En la entrevista, Kieran Chandler, el presentador, introduce a Nicolas Vandeput, un Supply Chain Scientist con un gran interés en la educación, y a Joannes Vermorel, el fundador de Lokad. La discusión gira principalmente en torno al recién publicado libro de Vandeput, “Data Science for Supply Chain Forecast”.

Vandeput comienza destacando su pasión por aprender y enseñar, lo que lo llevó a escribir su libro. Expresa su fascinación por el floreciente campo de la ciencia de datos y sus potenciales aplicaciones en la gestión de supply chain, que él identifica como un área única y compleja de negocio que puede beneficiarse enormemente de las técnicas modernas basadas en datos. Manifiesta que su libro encapsula estas ideas, centrándose en cómo la ciencia de datos puede aprovecharse para mejorar el forecast en el sector de supply chain.

Vandeput explica que, tradicionalmente, el forecast en supply chain se basaba principalmente en lo que él denomina métodos estadísticos “old school”. Sin embargo, con la llegada y el avance de la ciencia de datos, han surgido nuevas formas de manejar e interpretar los datos. Su libro busca preparar a los profesionales para esta nueva era, capacitándolos para aprovechar la ciencia de datos y mejorar sus forecasts en supply chain.

Vermorel añade su perspectiva, enfatizando que encontró el libro de Vandeput sumamente valioso, particularmente para los gerentes de supply chain que aún no han incursionado en la ciencia de datos. Sugiere que los gerentes se familiaricen con el libro y animen a sus equipos a hacer lo mismo.

Vermorel amplía la discusión señalando los avances significativos en los toolkits estadísticos open source durante la última década. Recuerda que, hace aproximadamente diez años, dichos toolkits, aunque disponibles, estaban diseñados principalmente para investigadores y no eran de nivel de producción debido a su complejidad y la falta de documentación amigable para el usuario.

Sin embargo, señala que con el auge de la ciencia de datos en los últimos cinco a diez años, se ha producido una transformación. Muchos profesores universitarios han empezado a prestar atención a la usabilidad de estos paquetes estadísticos, asegurándose de que sean accesibles para sus estudiantes. Esto ha llevado a una mejora en la calidad de la documentación, una mayor consistencia en la terminología entre los paquetes y un enfoque en técnicas convencionales que funcionen en una gran variedad de situaciones. La comunidad open source, con la ayuda de académicos, produjo una serie de paquetes open source impulsados por las necesidades de los usuarios.

Vermorel concluye su intervención reconociendo los esfuerzos de la comunidad open source, con la ayuda del ámbito académico, en la producción de una serie de paquetes estadísticos de alta calidad, accesibles y fáciles de usar que ahora están disponibles para profesionales en diversas industrias, incluida la gestión de supply chain. Esto subraya la creciente importancia de la ciencia de datos en las prácticas empresariales contemporáneas.

El libro, según señaló Vandeput, permite a cualquiera con una laptop y software gratuito comenzar a generar forecasts sofisticados. La disponibilidad inmediata de herramientas open source permite a los usuarios experimentar y ajustar sus modelos de forecast para sus necesidades específicas, algo que habría sido mucho más desafiante en el pasado.

La conversación luego se centró en el impacto más amplio del software open source. Vermorel destacó que casi todo el software moderno está influenciado por la programación open source, y que los proveedores de computación en la nube dependen en gran medida de plataformas open source como Linux. Él reveló que Lokad, de hecho, utiliza un 90% de software open source en sus operaciones. El aspecto revolucionario del software open source moderno no es solo su accesibilidad, sino también la calidad de su empaquetado y documentación.

Vandeput enfatizó que ahora es más fácil programar en Python o R que en frameworks antiguos como VBA o macros de Excel. Este fácil acceso y usabilidad, dijo, son mensajes centrales de su libro. Al preguntársele si este cambio hacia el software open source lo ponía nervioso, Vermorel respondió que, si bien supone un desafío para que los proveedores demuestren su valor, también actúa como un facilitador.

Vermorel señaló que si el único valor de un proveedor es implementar un modelo de forecast semi-complicado, le costaría competir con el ecosistema open source. El verdadero valor añadido, sugirió, reside en proporcionar soluciones a gran escala y de nivel de producción para los desafíos de supply chain, que involucran más que solo forecasts precisos.

Kieran Chandler, el presentador, luego plantea una pregunta a Joannes Vermorel acerca de la transición a una base de producción y los desafíos que podrían surgir. Vermorel comienza enfatizando la importancia de contar con datos de calidad, sugiriendo que sin ellos, cualquier proceso basado en datos podría resultar en ‘garbage in, garbage out.’ Esta preocupación por la calidad de los datos se extiende a áreas a menudo pasadas por alto en supply chain, como los datos sobre promotions y faltante de stock. Argumenta que entender los modelos que aprovechan estos datos puede ayudar a los profesionales de supply chain a estar más conscientes de estas áreas desatendidas.

Sin embargo, Vermorel también reconoce que el objetivo principal de un supply chain no es compilar una base de datos histórica precisa; ese es un objetivo secundario. Lokad asiste a los clientes en acelerar la transición hacia una consolidación de datos de calidad, potencialmente a través de múltiples sitios y sistemas. Entender cómo se pueden explotar estos datos es importante. Además, Lokad ayuda a transformar estos forecasts en decisiones de supply chain, extendiendo la utilidad de los forecasts hacia la acción.

La conversación luego se centra en la falta de cultura de datos y de comprensión del machine learning en el sector de supply chain. Vandeput sugiere que esto es un obstáculo significativo para muchas empresas. A menudo, los proyectos de supply chain se retrasan debido a datos insuficientes o a una mala interpretación de lo que el machine learning puede lograr. Esto conduce a una discusión sobre la necesidad de cambiar esta cultura y aumentar la importancia que se le da a contar con datos correctos.

Vermorel sugiere que la educación es un camino a seguir, señalando los esfuerzos suyos y de Vandeput para evangelizar el mercado a través de sus respectivos libros y otros materiales publicados. Espera ver una nueva ola de profesionales de supply chain que aborden el campo con una mentalidad cuantitativa e ingenieril.

Joannes Vermorel destaca la visión de la empresa de proporcionar una capa analítica para la toma de decisiones en supply chain, en lugar de actuar como un repositorio de ERP o de movimiento de inventario. También discute los riesgos del ecosistema Python, que evoluciona rápidamente, incluyendo el desafío de mantener toolkits de vanguardia. Nicolas Vandeput, a su vez, asegura que la ciencia de datos y el machine learning en el forecast de supply chain no son excesivamente complejos. Su libro tiene como objetivo guiar a los lectores para que comiencen con modelos simples y gradualmente añadan complejidad. Ambos oradores enfatizan la necesidad del aprendizaje continuo y la adaptación, con Vandeput expresando la esperanza de que los lectores ganen confianza en su capacidad para aplicar la ciencia de datos en contextos de supply chain.

Transcripción Completa

Kieran Chandler: Hola, esta semana en Lokad TV, nos acompaña Nicolas Vandeput, un Supply Chain Scientist que se especializa en forecast de demanda. Además de tener una sólida experiencia técnica en la gestión de un supply chain multinacional, Nicolas también tiene un gran interés en la educación. Pasó un tiempo dando clases en la Universidad de Bruselas y acaba de lanzar su libro titulado “Data Science for Supply Chain Forecasts.” Así que, Nicolas, muchas gracias por venir hoy. Como siempre, es realmente agradable conocer un poco sobre nuestros invitados. Quizás podrías comenzar explicándonos un poco sobre ti y contarnos cómo te involucraste en el mundo de supply chain.

Nicolas Vandeput: Sí, como dijiste, soy alguien muy interesado en la educación y el aprendizaje. Me gusta pasar mi tiempo leyendo libros, artículos y consultando blogs en línea. Tuve la oportunidad de aprender mucho, y ahora estoy extremadamente feliz de poder aplicar ese conocimiento. En algún momento, sentí la necesidad de compartir lo que había aprendido, así que escribí un libro para resumir este nuevo campo de la ciencia de datos. Creo que esto es algo realmente nuevo, y también es único aplicarlo a supply chain, que es un tema específico. La gente utiliza la ciencia de datos para el marketing online, pero supply chain es un tema diferente, así que me tomé el tiempo de unirlos.

Kieran Chandler: Ok, entonces el libro se llama “Data Science for Supply Chain Forecasts.” Es un poco largo, pero ¿de qué trata?

Nicolas Vandeput: Es exactamente lo que dice el título: se trata de supply chain y de cómo aplicar la ciencia de datos para obtener forecasts en supply chain. En el pasado, la gente usaba lo que me gusta llamar “estadística old school”, que traía consigo muchas preguntas diferentes. Ahora que hemos entrado en un nuevo mundo de la ciencia de datos, algunas preguntas se mantienen, pero también surgen nuevas. Necesitamos encontrar nuevas formas de tratar los datos, y este libro trata de preparar a las personas para esta nueva era.

Kieran Chandler: Como siempre, nos acompaña Joannes Vermorel, el fundador de Lokad. Joannes, tuviste un adelanto del libro. ¿Cuál es tu perspectiva al respecto?

Joannes Vermorel: Sí, tuve un adelanto y tuve la oportunidad de revisar el manuscrito. Es muy bueno. Recomiendo a los gerentes de supply chain, que no cuentan con alguien con experiencia en ciencia de datos en su equipo, que adquieran una copia y lean al menos los primeros capítulos. Después, que otras personas de su equipo lean los otros capítulos y quizá actúen en consecuencia. Lo que es muy interesante es el fantástico progreso de los toolkits estadísticos open source. Hasta hace 10 años, eran usados principalmente por investigadores para demostrar cosas a otros investigadores. El código estaba ahí, pero era desordenado, de calidad de investigación, no de nivel de producción, y la documentación a menudo inexistente.

Lo que realmente cambió en los últimos cinco a diez años es que, con la aparición de la ciencia de datos, muchos profesores universitarios comenzaron a prestar atención a la calidad de los paquetes estadísticos. Se propusieron hacerlos accesibles a sus estudiantes, asegurando una documentación impecable, una terminología consistente entre los paquetes y enfocándose en métodos convencionales que funcionaran en una gran variedad de situaciones. La comunidad open source, con la ayuda de académicos, produjo una serie de paquetes open source impulsados por las necesidades de los usuarios.

Kieran Chandler: Joannes, ¿puedes contarnos más sobre el nuevo libro de Nicolas, “Data Science for Supply Chain Forecast”?

Joannes Vermorel: En este libro, Nicolas toma lo mejor de Python y de los paquetes más relevantes para demostrar cómo se pueden lograr forecasts casi a la vanguardia con un mínimo esfuerzo, lo cual es muy impresionante.

Kieran Chandler: Nicolas, ¿qué ha cambiado en la comunidad open source que ha mejorado la calidad de lo que existía?

Nicolas Vandeput: Creo que es cuestión de lo fácil que es crear un forecast. Hace diez años, habría sido un desastre, y este libro no hubiera sido posible. Habría estado dirigido a profesionales extremadamente motivados. Pero hoy, cualquier profesional con un poco de curiosidad y pasión puede hacerlo. Es bastante sencillo; solo necesitas tu propia laptop con software gratuito, y puedes comenzar con un lenguaje realmente fácil. Hace algunos años, eso no hubiera sido posible. Habría sido más complejo. Así que ahora, tienes la capacidad de probar algo por tu cuenta de forma gratuita, y a partir de ahí, tienes la posibilidad de experimentar. Dado que es fácil experimentar, puedes hacer más pruebas y luego afinar el forecast, el código y la ciencia de datos solo para tu caso específico. En el pasado, eso no hubiera sido posible.

Kieran Chandler: Joannes, no es solo el mundo del forecast el que se beneficia del software de código abierto. ¿Tienes ejemplos de otras industrias que realmente se hayan beneficiado de disponer de kits de herramientas de código abierto?

Joannes Vermorel: El movimiento de código abierto es increíblemente amplio, por lo que prácticamente todo el mundo del software hoy en día se ve afectado por el código abierto. Todos los principales proveedores de computación en la nube ejecutan sus propias nubes basadas en Linux, e incluso en Lokad, el 90% del software que usamos es de código abierto. Incluso Microsoft, que usamos, está utilizando mucho Linux en Azure. El propio framework .NET es de código abierto, y el kit de herramientas deep learning que utilizamos, el CNTK, también es un producto de código abierto de Microsoft. En Lokad, también lanzamos bastantes componentes como código abierto. Este movimiento ha estado en auge durante varias décadas.

Lo interesante, y relevante para el forecast y la supply chain, no es solo el hecho de que el software sea de código abierto, sino que se tienen componentes de código abierto bien empaquetados y bien documentados. Esto es un cambio total de juego. Significa la diferencia entre comenzar con algo simple, como una regresión lineal, en 20 líneas de código sencillas, frente a necesitar 200 líneas de código y un mes de juntar todas las piezas de software solo para tener algo que siquiera compile. Antes, se tenía código incompatible que fallaba al combinarse, y se necesitaba un mes de trabajo de integración solo para hacer funcionar algo publicado por otra persona. Ahora, configurar todo tu entorno de Python para ciencia de datos toma solo un par de páginas en el libro. Simplemente instalas Anaconda, y listo.

Kieran Chandler: Joannes, ¿podrías contarnos sobre el subsistema de Linux en Windows y cómo impacta en la facilidad de acceso a estas herramientas?

Joannes Vermorel: El subsistema de Linux en Windows permite que estas herramientas funcionen en prácticamente cualquier distribución de Linux, e incluso en sistemas Windows. El libro demuestra la facilidad de acceso a estas herramientas, lo cual ha cambiado significativamente gracias al código abierto y a paquetes de calidad de producción.

Nicolas Vandeput: Me gustaría agregar que en el libro discuto a profesionales que solían depender de VBA y macros en Excel. Siempre me pareció complejo y lleno de errores. Cuando sugieres usar Python u otro lenguaje, la gente a menudo piensa que es demasiado complejo. Sin embargo, mi mensaje en el libro es que en realidad es mucho más fácil utilizar frameworks de código abierto como Python o R que VBA o macros de Excel.

Kieran Chandler: Joannes, con todas estas herramientas de forecast de código abierto tan fáciles de usar, ¿te pone nervioso siendo un proveedor de software empresarial como Lokad?

Joannes Vermorel: Como proveedor de software empresarial, es parte del ecosistema y también un habilitador. Nosotros también usamos estas herramientas de código abierto, por lo que no tenemos que reconstruirlo todo. El desafío es encontrar nuestro valor añadido. Si tu valor añadido es solo implementar modelos de forecast semi-complicados, entonces no tienes un valor añadido real comparado con el ecosistema. El libro destaca que los proveedores que venden un kit de herramientas con algunos modelos de forecast no aportan mucho valor en comparación con las populares librerías de Python. Sin embargo, aún hay potencial en proporcionar soluciones de calidad de producción y manejar los desafíos de la supply chain a escala, que es algo que Lokad se propone abordar.

Nicolas Vandeput: Estoy de acuerdo con Joannes. Muchos profesionales y estudiantes en el mundo de la supply chain todavía ven el machine learning como una palabra de moda o algo que no perdurará. En realidad, ha llegado para quedarse. Si lees mi libro y te tomas el tiempo para aprender sobre ello, verás lo útil y accesible que puede ser para la optimización de la supply chain.

Kieran Chandler: Entonces, al leer el libro, estás mucho mejor preparado para obtener una solución como Lokad que puede ir un paso más allá. Como dijiste, puede hacer funcionar toda la solución de extremo a extremo. Por supuesto, para ejecutar un forecast en un entorno de super-agente, también se necesita un proceso completo de revisión con personas y demás. Así que, la elaboración de los números en el forecast es solo un paso en todo el proceso. ¿Puedes hablar sobre cómo se pueden implementar las ideas del libro?

Nicolas Vandeput: El objetivo del libro es solo discutir ese paso específico. No es que por haber leído el libro tengas que hacerlo por tu cuenta. También puedes acudir a otros proveedores como Lokad para entender: “He leído esto en el libro, ¿cómo les funciona a ustedes? ¿Cómo podemos implementarlo? Tengo esta idea, ¿funcionaría? ¿Podemos probarlo?” Entonces, comienzas a entender lo que realmente están haciendo proveedores de software como Lokad.

Kieran Chandler: Muchas de estas ideas se han desarrollado desde una perspectiva teórica. ¿Se pueden aplicar de manera productiva?

Nicolas Vandeput: Sí, totalmente. Estos nuevos forecast han existido desde hace mucho tiempo. Quiero decir, la teoría de redes neuronales se lanzó por primera vez en los años 60, y el primer método del libro también proviene de los años 60. Solo empezamos a usarlos hoy en día en un entorno de predicción porque se han hecho más fáciles de ejecutar. Tal vez hace diez años no lo era, y ahora la gente está más consciente de ello. Seguro que se puede usar. Lo que es realmente interesante con la ciencia de datos, y ese es uno de los grandes propósitos del libro, es que es realmente ciencia. Puedes probarlo, hacer experimentos y probarlo una y otra vez usando datos. Por eso se llama ciencia de datos. Puedes demostrar por ti mismo: “¿Funciona? ¿Sí o no?” Podría no funcionar, pero entonces puedes pensar, “Voy a diseñar un nuevo experimento, tener en cuenta nuevas cosas o eliminar lo que no necesito para ver si va a funcionar mejor.” Así que, es realmente una ciencia en la que puedes demostrar tu punto de que tu forecast va a ser mejor y solo empezar a usarlo después de eso.

Kieran Chandler: Entonces, se puede usar como otra prueba de concepto antes de que te acerques a alguien como Lokad y digas: “Joannes, cuando hablamos de pasar a una base de producción y usarlo diariamente, ¿cuáles son esos desafíos con los que la gente podría encontrarse? ¿Y en qué puede realmente ayudar Lokad en términos de ese proceso completo?”

Joannes Vermorel: Primero, necesitas obtener buenos datos. Si no tienes datos de alta calidad, terminas con “basura entra, basura sale”. Lo interesante de este libro es que le daría a las personas de supply chain una idea de lo que están haciendo los modelos, qué tipo de cosas pueden aprovechar, y eso les daría una mejor comprensión de por qué deben empezar a prestar atención ahora a toda una serie de áreas grises en las supply chains, como las promociones. Normalmente, los datos de promociones son un completo desastre. Lo mismo ocurre con los faltantes de stock. Frecuentemente, no hay datos históricos adecuados que reflejen todos los faltantes de stock, por lo que no sabes si tuviste cero ventas porque no había demanda o si tuviste cero ventas porque se agotó el stock.

Así que, estar más familiarizado con el tipo de modelo que puede explotar los datos puede hacer que seas más susceptible a ver si tu proceso existente es adecuado. El objetivo principal de una supply chain es mantener el flujo de bienes en movimiento.

Kieran Chandler: Entonces, el objetivo principal de una supply chain es compilar una base de datos histórica precisa. Ese es el primer objetivo. El objetivo secundario es atender a todos, mantener la producción en marcha y garantizar la satisfacción del cliente. Sin embargo, la ejecución del objetivo secundario a menudo no es de la misma calidad que el primer objetivo. Para acelerar esta transición y lograr la consolidación de datos a escala con múltiples sitios, necesitamos expandir nuestros horizontes. Joannes, ¿podrías profundizar en esto?

Joannes Vermorel: Cuando empezamos a trabajar con clientes, a menudo nos enfrentamos al desafío de la consolidación de datos y la ejecución. Muchos clientes no son conscientes de que se pueden aplicar recetas numéricas avanzadas a los forecast para generar mejores decisiones. Leer el libro sobre ciencia de datos puede ampliar tus horizontes y proporcionar ideas sobre cómo ejecutar la supply chain de manera más eficiente. Te ayuda a ver el panorama general antes y después del forecast, desde la producción hasta la explotación de los forecast para decisiones más inteligentes.

Nicolas Vandeput: A los líderes de la supply chain les faltan dos elementos cruciales para extraer insights accionables de la ciencia de datos y el machine learning. El primero es una cultura basada en datos, que falta en aproximadamente el 99% de las empresas en todo el mundo. Muchas empresas aún están luchando contra hojas de cálculo desordenadas y no se dan cuenta de la importancia de los datos adecuados. Este libro tiene como objetivo mostrar que con datos correctos, se puede lograr una ciencia adecuada, accurate forecasts, y experimentos efectivos. Sin datos, muchos proyectos se retrasan, y los periodistas pueden confirmarlo. El segundo elemento es la falta de talento y comprensión del machine learning y la ciencia de datos en la gestión de la supply chain. Necesitamos cambiar esta cultura y concienciar sobre el valor de los datos.

Kieran Chandler: Absolutamente, tener los datos correctos es crucial. Debería ser como un mandamiento: “Limpia tus datos.” Pero, ¿cómo podemos lograr este cambio de cultura? ¿Cómo podemos evangelizar el mercado y enfatizar la importancia de tener los datos adecuados?

Joannes Vermorel: Bueno, en broma, podríamos iniciar un culto donde los mejores datos sean obligatorios, como un mandamiento sagrado. Pero hablando en serio, creo que necesitamos fomentar la comprensión y la conciencia. Podemos educar al mercado y dar más importancia al valor de tener datos limpios y precisos. Al hacerlo, podemos crear un cambio cultural y asegurar que contar con los datos correctos se convierta en una prioridad principal para la gestión de la supply chain.

Kieran Chandler: Cuando careces de conciencia sobre lo que se puede lograr con deep learning y no tienes experiencia con ello, es muy difícil ver siquiera el sentido, ¿no es así?

Joannes Vermorel: De hecho, es un desafío. Creo que un buen punto de partida es ensuciarte las manos con el procesamiento de datos y no estar completamente enterrado en la pura tecnicidad de la tarea. No debería requerir un equipo de IT solo para configurar los entornos. Es muy importante entender qué hace funcionar estos métodos, qué los hace funcionar. No es magia.

Desmitificar esto es importante. En Lokad, hemos tratado de evangelizar al mercado. La educación es un camino a seguir. Nicolas está publicando un libro, lo cual es excelente. Nosotros también hemos publicado un libro y bastantes cosas, incluyendo una extensa base de conocimientos en el sitio web de Lokad. Pero sí, en conclusión, es la educación.

Lo que veo es una nueva ola de profesionales de la supply chain que ingresan al campo con una mentalidad más de ingeniería, que es más cuantitativa. Quieres tener números y cosas que se puedan repetir. El liderazgo es esencial en la supply chain, ya que involucra a muchas personas, países y sitios. Pero si tienes liderazgo sin ningún tipo de mentalidad de ingeniería o cuantitativa, es difícil optimizar cualquier cosa. Tan pronto como comienzas a usar la palabra “optimizar”, la regla cardinal de la optimización es que no puedes optimizar algo que no mides. Esto lleva a la pregunta: ¿cómo mides? Y entonces necesitas datos.

Kieran Chandler: Nicolas, hemos hablado mucho sobre los beneficios de usar estos kits de herramientas de código abierto. ¿Qué hay de algunos de los inconvenientes? ¿Dónde ves algunas desventajas al usar estas herramientas?

Nicolas Vandeput: Como hemos debatido, y creo que esto es realmente importante, el mundo de la supply chain se trata de mucha interacción entre productos, personas, diferentes equipos, etc. El proceso de forecast es un proceso muy largo con muchos interesados involucrados. Mi libro dice que durante las últimas décadas hemos estado usando las mismas técnicas. Si miras atrás a los años 80 y 90, encontrarás el mismo motor de forecast que hoy. Así que nada ha cambiado.

Estoy sugiriendo que podemos cambiar esta pieza muy específica, pero, por supuesto, eso no es suficiente. Todo el proceso necesita vivir y evolucionar. Solo usar Python no solucionará un proceso que no funciona. Solo mejorará los números del forecast, pero aún necesitas mirar el proceso completo.

Kieran Chandler: Joannes, pareces muy seguro de que siempre habrá un lugar para Lokad. Mirando hacia el futuro, ¿dónde ves que estará realmente ese lugar en el mercado?

Joannes Vermorel: Primero, creo que incluso hablando de forecasts puros, todavía tenemos cartas para jugar y obtener forecasts mejores. Pero “mejor” es más complicado que nunca. Es una cosa decir que tienes un forecast mejor en términos de error absoluto medio, pero en cuanto entras en el mundo probabilístico, es otro juego.

Si comienzas a decir, “Quiero forecastear la demanda, pero no para mañana, sino en un horizonte probabilístico, es decir, cuando llegará mi contenedor”, entonces se convierte en una demanda que comienza en un punto de tiempo incierto en el futuro y termina en otro punto incierto. Las cosas pueden volverse muy complicadas con más dimensiones. Luego, si empiezas a incluir factores como la probabilidad de que mi competidor baje su precio, lo que tendría un impacto muy específico en la forma de la demanda, ves que la precisión del forecast no es algo unidimensional. Tiene toda esa complejidad que abordar.

Kieran Chandler: De repente, tus modelos se vuelven complejos, incluso si tienes kits de herramientas de código abierto muy buenos. Integrar todas esas cosas de una manera libre de errores, de calidad de producción y escalable, aún requiere hacer muchas otras cosas.

Joannes Vermorel: Sí, si tomamos el ángulo puro del forecast, creo que ese es un enfoque. Pero, en Lokad, nuestra visión es realmente tener una capa analítica más profunda y de extremo a extremo para generar decisiones inteligentes para una determinada supply chain. No gestionamos sistemas de supply chain, no somos un ERP. No queremos ser el repositorio de todos los movimientos de inventario. Tenemos una copia de esos datos, pero somos la capa analítica inteligente.

Esa es la visión. Y, de nuevo, incluso si Lokad estuviera completamente construido con herramientas de código abierto, aún hay valor en integrar todo eso. Por ejemplo, las plataformas de computación en la nube que existen hoy en día son una enorme mezcla de cosas de código abierto, pero a la gente le gusta optar por Amazon porque podrías hacerlo tú mismo. Podrías tener tu propia nube privada, pero es un esfuerzo tan masivo reunir todas esas cosas que en algún punto, hay valor en que especialistas lo hagan por ti.

Una desventaja que veo acerca de este ecosistema de Python y open-source, muy específicamente, es que está evolucionando tan rápido. Si lo haces tú mismo, hay un peligro: eliges una versión de Python y un kit de herramientas, y luego, dos años después, hay algo dramáticamente mejorado. De repente, eras de última generación y ahora ya no lo eres, simplemente porque el mundo siguió avanzando y un laboratorio acaba de producir un nuevo kit de herramientas.

Por ejemplo, Scikit lideraba prácticamente todo hasta hace un par de años, pero ahora PyTorch está desafiándolo completamente al incorporar deep learning y programación diferenciable a la ecuación. Entonces plantea una pregunta: ¿quién es responsable de revisar lo que implementaste hace dos años y actualizarlo con la versión de moda? Un buen proveedor se encargaría de asegurarse de que tu solución de data science sea revisada de forma rutinaria y probablemente reescrita de manera rutinaria para mantenerse a la vanguardia.

No sé cuánto durará esta edad de oro del progreso en data science, pero no me sorprendería que, durante algo así como la próxima década, cada dos años viéramos algún progreso fantástico en el que la nueva versión sea mucho mejor que la anterior. Podría haber categorías de problemas que parecen muy difíciles de abordar, pero se vuelven accesibles.

Nicolas Vandeput: Si me permiten añadir algo, creo que es realmente interesante que Joannes haya mencionado la complejidad con la que Lokad es capaz de lidiar. He trabajado personalmente con el equipo de Lokad, así que sé de lo que son capaces. Uno de los mensajes de mi libro, y esto es realmente importante para mí, es decirle a la gente que ellos pueden hacerlo.

Algunas personas podrían haber escuchado lo que Joannes está diciendo y pensar, “¡Vaya, data science y machine learning parecen realmente complejos, tal vez eso no sea para mí!” Realmente quiero tranquilizar a la gente diciendo, “No, no es tan complejo. Puedes comenzar con un modelo simple.” Y en realidad, como muestra el libro, puedes empezar de manera bastante sencilla con un modelo muy simple que en realidad es extremadamente sólido tal como está. Luego, a partir de ahí, puedes añadir capas, quizá ajustar un poco el sistema, los datos, tal vez incorporar otro modelo, y así sucesivamente.

Así que, puedes comenzar de verdad de forma simple con algo que ya funcione muy bien, y a partir de ahí, pasar a asuntos más complejos. Ese es realmente el mensaje que quiero transmitir en el libro: puedes empezar de manera simple y luego progresar a algo más.

Kieran Chandler: ¿Puedes ayudarnos a entender cómo podemos determinar si un modelo está funcionando? ¿Podemos probarlo? ¿Podemos replicarlo? Estos principios parecen aplicarse a modelos simples, pero una vez que los comprendes para un modelo básico, ¿también puedes entenderlos para modelos mucho más complejos?

Nicolas Vandeput: Absolutamente, recomiendo encarecidamente a la gente que comience de manera simple. Una vez que dominas lo básico, puedes progresar hacia algo mucho más complejo.

Kieran Chandler: Eso me lleva de manera bastante directa a mi última pregunta. ¿Cuáles son tus esperanzas para los lectores de tu libro y para el uso de kits de herramientas open source en el futuro?

Nicolas Vandeput: Mi visión, e de hecho mi esperanza, es que la gente lea este libro y gane confianza en sus habilidades. Al final del libro, quiero que sean capaces de decirse a sí mismos, “Sí, realmente puedo hacer esto. No parece tan complejo.” Quizás hace dos semanas no sabían programar, pero al final, quiero que les resulte muy simple. Quiero que estas personas comiencen a experimentar por sí mismas, a vivir realmente el data science y a probar nuevos modelos. Espero que se conviertan en los nuevos líderes en gestión de supply chain. Este es también uno de los mensajes de Lokad. Ya estamos en un mundo cuantitativo de supply chain donde puedes experimentar e implementar soluciones que funcionan de manera consistente. Para hacer eso, necesitas data science. Así que, realmente espero que el libro empodere a las personas para que puedan hacerlo por sí mismas.

Kieran Chandler: Vamos a tener que concluir, pero gracias por tu tiempo hoy, Nicolas.

Nicolas Vandeput: Gracias.

Kieran Chandler: El libro, “Data Science for Supply Chain Forecast”, ya está disponible. Asegúrate de revisarlo en Amazon. Aquí en Lokad TV, volveremos pronto con otro episodio. Pero hasta entonces, gracias por mirar.

Joannes Vermorel: Gracias.