00:00:04 Rol del data scientist en supply chains.
00:01:33 Comparando tendencias de data mining y ciencia de datos.
00:03:16 Promocionando herramientas de ciencia de datos a universidades.
00:04:14 Habilidades de programación vs. crear valor de negocio.
00:06:37 La transición de Lokad hacia ‘supply chain scientists’.
00:08:01 Funciones de un Supply Chain Scientist.
00:09:50 Deberes compartidos entre TI y Supply Chain Scientist.
00:11:58 Supply Chain Scientists y el rol de extracción de datos.
00:14:19 Trampas de confiar únicamente en herramientas estadísticas.
00:16:29 El creciente rol de los datos en la vida.
Resumen
Kieran Chandler y Joannes Vermorel están discutiendo el papel crítico de data scientists en la gestión de supply chain. Su conversación resalta la necesidad de que estos profesionales extraigan valor de los datos del negocio, al tiempo que advierten sobre la tendencia a sobrevalorar las habilidades de programación y estadísticas. Vermorel señala la importancia del conocimiento práctico y del sentido de negocio, advirtiendo contra la excesiva confianza en las capacidades técnicas. Él está introduciendo el rol de “supply chain scientists”, quienes tienen la tarea de extraer e interpretar datos para abordar problemas empresariales, en contraste con los roles de TI enfocados en mantener los sistemas. Su diálogo subraya los desafíos en la formación universitaria, destacando la escasez de datos reales de supply chain y la excesiva dependencia en lenguajes de programación y marcos estadísticos.
Resumen Extendido
La conversación entre Kieran Chandler y Joannes Vermorel se centra en el creciente rol y la importancia de los data scientists en el ámbito comercial, específicamente en la industria de supply chain. Chandler destaca la creciente demanda de data scientists, calificándola como un fenómeno que se extiende por la industria como reguero de pólvora. Observa que esta demanda, que hace cinco años no era tan pronunciada, evoluciona tan rápidamente ahora que supera la capacidad de las universidades para formar suficientes graduados que llenen estos puestos.
Vermorel aporta su perspectiva a este cambio, observando que las empresas comienzan a valorar el intrínseco valor de sus datos y la consiguiente necesidad de contar con personas capacitadas para extraer ese valor. No obstante, también llama la atención sobre el patrón cíclico de esta tendencia, equiparándola con la fiebre del data mining de los años 90. Especula que la actual fijación con los data scientists evoca el previo interés por los data miners, lo que le lleva a llamar a los data scientists “versión 2 de data miners.”
Vermorel analiza el auge y la caída de las empresas de data mining en los años 90, sugiriendo una narrativa de advertencia. Recuerda el surgimiento de cientos de empresas que ofrecían herramientas para data mining y que la mayoría de ellas desaparecieron, sembrando dudas sobre el actual auge de proveedores de herramientas de ciencia de datos. Vermorel percibe una correlación entre estos dos periodos, insinuando un posible patrón cíclico de ascenso y declive en la actual tendencia de la ciencia de datos.
Curiosamente, Vermorel destaca que su empresa, Lokad, evita utilizar el término “data scientist”, optando en cambio por “supply chain scientist”. Esta preferencia refleja su convicción sobre la importancia de comprender el contexto del negocio y aportar valor más allá de las habilidades matemáticas y de programación. Advierte que la competencia en facetas técnicas, aunque crucial, no se traduce automáticamente en generar valor empresarial dentro de supply chains.
Además, Vermorel habla sobre la estrategia promocional de los actuales proveedores de herramientas de ciencia de datos. Destaca su agresiva campaña de marketing dirigida a las universidades, especialmente a través de toolkits de open source, ya que se adaptan a la mentalidad general de la academia. Sin embargo, también advierte: triunfar en promover un producto en las universidades no garantiza que la herramienta produzca resultados beneficiosos en entornos empresariales tangibles.
Vermorel enfatiza la necesidad de que los data scientists no solo analicen datos, sino que también provoquen un cambio real en el negocio a través de sus descubrimientos. El desafío es que, con frecuencia, los data scientists pueden examinar y presentar hallazgos, pero encuentran dificultades al implementar estos cambios, ya que pueden alterar el status quo. No se trata solo de desacuerdos en las decisiones operativas; es la cuestión más amplia de si el data scientist tiene realmente el poder de actuar y aportar valor al negocio.
Además, la discusión aborda el rol de un “supply chain scientist”, un término utilizado en Lokad. El trabajo de un supply chain scientist, según Vermorel, implica generar decisiones accionables relacionadas con supply chain, como determinar la cantidad que se debe pedir. Estas decisiones deben ser accionables, prácticas y rentables. A diferencia de un data scientist, un supply chain scientist se responsabiliza del valor de negocio de sus propuestas. Esto requiere comprender los sistemas empresariales y la interacción entre los datos, el software y las personas que lo operan, lo que asegura una comprensión integral del problema a resolver.
La tarea de un supply chain scientist implica comprender los datos extraídos, construir un modelo de optimización y equilibrar complejidad y precisión. Vermorel reconoce la complejidad del mundo real, especialmente en supply chains, lo que hace que la modelización matemática perfecta sea impracticable. En cambio, los supply chain scientists deben recurrir a aproximaciones y heurísticas para abordar los problemas de manera efectiva. Necesitan ver el panorama completo y comprometerse con él.
Chandler luego introduce el rol de IT departments, preguntando si deberían asumir la responsabilidad del software y de las personas, dado que habitualmente implementan y mantienen los sistemas de software.
Esta pregunta insinúa una tensión entre los roles operativos, técnicos y estratégicos dentro de una organización.
La conversación explora principalmente las responsabilidades distintas entre Tecnología de la Información (TI) y los supply chain scientists, así como los desafíos que enfrentan los data scientists en el panorama actual.
Vermorel sostiene que TI y los supply chain scientists tienen responsabilidades separadas dentro de una organización. Equipara el rol de TI con uno de mantenimiento, salvaguardando la operación constante y fluida de sistemas y procesos. La responsabilidad de TI es mantener todo funcionando cada segundo, gestionando las tecnicidades involucradas en preservar el tiempo de actividad y la seguridad del sistema.
Por el contrario, el rol de un supply chain scientist, según Vermorel, no se centra en el mantenimiento. En cambio, su función gira en torno a la extracción de datos y su interpretación. Deben asegurarse de que los datos utilizados ofrezcan una comprensión correcta de las situaciones empresariales y que las soluciones derivadas generen resultados rentables. No necesitan ocuparse de las tecnicidades, ya que su objetivo principal es resolver problemas de negocio mediante la interpretación precisa de los datos.
Chandler cambia la conversación hacia la aparente faltante de stock de habilidades en extracción y preparación de datos entre los data scientists, a pesar de que estos sean componentes vitales de su profesión. Vermorel está de acuerdo, señalando que los cursos universitarios y boot camps se centran en gran medida en lenguajes de programación como Python y R, a menudo descuidando los aspectos más prácticos del trabajo.
Vermorel aclara que las universidades están mejor equipadas para enseñar ciertos aspectos debido a preocupaciones de accesibilidad y confidencialidad. Los datos de supply chain de grandes empresas no son fácilmente accesibles para la formación por cuestiones de privacidad, mientras que el software de open source y los marcos estadísticos son más accesibles. Como resultado, los estudiantes suelen graduarse con un profundo conocimiento de la programación y las herramientas estadísticas, pero carecen de conocimientos prácticos sobre cómo manejar datos de supply chain en el mundo real.
Vermorel advierte que este énfasis excesivo en la programación y la estadística podría llevar a una sobreconfianza entre los nuevos data scientists. Pueden creer erróneamente que estas habilidades por sí solas son suficientes para resolver problemas de supply chain. Sin embargo, la gestión de supply chain no se trata únicamente de programación o análisis estadístico; se trata de comprender los datos y extraer sentido de negocio de ellos. Vermorel advierte contra desestimar la sabiduría de los practicantes de supply chain de bajo tech, quienes tienden a apoyarse en el sentido común y en herramientas simples, como hojas de Excel, para tomar decisiones empresariales.
Transcripción Completa
Kieran Chandler: Hoy vamos a hablar sobre un nuevo rol laboral que se está extendiendo por la industria como reguero de pólvora. El rol de un data scientist se vuelve cada vez más relevante en un momento en el que las empresas otorgan mayor importancia a los datos y extraen conclusiones pertinentes de ellos. Hace cinco años, ningún director de supply chain necesitaba data scientists. Sin embargo, hoy eso ha cambiado por la cantidad de oportunidades laborales para data scientists que parece crecer más rápido de lo que las universidades pueden formar profesionales. Entonces, Joannes, ¿qué ha cambiado? ¿Por qué de repente existe esta necesidad de más data scientists?
Joannes Vermorel: Claramente, las empresas reconocen que sus datos tienen mucho valor. Tan pronto como se dan cuenta de ello, necesitan muchas personas para extraer ese valor de los datos, y eso es lo que hacen los data scientists. Sin embargo, lo interesante es que no es algo completamente nuevo. Para quienes estuvieron activos en los años 90, o quizás hacia finales de esa década, cuando se conocían con otro nombre: data miners. La gente extraía información de los datos. Así que, básicamente, el data scientist parece ser la versión 2 del data miner, o algo similar.
Kieran Chandler: Si estos data miners ya no están presentes hoy en día, supongo que los resultados no fueron tan buenos. ¿Podrías contarnos un poco más al respecto y si hay algo que podamos aprender de lo que salió mal?
Joannes Vermorel: Es muy interesante porque se puede ver que en los círculos de supply chain, los data scientists se han vuelto muy de moda. Me parece que hay una tendencia macro en la que las cosas entran y salen. Hace dos décadas se hablaba de data mining, y hoy en día se habla de data science. Es el mismo patrón, solo que con un nombre diferente. Hace dos décadas vimos el surgimiento de cientos de empresas que ofrecían herramientas para data mining y la mayoría de ellas desaparecieron. Hoy en día, vemos el surgimiento de cientos de empresas que ofrecen herramientas de ciencia de datos. También vemos consultores de ciencia de datos. Así que, sí, hay algo verdadero en el fondo, pero también existe un efecto cíclico de moda al respecto.
Kieran Chandler: No es común oír las palabras data science y moda en la misma frase. Lo que estamos diciendo es que los data miners solían llamarse de otra manera. Entonces, ¿no deberíamos empezar a vender la tecnología de Lokad a las universidades para que la próxima generación de data scientists, sean como sean llamados, estén totalmente formados en la herramienta y entiendan plenamente cómo utilizarla?
Joannes Vermorel: Esa es ciertamente una perspectiva. Por cierto, todas las empresas que impulsan herramientas de ciencia de datos se están promocionando agresivamente hacia las universidades. Una forma sencilla de hacerlo es promover toolkits de open source, ya que se adaptan a la mentalidad general de las universidades. Sin embargo, es principalmente una herramienta de marketing. Es bueno en cierto sentido, pero no tiene por qué implicar eficiencia. No significa que si te promocionas exitosamente en las universidades, necesariamente obtendrás resultados en tu negocio. No es porque te conviertas en un gran matemático o en un gran programador que de inmediato se traduzca en crear valor de negocio en tus supply chains. Creo que este es un peligro, y esa es una de las razones fundamentales por las que en Lokad preferimos el término “supply chain scientist.”
Kieran Chandler: Poner al negocio en primer lugar tiene sentido para muchos practicantes de supply chain, porque están expuestos al negocio en su trabajo diario. Quizás la única excepción sea en empresas muy grandes donde los data scientists pueden verse abrumados por el gran volumen de datos o por la complejidad de sus problemas. Pero, ¿existe algún inconveniente más allá de centrarse en
un problema empresarial particular?
¡Búhos y reduciendo lead times y cosas por el estilo! Entonces, ¿existe algún inconveniente más allá de centrarse en el problema empresarial correcto?
Joannes Vermorel: Sí, en realidad hay un gran inconveniente. El rol de un data scientist no se trata solo de analizar el negocio; se trata de marcar la diferencia y de ser capaz de tomar e implementar una decisión, lo que puede generar un impacto real en la organización. Esto puede ser complicado porque los data scientists pueden acceder fácilmente a los datos y producir análisis. Pero cuando se trata de actuar, a menudo desafían el status quo. No se trata solo de desacuerdos sobre las cantidades a pedir, sino de desacuerdos que van más profundo. El mayor potencial de fracaso radica en que el data scientist no esté en una posición para actuar realmente y aportar valor al negocio. Ese es probablemente el principal inconveniente que veo.
Kieran Chandler: Mencionaste que hay una especie de empuje contra el status quo. Sin duda, tengo mucha simpatía por algunos de los practicantes de supply chain, porque han estado trabajando con métodos que han funcionado durante décadas. Así que, si hay alguien que cuestiona lo que ha funcionado y lo que sigue funcionando, entiendo por qué abordan las cosas con tanto escepticismo. Mencionaste que en Lokad tenemos supply chain scientists en lugar de data scientists. ¿Podrías contarnos un poco más sobre ellos y por qué se les llama de forma diferente?
Joannes Vermorel: Creo que el nombre diferente refleja nuestro enfoque hacia los problemas. Nuestro compromiso está con el supply chain. Un supply chain scientist es alguien que debe generar decisiones reales y accionables, como determinar cuántos se deben pedir en este momento. Las decisiones deben ser accionables, prácticas y rentables. Se trata de alguien que se responsabiliza del valor empresarial de sus propuestas. Esta responsabilidad conlleva, en realidad, muchas implicaciones.
Para ponerlo en contexto, retrocedamos. La decisión es el objetivo final, pero si empiezas hacia atrás, todo comienza con datos. Los datos provienen de sistemas empresariales, pero los datos solo tienen sentido a través de los ojos de las personas que operan el software. Así que no es solo software; es software más personas. El supply chain scientist necesita tener un muy buen entendimiento de esto. Debe comprender el problema que se está resolviendo, dar sentido a los datos extraídos y luego construir algún tipo de modelo de optimización.
Existe un trade-off entre complejidad y precisión. El mundo real es increíblemente complejo, y las supply chain no son la excepción. No es posible tener un modelado matemático perfecto, así que hay que aproximar y usar heurísticas, que son simplemente recetas que funcionan. El supply chain scientist necesita juntar todas estas cosas para asegurar que haya ahorros reales, no solo en porcentajes, sino en dólares reales. Debe comprometerse con este panorama completo. De eso se trata un supply chain scientist.
Kieran Chandler: Bien, pero has mencionado que un supply chain scientist debería ser responsable tanto del software como de las personas. ¿Qué pasa con los departamentos de IT? ¿No deberían ellos ser los responsables de eso? Después de todo, son los que han implementado el software y, a menudo, son las personas que lo construyen.
Parece que se está poniendo una gran cantidad de responsabilidad sobre los hombros de un solo supply chain scientist. ¿Estás esperando un milagro?
Joannes Vermorel: Sí, la responsabilidad es bastante enorme. Sin embargo, hay una diferencia significativa. Creo que la responsabilidad principal de IT es asegurar que el sistema esté operativo. IT necesita encargarse de las operaciones continuas y garantizar que todo funcione cada segundo. El supply chain scientist tiene una responsabilidad diferente. A esta persona no se le encarga mantener todo en marcha y funcionando.
Kieran Chandler: Entonces, ¿cuál es exactamente la responsabilidad de un supply chain scientist?
Joannes Vermorel: La responsabilidad de un supply chain scientist es extraer datos y darles sentido. Es una tarea muy diferente. Esta persona no tiene que lidiar con todas las tecnicalidades involucradas en mantener algo en marcha, funcionando y seguro. Esa es la responsabilidad de IT, lo cual es, de hecho, muy difícil. El compromiso del científico es asegurar que la comprensión sea correcta. La solución de negocio que surge de esta comprensión necesita ser rentable como resultado de identificar con precisión un problema que el negocio realmente necesita resolver.
Kieran Chandler: Parece que la extracción y preparación de datos son tareas críticas. Sin embargo, ¿no están los data scientists insuficientemente capacitados en estos aspectos? La mayoría de los cursos de data science y boot camps se tratan de programar en lenguajes como Python y R.
Joannes Vermorel: Es una excelente pregunta. Las universidades sobresalen en ciertas áreas y son débiles en otras. Enfrentemos la realidad: dar sentido a los datos requiere primero tener datos reales. La mayoría de las grandes empresas con supply chain de gran tamaño no comparten sus datos con las universidades. Por lo tanto, las universidades utilizan como material de entrenamiento lo que tienen a su disposición. Acceder a software open-source es mucho más fácil que acceder a datos confidenciales de supply chain.
Kieran Chandler: Se discute mucho sobre los datos personales, ya sabes, similar al GDPR en Europa. Requiere esfuerzos significativos de todos para cumplir. Así que eso es incidental, pero complica la situación. Las universidades, por ejemplo, quieren capacitar a las personas en las tareas más difíciles, donde podrán aportar el mayor valor, pero es complicado. Por eso es mucho más fácil para las universidades recurrir a lenguajes de programación y marcos estadísticos porque son más accesibles, más matemáticos. También es más sencillo evaluar a los estudiantes en estas materias, lo cual, como profesor, necesitas tanto enseñar como evaluar a tus estudiantes. Eso requiere enseñar algo en lo que la evaluación sea posible. Es una restricción extraña, pero ciertamente influye en lo que se puede enseñar en una universidad.
Joannes Vermorel: Ahora, el principal problema que veo con este enfoque en los conjuntos de herramientas estadísticas es que puede conducir a la excesiva confianza. Es beneficioso saber programar, ser fluido en estadística. Ciertamente es algo que ayudará, no es algo negativo. Pero viene con un asunto sutil. Puede hacer que las personas se sientan demasiado seguras, creyendo que saber programar, entender la estadística, entender las matemáticas, es la clave para resolver problemas de supply chain.
Y aquí, existe una cierta sabiduría en muchos practicantes de supply chain que a menudo son muy poco tecnológicos. Intentan ceñirse al sentido común, se apegan a su hoja de Excel. Y hay sabiduría en eso porque se están ajustando a lo que tiene sentido en el negocio. Si la única razón por la que te apegas al sentido común es porque te falta conocimiento sobre estadística y programación, eso no es lo ideal. Pero, por otro lado, si lo único que sabes es estadística y programación, eso no te convierte en un experto en supply chain.
El hecho de ser competente en estas áreas no se traduce automáticamente en soluciones que generen euros o dólares adicionales. Así que creo que ese es el mayor peligro. Ahora estamos produciendo ejércitos de personas que con frecuencia sufren de excesiva confianza. Programar es un medio, no un fin.
Kieran Chandler: Esa es una perspectiva perspicaz. Gracias por arrojar luz sobre el tema de los data scientists y, de hecho, los supply chain scientists. Es un tema que se está volviendo cada vez más relevante dado la asombrosa cantidad de datos recopilados en nuestra vida diaria. Gracias por tomarte el tiempo hoy.
Joannes Vermorel: Gracias, Kieran.
Kieran Chandler: Y gracias a nuestros oyentes por sintonizar el episodio de hoy. Volveremos muy pronto con otro. Hasta entonces, sigan haciendo sus preguntas y enviándonos sus comentarios. Muchas gracias por vernos, y nos veremos de nuevo muy pronto. Adiós por ahora.