00:00:09 Introduction et parcours de Nicolas Vandeput.
00:01:21 Le livre de Nicolas : Science des données pour la prévision de la supply chain.
00:03:29 Progrès des ensembles d’outils statistiques open source.
00:05:36 Simplicité de l’expérimentation avec les outils de prévision modernes.
00:06:17 Impact de grande envergure des logiciels open source sur l’industrie.
00:08:03 Utilisation de Python et R pour la data science.
00:10:35 Impact des outils open source sur les fournisseurs.
00:13:22 Rôle des fournisseurs dans les solutions de prévision.
00:14:26 Application de la théorie dans des environnements de production.
00:15:38 Passage à la production : défis liés aux données.
00:16:29 Gestion des problèmes de données dans la supply chain.
00:18:05 Consolidation des données pour de meilleures décisions.
00:19:56 Nécessité d’une culture de données dans la supply chain.
00:22:14 Formation pour une meilleure gestion de la supply chain.
00:24:01 Règle d’optimisation et importance de la mesure.
00:24:15 Inconvénients de l’open source dans la supply chain.
00:25:37 Rôle futur de Lokad et valeur des spécialistes.
00:28:34 Défis liés à l’évolution de Python et de l’open source.
00:31:37 Encourager les débuts simples en data science.
Résumé
Nicolas Vandeput et Joannes Vermorel discutent du rôle transformateur de la data science dans la prévision de la supply chain. Vermorel souligne que Lokad se concentre sur la fourniture d’une couche analytique pour la prise de décision en supply chain, tout en abordant les défis posés par l’évolution rapide des outils statistiques open source. Vandeput rassure en affirmant que son livre simplifie les complexités de la data science et du machine learning pour la prévision de la supply chain, en encourageant les lecteurs à commencer avec des modèles simples et à ajouter progressivement de la complexité. Les deux s’accordent sur l’importance de l’apprentissage continu et de l’adaptation dans ce domaine en constante évolution. Vandeput espère que son livre permettra aux lecteurs d’appliquer en toute confiance la data science dans leurs opérations supply chain, annonçant une nouvelle ère de prise de décision quantitative et basée sur les données.
Résumé détaillé
Lors de l’entretien, Kieran Chandler, l’animateur, présente Nicolas Vandeput, un Supply Chain Scientist passionné par l’éducation, ainsi que Joannes Vermorel, le fondateur de Lokad. La discussion porte principalement sur le nouveau livre de Vandeput, “Science des données pour la prévision de la supply chain.”
Vandeput commence par souligner sa passion pour l’apprentissage et l’enseignement, qui l’a conduit à écrire son livre. Il exprime sa fascination pour le domaine en plein essor de la data science et ses applications potentielles à la gestion de la supply chain, qu’il considère comme un secteur d’activité unique et complexe pouvant grandement bénéficier de techniques modernes basées sur les données. Il affirme que son livre synthétise ces idées, en se concentrant sur la manière dont la data science peut être exploitée pour améliorer la prévision dans le secteur de la supply chain.
Vandeput explique que, traditionnellement, la prévision de la supply chain reposait principalement sur ce qu’il appelle des méthodes statistiques “old school”. Cependant, avec l’avènement et le progrès de la data science, de nouvelles façons de traiter et d’interpréter les données ont émergé. Son livre vise à préparer les professionnels pour cette nouvelle ère, en leur donnant les moyens d’exploiter la data science afin d’améliorer leurs prévisions en supply chain.
Vermorel apporte son point de vue en soulignant qu’il a trouvé le livre de Vandeput extrêmement précieux, en particulier pour les gestionnaires de supply chain qui n’ont pas encore exploité la data science. Il suggère que les managers devraient se familiariser avec ce livre et encourager leurs équipes à faire de même.
Vermorel développe la discussion en notant les avancées significatives des ensembles d’outils statistiques open source au cours de la dernière décennie. Il se souvient qu’il y a environ dix ans, ces outils, bien que facilement accessibles, étaient principalement conçus pour les chercheurs et n’étaient pas de qualité production en raison de leur complexité et du manque de documentation conviviale.
Cependant, il note qu’avec l’essor de la data science au cours des cinq à dix dernières années, une transformation s’est opérée. De nombreux professeurs d’université ont commencé à accorder de l’importance à la convivialité de ces packages statistiques, s’assurant qu’ils soient accessibles à leurs étudiants. Cela a conduit à une amélioration de la qualité de la documentation, à une cohérence de la terminologie à travers différents packages, et à un accent mis sur des techniques courantes et largement applicables.
Vermorel conclut en reconnaissant les efforts de la communauté open source, avec l’aide du milieu académique, pour avoir produit une gamme de packages statistiques de haute qualité, accessibles et conviviaux, désormais disponibles pour des professionnels de divers secteurs, y compris la gestion de la supply chain. Cela souligne l’importance croissante de la data science dans les pratiques commerciales contemporaines.
Le livre, a noté Vandeput, permet à toute personne disposant d’un ordinateur portable et de logiciels gratuits de commencer à générer des prévisions sophistiquées. La large disponibilité des outils open source permet aux utilisateurs d’expérimenter et d’affiner leurs modèles de prévision selon leurs besoins spécifiques, ce qui aurait été bien plus difficile par le passé.
La conversation s’est ensuite orientée vers l’impact plus large des logiciels open source. Vermorel a souligné que presque tous les logiciels modernes sont influencés par la programmation open source, les fournisseurs de cloud computing s’appuyant fortement sur des plateformes open source comme Linux. Lokad lui-même, a-t-il révélé, utilise 90 % de logiciels open source dans ses opérations. L’aspect révolutionnaire des logiciels open source modernes n’est pas seulement leur accessibilité, mais aussi la qualité de leur conditionnement et de leur documentation.
Vandeput a souligné qu’il est désormais plus facile de programmer en Python ou R qu’avec des frameworks plus anciens comme VBA ou les macros Excel. Cette facilité d’accès et d’utilisation, a-t-il dit, constitue l’un des messages centraux de son livre. Interrogé sur le fait que ce virage vers le logiciel open source ne le rendait pas nerveux, Vermorel a répondu que, bien qu’il représente un défi pour les fournisseurs qui doivent démontrer leur valeur, il agit également comme un catalyseur.
Vermorel a noté que si la seule valeur d’un fournisseur réside dans la mise en œuvre d’un modèle de prévision semi-compliqué, il aurait du mal à rivaliser avec l’écosystème open source. La véritable valeur ajoutée, a-t-il suggéré, réside dans la fourniture de solutions complètes, de qualité production, pour relever les défis de la supply chain, qui impliquent bien plus que de simples prévisions précises.
Kieran Chandler, l’animateur, pose ensuite une question à Joannes Vermorel concernant la transition vers une production opérationnelle et les défis qui pourraient en découler. Vermorel commence par souligner l’importance de la qualité des données, en suggérant que sans elle, tout processus guidé par les données risque de conduire à du “garbage in, garbage out”. Cette préoccupation concernant la qualité des données s’étend à des domaines souvent négligés dans la supply chain, tels que les données sur les promotions et les ruptures de stock. Il soutient que la compréhension des modèles qui exploitent ces données peut aider les professionnels de la supply chain à être plus conscients de ces domaines négligés.
Cependant, Vermorel reconnaît également que l’objectif principal d’une supply chain n’est pas de compiler une base de données historique précise ; cela reste un objectif secondaire. Lokad aide ses clients à accélérer la consolidation de données de qualité, potentiellement à travers plusieurs sites et systèmes. Comprendre comment ces données peuvent être exploitées est important. De plus, Lokad contribue à transformer ces prévisions en décisions supply chain, étendant ainsi leur utilité jusqu’à l’action.
La conversation se tourne ensuite vers le manque de culture data et de compréhension du machine learning dans le secteur de la supply chain. Vandeput suggère que cela constitue un obstacle important pour de nombreuses entreprises. Souvent, les projets en supply chain sont retardés en raison d’une insuffisance de données ou d’une mauvaise compréhension de ce que le machine learning peut accomplir. Cela entraîne une discussion sur la nécessité de changer cette culture et d’accorder une importance accrue à la qualité des données.
Vermorel suggère que l’éducation représente une voie d’avenir, en se référant aux efforts qu’il déploie, avec Vandeput, pour évangéliser le marché à travers leurs livres respectifs et autres publications. Il espère voir une nouvelle génération de praticiens de la supply chain aborder ce domaine avec une approche quantitative et ingénieuriale.
Joannes Vermorel met en avant la vision de l’entreprise qui consiste à fournir une couche analytique pour la prise de décision en supply chain, plutôt qu’à agir comme un dépôt ERP ou de mouvement des stocks. Il aborde également les risques liés à l’écosystème Python en constante évolution, y compris le défi de maintenir des ensembles d’outils à la pointe de la technologie. Nicolas Vandeput, quant à lui, assure que la data science et le machine learning dans la prévision de la supply chain ne sont pas excessivement complexes. Son livre vise à guider les lecteurs pour qu’ils commencent par des modèles simples et y ajoutent progressivement de la complexité. Les deux intervenants soulignent la nécessité d’un apprentissage continu et d’une adaptation, Vandeput exprimant l’espoir que les lecteurs gagnent en confiance quant à leur capacité à appliquer la data science dans des contextes supply chain.
Transcription complète
Kieran Chandler : Bonjour, cette semaine sur Lokad TV, nous sommes rejoints par Nicolas Vandeput, un Supply Chain Scientist spécialisé dans la prévision de la demande. En plus de posséder une solide expérience technique dans la gestion d’une supply chain multinationale, Nicolas s’intéresse également vivement à l’éducation. Il a donné des cours à l’Université de Bruxelles et vient de publier son livre intitulé “Data Science for Supply Chain Forecasts.” Alors, Nicolas, merci beaucoup d’être venu aujourd’hui. Comme toujours, c’est un réel plaisir d’en apprendre un peu plus sur nos invités. Pouvez-vous commencer en nous parlant un peu de vous et en nous expliquant comment vous vous êtes impliqué dans le monde de la supply chain.
Nicolas Vandeput : Oui, comme vous l’avez dit, je suis quelqu’un de très intéressé par l’éducation et l’apprentissage. J’aime passer mon temps à lire des livres, des articles et à consulter des blogs en ligne. J’ai eu l’opportunité d’apprendre énormément, et maintenant je suis extrêmement heureux de pouvoir appliquer ces connaissances. À un moment donné, j’ai ressenti le besoin de partager ce que j’avais appris, alors j’ai écrit un livre pour résumer ce nouveau domaine de la data science. Je pense que c’est quelque chose de vraiment nouveau, et il est également unique de l’appliquer à la supply chain, qui est un sujet spécifique. Les gens utilisent la data science pour le marketing en ligne, mais la supply chain est un sujet différent, donc j’ai pris le temps de les rapprocher.
Kieran Chandler : D’accord, donc le livre s’intitule “Data Science for Supply Chain Forecasts.” C’est un peu long, mais de quoi s’agit-il ?
Nicolas Vandeput : C’est exactement ce que dit le titre : il s’agit de la supply chain et de la manière d’appliquer la data science pour obtenir des prévisions dans la supply chain. Par le passé, les gens utilisaient ce que j’aime appeler des statistiques “old school”, qui soulevaient de nombreuses questions différentes. Maintenant que nous sommes entrés dans un nouveau monde de la data science, certaines questions subsistent, mais de nouvelles surgissent également. Nous devons trouver de nouvelles façons de traiter les données, et ce livre a pour but de préparer les gens à cette nouvelle époque.
Kieran Chandler : Comme toujours, nous sommes rejoints par Joannes Vermorel, le fondateur de Lokad. Joannes, vous avez eu un aperçu du livre. Quel est votre point de vue à ce sujet ?
Joannes Vermorel : Oui, j’ai eu un aperçu et j’ai eu l’opportunité de relire le manuscrit. Il est très bon. Je recommande aux gestionnaires de supply chain, qui n’ont pas quelqu’un dans leur équipe avec une expertise en data science, de se procurer un exemplaire et de lire au moins les premiers chapitres. Ensuite, faites en sorte que d’autres personnes de votre équipe lisent les chapitres suivants et, peut-être, mettent cela en pratique. Ce qui est très intéressant, c’est l’avancement fantastique des ensembles d’outils statistiques open source. Il y a jusqu’à 10 ans, ils étaient principalement utilisés par des chercheurs pour démontrer des choses à d’autres chercheurs. Le code était là, mais il était désordonné, de qualité recherche, pas de qualité production, et la documentation était souvent inexistante.
Ce qui a vraiment changé au cours des cinq à dix dernières années, c’est qu’avec l’émergence de la data science, de nombreux professeurs d’université ont commencé à se préoccuper de la qualité des packages statistiques. Ils se sont efforcés de les rendre accessibles à leurs étudiants, en garantissant une documentation impeccable, une terminologie cohérente à travers les packages, et en se concentrant sur des méthodes courantes qui fonctionnent dans une grande variété de situations. La communauté open source, avec l’aide du monde académique, a produit une série de packages open source répondant aux besoins des utilisateurs.
Kieran Chandler : Joannes, pouvez-vous nous en dire plus sur le nouveau livre de Nicolas, “Data Science for Supply Chain Forecast” ?
Joannes Vermorel : Dans ce livre, Nicolas reprend les bons éléments de Python et des packages les plus pertinents pour démontrer comment il est possible d’obtenir des prévisions quasi à la pointe de la technologie avec un minimum d’effort, ce qui est très impressionnant.
Kieran Chandler : Nicolas, qu’est-ce qui a changé dans la communauté open source pour améliorer la qualité de ce qui existait auparavant ?
Nicolas Vandeput : Je pense que cela tient à la facilité de créer une prévision. Il y a dix ans, cela aurait été un chaos, et ce livre n’aurait pas été possible. Il aurait été destiné à des professionnels extrêmement motivés. Mais aujourd’hui, tout professionnel doté d’un peu de curiosité et de passion peut le faire. C’est plutôt simple : il vous suffit d’avoir votre propre ordinateur portable avec des logiciels gratuits, et vous pouvez commencer avec un langage vraiment accessible. Il y a quelques années, cela n’aurait pas été possible. Ce serait bien plus complexe. Aujourd’hui, vous pouvez tester quelque chose facilement par vous-même gratuitement, et à partir de là, vous pouvez expérimenter. Comme il est facile d’expérimenter, vous pouvez réaliser plus d’expériences, puis affiner la prévision, le code et la data science spécifiquement pour votre cas.
Kieran Chandler: Joannes, ce n’est pas seulement le monde de la prévision qui bénéficie des logiciels open-source. Avez-vous des exemples d’autres industries ayant réellement bénéficié de la disponibilité de boîtes à outils open-source?
Joannes Vermorel: Le mouvement open-source est incroyablement vaste, de sorte que pratiquement tout le monde du logiciel aujourd’hui est impacté par l’open source. Tous les principaux cloud computing providers gèrent leurs propres clouds basés sur Linux, et même chez Lokad, 90% des logiciels que nous utilisons sont open-source. Même Microsoft, que nous utilisons d’ailleurs, utilise beaucoup Linux sur Azure. Le framework .NET lui-même est open-source, et la deep learning boîte à outils que nous utilisons, le CNTK, est également un produit open-source de Microsoft. Chez Lokad, nous rendons également disponibles un bon nombre de modules en open-source. Ce mouvement existe depuis plusieurs décennies.
Ce qui est intéressant, et pertinent pour la prévision et la supply chain, ce n’est pas seulement le fait que les logiciels soient open-source, mais aussi que vous disposiez de composants open-source bien conditionnés et bien documentés. Cela change complètement la donne. Cela signifie la différence entre démarrer avec quelque chose de simple, comme une régression linéaire, en 20 lignes de code claires, et devoir écrire 200 lignes de code et passer un mois à rassembler toutes vos pièces de logiciels juste pour obtenir quelque chose qui compilerait. Autrefois, vous aviez du code incompatible qui se plantait lorsqu’il était combiné, et il fallait un mois de travaux de raccordement juste pour faire fonctionner quelque chose publié par quelqu’un d’autre. Aujourd’hui, configurer l’ensemble de votre environnement Python pour la data science prend seulement quelques pages dans le livre. Il suffit d’installer Anaconda, et c’est terminé.
Kieran Chandler: Joannes, pourriez-vous nous parler du sous-système Linux sur Windows et de la manière dont cela impacte la facilité d’accès à ces outils?
Joannes Vermorel: Le sous-système Linux sur Windows permet à ces outils de fonctionner sur pratiquement n’importe quelle distribution Linux, et même sur des systèmes Windows. Le livre démontre la facilité d’accès à ces outils, qui a considérablement évolué grâce à l’open source et aux packages de qualité production.
Nicolas Vandeput: J’aimerais ajouter que dans le livre, je parle de professionnels qui se fiaient auparavant à VBA et aux macros dans Excel. Cela m’a toujours semblé complexe et truffé de bugs. Lorsque l’on suggère d’utiliser Python ou un autre langage, beaucoup pensent que c’est trop compliqué. Cependant, mon message dans le livre est que l’usage d’open frameworks comme Python ou R est en réalité bien plus simple que VBA ou les macros Excel.
Kieran Chandler: Joannes, avec tous ces outils de prévision open-source faciles à utiliser, cela vous rend-il nerveux en tant que fournisseur de logiciels d’entreprise comme Lokad?
Joannes Vermorel: En tant que fournisseur de logiciels d’entreprise, cela fait partie de l’écosystème et constitue aussi un levier. Nous utilisons nous aussi ces outils open-source, donc nous n’avons pas à tout reconstruire. Le défi consiste à trouver notre valeur ajoutée. Si votre valeur ajoutée se limite à implémenter des modèles de prévision semi-compliqués, alors vous n’apportez pas une réelle plus-value par rapport à l’écosystème. Le livre souligne que les fournisseurs qui vendent une boîte à outils avec quelques modèles de prévision n’offrent pas beaucoup de valeur par rapport aux bibliothèques Python populaires. Cependant, il existe encore un potentiel à fournir des solutions de qualité production et à relever les défis de la supply chain à grande échelle, ce que Lokad vise à adresser.
Nicolas Vandeput: Je suis d’accord avec Joannes. De nombreux professionnels et étudiants dans le monde de la supply chain considèrent encore le machine learning comme un mot à la mode ou quelque chose qui ne durera pas. En réalité, il est là pour rester. Si vous lisez mon livre et prenez le temps de vous y plonger, vous constaterez combien il peut être utile et accessible pour l’optimization de la supply chain.
Kieran Chandler: Ainsi, en lisant le livre, vous êtes bien mieux préparé pour obtenir une solution comme Lokad qui peut aller un pas plus loin. Comme vous l’avez dit, elle peut faire fonctionner l’ensemble de la solution de bout en bout. Bien entendu, pour exécuter une prévision dans un environnement super-agent, il faut également disposer d’un processus complet de validation avec des intervenants, etc. Ainsi, la saisie des chiffres dans la prévision n’est qu’une étape de l’ensemble du processus. Pouvez-vous expliquer comment les idées du livre peuvent être implémentées?
Nicolas Vandeput: L’objectif du livre est seulement d’aborder cette étape spécifique. Ce n’est pas parce que vous avez lu le livre que vous devez tout faire vous-même. Vous pouvez également vous tourner vers d’autres fournisseurs comme Lokad pour comprendre : “J’ai lu cela dans le livre, comment cela fonctionne-t-il pour vous ? Comment pouvons-nous l’implémenter ? J’ai cette idée, est-ce que cela fonctionnerait ? Pouvons-nous le tester ?” Ensuite, vous commencez à comprendre ce que font réellement des fournisseurs de logiciels comme Lokad.
Kieran Chandler: Beaucoup de ces idées ont été développées d’un point de vue théorique. Peut-on les appliquer de manière productive?
Nicolas Vandeput: Oui, tout à fait. Ces nouvelles prévisions existent depuis longtemps. Je veux dire, la théorie des réseaux de neurones a été publiée pour la première fois dans les années 60, et la première méthode présentée dans le livre date également des années 60. Nous ne commençons à les utiliser en environnement de prédiction qu’aujourd’hui parce qu’il est devenu plus facile de les exécuter. Il y a peut-être dix ans, ce n’était pas le cas, et les gens en étaient alors moins conscients. Certainement, vous pouvez utiliser cela. Ce qui est vraiment intéressant avec la data science, et c’est l’un des grands objectifs du livre, c’est que c’est véritablement une science. Vous pouvez le tester, réaliser des expériences, et le tester encore et encore en utilisant des données. C’est pourquoi on l’appelle la data science. Vous pouvez vous prouver : “Est-ce que ça fonctionne ? Oui ou non ?” Il se peut que cela ne fonctionne pas, mais alors vous pouvez penser : “Je vais concevoir une nouvelle expérience, prendre en compte de nouveaux éléments ou retirer ceux dont je n’ai pas besoin pour voir si cela fonctionne mieux.” Ainsi, c’est véritablement une science où vous pouvez démontrer que votre prévision sera meilleure et ne commencer à l’utiliser qu’après cela.
Kieran Chandler: Ainsi, cela peut servir de preuve de concept supplémentaire avant de vous adresser à quelqu’un comme Lokad et de dire : “Joannes, quand il s’agit de passer à une production quotidienne, quels sont les défis auxquels les gens pourraient être confrontés? Et en quoi Lokad peut-il réellement aider dans ce processus complet?”
Joannes Vermorel: Premièrement, il vous faut de bonnes données. Si vous ne disposez pas de données très qualifiées, on finit par avoir du “garbage in, garbage out”. Ce qui est intéressant avec ce livre, c’est qu’il offre aux acteurs de la supply chain un aperçu de ce que font les modèles, du type de leviers dont ils peuvent bénéficier, et cela leur permet de mieux comprendre pourquoi ils doivent désormais prêter attention à toute une série de zones d’ombre dans les supply chains, telles que les promotions. En général, les données sur les promotions sont un véritable chaos. Il en va de même pour les ruptures de stock. Souvent, il n’existe pas de données historiques appropriées pour refléter toutes les ruptures, si bien que l’on ne sait pas si l’absence de ventes est due à une absence de demande ou à un stock épuisé.
Ainsi, être plus familier avec le type de modèle capable d’exploiter les données peut vous rendre plus apte à déterminer si votre processus existant est adéquat. L’objectif principal d’une supply chain est de maintenir le flux de marchandises.
Kieran Chandler: Ainsi, l’objectif principal d’une supply chain est de constituer une base de données historique précise. C’est le premier objectif. Le second objectif est de servir tout le monde, de maintenir la production et d’assurer la satisfaction des clients. Cependant, la réalisation du second objectif n’est souvent pas de la même qualité que celle du premier. Pour accélérer cette transition et obtenir une consolidation des données à grande échelle avec plusieurs sites, nous devons élargir nos horizons. Joannes, pourriez-vous développer ce point?
Joannes Vermorel: Lorsque nous commençons à travailler avec des clients, nous rencontrons souvent le défi de la consolidation des données et de l’exécution. De nombreux clients ignorent que des recettes numériques avancées peuvent être appliquées aux prévisions pour générer de meilleures décisions. La lecture du livre sur la data science peut élargir vos horizons et fournir des éclairages sur la manière d’exécuter la supply chain de façon plus efficace. Cela vous aide à appréhender l’ensemble du processus avant et après la prévision, de la production jusqu’à l’exploitation des prévisions pour des décisions plus intelligentes.
Nicolas Vandeput: Les dirigeants de la supply chain manquent de deux éléments cruciaux pour extraire des informations exploitables de la data science et du machine learning. Le premier est une culture des données, qui fait défaut dans environ 99% des entreprises dans le monde. Beaucoup d’entreprises se contentent encore de bricoler avec des feuilles de calcul désordonnées sans réaliser l’importance de disposer de données appropriées. Ce livre a pour but de montrer qu’avec de bonnes données, vous pouvez atteindre une véritable science, des prévisions précises, et mener des expériences efficaces. Sans données, de nombreux projets sont retardés, comme peuvent le confirmer les journalistes. Le second élément est le manque de talents et de compréhension du machine learning et de la data science dans la gestion de la supply chain. Nous devons changer cette culture et sensibiliser quant à la valeur des données.
Kieran Chandler: Absolument, disposer des bonnes données est crucial. Cela devrait être comme un commandement : “Nettoyez vos données.” Mais comment provoquer ce changement de culture? Comment pouvons-nous évangéliser le marché et souligner l’importance de posséder les bonnes données?
Joannes Vermorel: Eh bien, pour plaisanter, nous pourrions créer une secte où de meilleures données seraient obligatoires, comme un commandement sacré. Mais sérieusement, je pense qu’il faut favoriser la compréhension et la prise de conscience. Nous pouvons éduquer le marché et accorder plus d’importance à la valeur des données propres et précises. Ce faisant, nous pouvons opérer un changement de culture et faire en sorte que disposer des bonnes données devienne une priorité absolue pour la gestion de la supply chain.
Kieran Chandler: Lorsqu’on manque de conscience de ce qui peut être fait avec le deep learning et qu’on n’a aucune expérience dans ce domaine, il est très difficile même d’en percevoir l’intérêt, n’est-ce pas?
Joannes Vermorel: En effet, c’est un défi. Je pense qu’un bon point de départ est de se mettre directement à l’analyse des données sans être complètement submergé par la technicité pure de la tâche. Il ne devrait pas falloir une équipe informatique rien que pour configurer les environnements. Il est très important de comprendre ce qui fait fonctionner ces méthodes, ce qui les rend efficaces. Ce n’est pas de la magie.
Démystifier cela est important. Chez Lokad, nous avons essayé d’évangéliser le marché. L’éducation est une voie d’avenir. Nicolas publie un livre, ce qui est excellent. Nous avons également publié un livre et plusieurs autres ressources, y compris une vaste base de connaissances sur le site de Lokad. Mais oui, en fin de compte, tout repose sur l’éducation.
Ce que je constate, c’est une nouvelle vague de praticiens de la supply chain qui arrivent sur le terrain avec un esprit davantage orienté ingénierie, plus quantitatif. On souhaite disposer de chiffres et d’éléments reproductibles. Le leadership est essentiel dans la supply chain, puisqu’il implique de nombreuses personnes, pays et sites. Mais si vous disposez d’un leadership sans aucune forme d’esprit d’ingénierie ou de rigueur quantitative, il est difficile d’optimiser quoi que ce soit. Dès que l’on commence à utiliser le mot “optimiser”, la règle fondamentale de l’optimisation est que l’on ne peut pas optimiser ce que l’on ne mesure pas. Cela amène à la question : comment mesure-t-on ? Et alors, il vous faut des données.
Kieran Chandler: Nicolas, nous avons beaucoup parlé des avantages d’utiliser ces boîtes à outils open-source. Qu’en est-il de certains inconvénients? Où voyez-vous des aspects négatifs dans l’utilisation de ces outils?
Nicolas Vandeput: Comme nous l’avons évoqué, et je pense que c’est vraiment important, le monde de la supply chain repose sur de nombreuses interactions entre produits, personnes, différentes équipes, etc. Le processus de prévision est très long et implique de nombreux intervenants. Mon livre explique que, pendant les dernières décennies, nous avons utilisé les mêmes techniques. Si l’on regarde en arrière, dans les années 80 et 90, on retrouve le même moteur de prévision qu’aujourd’hui. Donc, rien n’a changé.
Je suggère que nous pouvons modifier cet élément très spécifique, mais bien sûr, ce n’est pas suffisant. L’ensemble du processus doit vivre et évoluer. Utiliser simplement Python ne résoudra pas un processus qui ne fonctionne pas. Cela ne fera qu’améliorer les chiffres issus de la prévision, mais il faut toujours examiner l’ensemble du processus.
Kieran Chandler: Joannes, vous semblez très confiant quant au fait qu’il y aura toujours une place pour Lokad. En regardant vers l’avenir, où voyez-vous concrètement cette place sur le marché?
Joannes Vermorel: Tout d’abord, je crois que même en parlant de prévisions pures, nous avons encore des atouts à jouer pour obtenir de meilleures prévisions. Mais “mieux” est plus compliqué que jamais. C’est une chose de dire que vous avez une prévision meilleure en termes d’erreur absolue moyenne, mais dès que vous entrez dans le monde probabiliste, c’est un autre jeu.
Si vous commencez à dire, “Je veux prévoir la demande, mais pas pour demain, plutôt sur un horizon probabiliste, c’est-à-dire quand mon conteneur arrivera”, alors il s’agit d’une demande qui commence à un moment incertain dans le futur et se termine à un autre moment incertain. Les choses peuvent devenir très compliquées avec davantage de dimensions. Ensuite, si vous commencez à inclure des facteurs comme la probabilité que mon concurrent baisse ses prix, ce qui aurait un impact très spécifique sur la forme de la demande, vous voyez que la précision d’une prévision n’est pas une chose unidimensionnelle. Elle comporte toute une complexité à prendre en compte.
Kieran Chandler: Soudain, vos modèles deviennent complexes, même si vous disposez de très belles boîtes à outils open-source. Assembler le tout de manière à être sans bug, de qualité production et évolutif, il reste encore beaucoup d’autres choses à faire.
Joannes Vermorel: Oui, si nous prenons l’angle de la prévision pure, je pense que c’est une approche. Mais chez Lokad, notre vision est véritablement d’avoir une superposition analytique de bout en bout plus approfondie pour générer des décisions intelligentes pour une supply chain donnée. Nous ne gérons pas des systèmes de supply chain, nous ne sommes pas un ERP. Nous ne souhaitons pas être le dépôt de tous les mouvements de stocks. Nous disposons d’une copie de ces données, mais nous sommes la superposition analytique intelligente.
C’est là la vision. Et encore, même si Lokad était entièrement construit à partir d’outils open-source, il y a toujours de la valeur à rassembler tout cela. Par exemple, les plateformes de cloud computing disponibles de nos jours sont un gigantesque assemblage de composants open-source, mais les gens préfèrent opter pour Amazon parce que vous pouvez le faire vous-même. Vous pourriez avoir votre propre cloud privé, mais cela demande un effort colossal pour réunir le tout, et il y a à un moment donné de la valeur à ce que des spécialistes le fassent pour vous.
Un inconvénient que je remarque au sujet de cet écosystème de Python et de l’open-source de manière très spécifique est qu’il évolue très rapidement. Si vous le faites vous-même, il y a un danger : vous choisissez un type de Python et un ensemble d’outils, et puis deux ans plus tard, quelque chose s’est considérablement amélioré. Tout à coup, vous étiez à la pointe de la technologie et maintenant vous ne l’êtes plus, simplement parce que le monde a continué d’avancer et qu’un laboratoire a produit un nouvel ensemble d’outils.
Par exemple, jusqu’à il y a quelques années, Scikit dominait quasiment tous les domaines, mais maintenant PyTorch remet complètement en question l’ensemble du système en apportant le deep learning et differentiable programming à l’équation. Cela soulève une question : qui est responsable de revisiter ce que vous avez implémenté il y a deux ans et de le rafraîchir avec la tendance du moment ? Un bon fournisseur prendrait soin de s’assurer que votre solution de data science soit régulièrement revisitée et probablement réécrite pour rester à la pointe de la technologie.
Je ne sais pas combien de temps durera cette ère d’or de progrès en data science, mais je ne serais pas surpris si, pour quelque chose comme la prochaine décennie, tous les deux ans nous voyions des progrès fantastiques où la nouvelle tendance est bien meilleure que la précédente. Il pourrait exister des catégories de problèmes qui paraissent très difficiles à résoudre mais deviennent accessibles.
Nicolas Vandeput : Si je puis ajouter quelque chose, je trouve vraiment intéressant que Joannes ait mentionné la complexité à laquelle Lokad est capable de faire face. J’ai travaillé personnellement avec l’équipe de Lokad, donc je sais ce dont ils sont capables. L’un des messages de mon livre, et c’est vraiment important pour moi, est de dire aux gens qu’ils peuvent y parvenir.
Certaines personnes ont peut-être entendu ce que Joannes dit et pensent : “Wow, la data science et le machine learning semblent vraiment complexes, ce n’est peut-être pas pour moi.” Je veux vraiment rassurer les gens en disant : “Non, ce n’est pas si complexe. Vous pouvez commencer avec un modèle simple.” Et en fait, comme le montre le livre, vous pouvez assez facilement débuter avec un modèle très simple qui est en réalité extrêmement performant en l’état. Ensuite, à partir de là, vous pouvez ajouter des couches, peut-être ajuster un peu le système, les données, peut-être introduire un autre modèle, et ainsi de suite.
Donc, vous pouvez vraiment commencer simplement avec quelque chose qui fonctionne déjà très bien, et à partir de là, passer à des problématiques plus complexes. C’est vraiment le message que je souhaite transmettre dans le livre : vous pouvez commencer simplement et ensuite progresser vers plus.
Kieran Chandler : Pouvez-vous nous aider à comprendre comment nous pouvons déterminer si un modèle fonctionne ? Peut-on le tester ? Peut-on le reproduire ? Ces principes semblent s’appliquer aux modèles simples, mais une fois que vous les maîtrisez pour un modèle de base, pouvez-vous aussi les comprendre pour des modèles bien plus complexes ?
Nicolas Vandeput : Absolument, je conseille fortement aux gens de commencer simplement. Une fois que vous maîtrisez les bases, vous pouvez alors passer à quelque chose de bien plus complexe.
Kieran Chandler : Cela m’amène aisément à ma dernière question. Quels sont vos espoirs pour les lecteurs de votre livre et pour l’utilisation des ensembles d’outils open-source à l’avenir ?
Nicolas Vandeput : Ma vision, et en effet mon espoir, est que les gens liront ce livre et gagneront en confiance dans leurs capacités. À la fin du livre, je veux qu’ils puissent se dire : “Oui, je peux vraiment y arriver. Ça n’a pas l’air si complexe.” Peut-être qu’il y a deux semaines, ils ne savaient pas coder, mais à la fin, je veux que cela leur semble très simple. Je veux que ces personnes se mettent à expérimenter par elles-mêmes, qu’elles vivent réellement la data science et qu’elles essaient de nouveaux modèles. J’espère qu’elles deviendront les nouveaux leaders de la gestion de la supply chain. C’est aussi l’un des messages de Lokad. Nous sommes déjà dans un monde quantitatif de supply chain où vous pouvez expérimenter et mettre en place des solutions qui fonctionnent de manière constante. Pour cela, vous avez besoin de data science. Je souhaite donc vraiment que ce livre donne aux gens les moyens de le faire par eux-mêmes.
Kieran Chandler : Nous allons devoir conclure, mais merci pour votre temps aujourd’hui, Nicolas.
Nicolas Vandeput : Merci.
Kieran Chandler : Le livre, “Data Science for Supply Chain Forecast”, est désormais disponible. Assurez-vous de le consulter sur Amazon. Ici chez Lokad TV, nous serons bientôt de retour avec un autre épisode. Mais d’ici là, merci d’avoir regardé.
Joannes Vermorel : Merci.