00:00:04 Rôle du data scientist dans les supply chains.
00:01:33 Comparaison des tendances du data mining et de la data science.
00:03:16 Commercialisation des outils de data science auprès des universités.
00:04:14 Compétences en codage vs. création de valeur business.
00:06:37 La transition de Lokad vers les “supply chain scientists”.
00:08:01 Les responsabilités d’un Supply Chain Scientist.
00:09:50 Les responsabilités communes de l’IT et du Supply Chain Scientist.
00:11:58 Le rôle des Supply Chain Scientists dans l’extraction des données.
00:14:19 Les écueils de s’appuyer sur des boîtes à outils statistiques.
00:16:29 Le rôle croissant des données dans la vie.
Résumé
Kieran Chandler et Joannes Vermorel discutent du rôle critique des data scientists dans la gestion de la supply chain. Leur conversation met en lumière la nécessité pour ces professionnels d’extraire de la valeur des données de l’entreprise, tout en mettant en garde contre la tendance à survaloriser les compétences en programmation et en statistiques. Vermorel souligne l’importance de la connaissance pratique et du sens des affaires, mettant en garde contre l’excès de confiance dans les capacités techniques. Il présente le rôle des “supply chain scientists”, chargés d’extraire et d’interpréter les données pour résoudre des problèmes business, par opposition aux rôles IT centrés sur la maintenance des systèmes. Leur dialogue met en exergue les défis de la formation universitaire, soulignant la rareté des données réelles de supply chain et la dépendance excessive aux langages de programmation et aux cadres statistiques.
Résumé Étendu
La conversation entre Kieran Chandler et Joannes Vermorel se concentre sur le rôle en expansion et l’importance des data scientists dans le domaine commercial, en particulier dans l’industrie de la supply chain. Chandler souligne la demande croissante pour des data scientists, la qualifiant de phénomène qui balaie l’industrie comme une traînée de poudre. Il constate que cette demande, absente il y a cinq ans, évolue si rapidement qu’elle dépasse désormais la capacité des universités à produire suffisamment de diplômés pour occuper ces postes.
Vermorel apporte son point de vue à cette évolution, observant que les entreprises commencent à apprécier la valeur intrinsèque de leurs données et le besoin qui en découle de disposer de personnes capables d’extraire cette valeur. Néanmoins, il attire également l’attention sur le caractère cyclique de cette tendance, la comparant à la frénésie du “data mining” des années 90. Il suppose que l’obsession actuelle pour les data scientists rappelle l’intérêt passé pour les “data miners”, ce qui l’amène à qualifier les data scientists de “data miner version 2”.
Vermorel évoque l’essor puis le déclin des entreprises de data mining dans les années 90, suggérant une leçon à tirer. Il se souvient de l’émergence de centaines d’entreprises proposant des outils de data mining, dont la plupart ont disparu. De nos jours, nous voyons surgir des centaines d’entreprises fournissant des outils de data science, ainsi que des consultants en data science. Ainsi, il y a quelque part une part de vérité, mais aussi un effet de mode cyclique.
Il est intéressant de noter que Vermorel souligne qu’au sein de son entreprise, Lokad, on évite d’utiliser le terme “data scientist”, choisissant plutôt “supply chain scientist”. Cette préférence reflète sa conviction quant à l’importance de comprendre le contexte business et d’aller au-delà des seules compétences mathématiques et en programmation. Il met en garde contre la croyance que la maîtrise des aspects techniques, bien que cruciale, se traduise automatiquement par la création de valeur business dans les supply chains.
De plus, Vermorel évoque la stratégie promotionnelle des actuels fournisseurs d’outils de data science. Il souligne leur marketing agressif auprès des universités, notamment à travers des toolkits open source, qui correspondent à la mentalité générale du milieu académique. Toutefois, il ajoute une note de prudence : réussir à commercialiser un produit dans les universités ne garantit pas que l’outil produira des résultats bénéfiques dans des contextes business concrets.
Vermorel insiste sur la nécessité pour les data scientists de ne pas se contenter d’analyser les données, mais aussi de provoquer de réels changements business grâce à leurs découvertes. Le défi réside dans le fait que, souvent, les data scientists savent analyser et présenter des résultats, mais rencontrent des difficultés lorsqu’il s’agit de mettre en œuvre ces modifications, susceptibles de perturber le statu quo. Il ne s’agit pas seulement de désaccords sur les décisions opérationnelles, mais de la question plus large de savoir si le data scientist est réellement habilité à agir et à apporter de la valeur business.
De plus, la discussion aborde le rôle d’un “supply chain scientist”, terme utilisé chez Lokad. Le rôle d’un supply chain scientist, selon Vermorel, consiste à générer des décisions concrètes et actionnables, par exemple déterminer la quantité à commander immédiatement. Ces décisions doivent être réalisables, pratiques et profitables. Contrairement à un data scientist, un supply chain scientist assume la responsabilité de la valeur business de ses propositions. Cela requiert une compréhension des systèmes d’entreprise et de l’interaction entre les données, les logiciels et les personnes qui les exploitent, garantissant ainsi une compréhension globale du problème à résoudre.
La mission d’un supply chain scientist consiste à comprendre les données extraites, à construire un modèle d’optimisation et à trouver l’équilibre entre complexité et précision. Vermorel reconnaît la complexité du monde réel, notamment dans les supply chains, ce qui rend une modélisation mathématique parfaite impraticable. Ainsi, les supply chain scientists doivent recourir à des approximations et à des heuristiques pour résoudre efficacement les problèmes. Ils doivent adopter une vision d’ensemble et s’y tenir.
Chandler aborde ensuite le rôle des départements IT, se demandant s’ils ne devraient pas assumer la responsabilité des logiciels et des personnes, étant donné qu’ils implémentent et maintiennent généralement les systèmes logiciels.
Cette question laisse entrevoir une tension entre les rôles opérationnels, techniques et stratégiques au sein d’une organisation.
La conversation explore principalement les responsabilités distinctes entre l’Information Technology (IT) et les supply chain scientists, ainsi que les défis que rencontrent les data scientists dans le contexte actuel.
Vermorel soutient que l’IT et les supply chain scientists occupent des responsabilités distinctes au sein d’une organisation. Il assimile le rôle de l’IT à celui de la maintenance, garantissant le fonctionnement constant et fluide des systèmes et des processus. La responsabilité de l’IT est de veiller au bon fonctionnement en continu, en gérant les aspects techniques liés à la préservation de la disponibilité et de la sécurité des systèmes.
À l’inverse, le rôle d’un supply chain scientist, selon Vermorel, ne consiste pas à faire de la maintenance. Leur mission consiste plutôt en l’extraction de données et l’interprétation. Ils doivent s’assurer que les données utilisées fournissent une compréhension correcte des situations business et que les solutions élaborées permettent d’obtenir des résultats profitables. Ils n’ont pas à gérer les aspects techniques, car leur objectif principal est de résoudre des problèmes business en interprétant précisément les données.
Chandler oriente la conversation vers la pénurie apparente de compétences en extraction et préparation des données chez les data scientists, bien que ces compétences soient essentielles à leur métier. Vermorel s’accorde, notant que les cursus universitaires et les boot camps se concentrent en grande partie sur des langages de programmation comme Python et R, négligeant souvent les aspects plus pratiques du métier.
Vermorel précise que les universités sont mieux à même d’enseigner certains aspects en raison des questions d’accessibilité et de confidentialité. Les données de supply chain des grandes entreprises ne sont pas facilement accessibles pour la formation, en raison des enjeux de confidentialité, tandis que les logiciels open source et les cadres statistiques sont plus disponibles. En conséquence, les étudiants acquièrent souvent une solide compréhension de la programmation et des outils statistiques, mais manquent de connaissances pratiques pour traiter des données réelles de supply chain.
Vermorel avertit que cette survalorisation de la programmation et des statistiques pourrait conduire à un excès de confiance chez les nouveaux data scientists. Ils pourraient croire à tort que ces compétences à elles seules suffisent pour résoudre les problèmes de supply chain. Toutefois, la gestion de la supply chain ne se limite pas à la programmation ou à l’analyse statistique ; il s’agit de comprendre et de donner un sens business aux données. Vermorel met en garde contre l’ignorance de la sagesse des praticiens low-tech de la supply chain, qui tendent à se fier au bon sens et à des outils simples, comme des tableaux Excel, pour prendre des décisions business.
Transcription Complète
Kieran Chandler: Aujourd’hui, nous allons parler d’un nouveau métier qui balaie l’industrie comme une traînée de poudre. Le rôle d’un data scientist devient de plus en plus pertinent à une époque où les entreprises accordent plus d’importance aux données et en tirent des conclusions pertinentes. Il y a cinq ans, aucun directeur de supply chain n’avait besoin de data scientists. Cependant, aujourd’hui, tout a changé, les opportunités d’emploi pour les data scientists semblant croître plus rapidement que les universités ne peuvent en former. Alors, Joannes, qu’est-ce qui a changé ? Pourquoi ce besoin soudain de plus de data scientists ?
Joannes Vermorel: Clairement, les entreprises reconnaissent que leurs données ont beaucoup de valeur. Dès qu’elles le constatent, elles ont besoin de nombreuses personnes pour en extraire cette valeur, et c’est ce que font les data scientists. Cependant, l’aspect intéressant est que ce n’est pas entièrement nouveau. Pour ceux qui étaient présents dans les années 90, ou peut-être vers la fin des années 90, à l’époque, on utilisait un autre nom – data miners. On extrayait des informations des données. Ainsi, en gros, le data scientist semble être la version 2 du data miner, ou quelque chose de similaire.
Kieran Chandler: Si ces data miners ne sont plus d’actualité aujourd’hui, j’imagine que les résultats n’ont pas été probants. Pourriez-vous nous en dire un peu plus à ce sujet et y a-t-il quelque chose à apprendre de leurs échecs ?
Joannes Vermorel: C’est très intéressant car on peut voir que, dans les cercles de la supply chain, les data scientists sont devenus très en vogue. Il me semble qu’il existe une tendance macrocyclique, où les choses vont et viennent. Il y a deux décennies, il s’agissait de data mining et, de nos jours, c’est la data science. C’est le même schéma, seulement sous un nom différent. Il y a deux décennies, nous avons assisté à l’émergence de centaines d’entreprises proposant des outils de data mining, dont la plupart ont disparu. De nos jours, nous voyons surgir des centaines d’entreprises fournissant des outils de data science. Nous voyons également des consultants en data science. Ainsi, il y a quelque part une part de vérité, mais aussi un effet de mode cyclique.
Kieran Chandler: On n’entend pas tous les jours les mots data science et mode dans la même phrase. Ce que nous disons ici, c’est que les data miners portaient autrefois un nom différent. Alors, ne devrions-nous pas commencer à vendre la technologie de Lokad aux universités afin que la prochaine génération de data scientists, quel que soit leur nom, soit formée de manière complète à l’outil et comprenne parfaitement comment l’utiliser ?
Joannes Vermorel: C’est certainement une voie à explorer. D’ailleurs, toutes les entreprises qui poussent les outils de data science se positionnent agressivement sur le marché des universités. Un moyen facile de le faire est de promouvoir des toolkits open source, car ils correspondent à la mentalité générale des universités. Toutefois, il s’agit avant tout d’un outil marketing. C’est bien dans un sens, mais cela ne signifie pas nécessairement l’efficacité. Ce n’est pas parce que vous devenez un grand mathématicien ou un excellent programmeur que cela se traduira immédiatement par la création de valeur business au sein de vos supply chains. C’est un danger, selon moi, et c’est l’une des raisons principales pour lesquelles, chez Lokad, nous préférons le terme “supply chain scientist”.
Kieran Chandler: L’approche business-first a du sens pour bon nombre de praticiens de la supply chain, car ils sont très exposés au côté business dans leur travail quotidien. Peut-être que la seule exception se trouve dans les très grandes entreprises où les data scientists peuvent être submergés par le volume de données ou la complexité de leurs problèmes. Mais, y a-t-il un piège au-delà de se concentrer sur
un problème business particulier ?
Et réduire les délais d’approvisionnement et ce type de choses. Alors, y a-t-il un piège au-delà de se concentrer sur le bon problème business ?
Joannes Vermorel: Oui, il y a en effet un gros piège. Le rôle d’un data scientist ne se limite pas à analyser le business ; il consiste à faire une différence et à être capable de prendre et de mettre en œuvre une décision, ce qui peut avoir un impact réel sur l’organisation. Cela peut être délicat, car les data scientists ont facilement accès aux données et produisent des analyses. Mais lorsqu’il s’agit d’agir, cela remet souvent en cause le statu quo. Il ne s’agit pas seulement de désaccords sur les quantités commandées, mais de divergences plus profondes. Le risque majeur d’échec se situe lorsque le data scientist n’est pas réellement en position d’agir et d’apporter de la valeur business. C’est probablement le principal piège que je puisse voir.
Kieran Chandler: Vous avez mentionné qu’il existe une sorte de résistance au statu quo. Je peux certainement éprouver une grande sympathie pour certains praticiens de la supply chain, car ils travaillent avec des méthodes qui ont fait leurs preuves depuis des décennies. Donc, si quelqu’un remet en question ce qui a fonctionné et ce qui fonctionne, je comprends pourquoi ils abordent les choses avec beaucoup de scepticisme. Vous avez mentionné qu’à Lokad, nous avons des supply chain scientists plutôt que des data scientists. Pourriez-vous nous en dire un peu plus à leur sujet et expliquer pourquoi ils portent un nom différent ?
Joannes Vermorel: Je pense que ce nom différent reflète notre approche des problèmes. Notre engagement est envers la supply chain. Un supply chain scientist est quelqu’un qui doit générer des décisions concrètes et actionnables, par exemple déterminer combien il faut commander immédiatement. Ces décisions doivent être réalisables, pratiques et profitables. Il s’agit de quelqu’un qui assume la responsabilité de la valeur business de ses propositions. Cette prise de responsabilité implique en réalité beaucoup de choses.
Pour contextualiser, revenons en arrière. La décision est le but final, mais si l’on part de la fin, cela commence par les données. Les données proviennent des systèmes d’entreprise, mais elles n’ont de sens qu’à travers le regard des personnes qui exploitent le logiciel. Ce n’est donc pas seulement un logiciel ; c’est un logiciel avec des personnes. Le supply chain scientist doit avoir une très bonne compréhension de cela. Il doit saisir le problème à résoudre, donner du sens aux données extraites, puis construire un modèle d’optimisation d’une certaine manière.
Il existe un compromis entre complexité et précision. Le monde réel est incroyablement complexe, et les supply chains ne font pas exception. Il n’est pas possible d’obtenir une modélisation mathématique parfaite, donc il faut approximer et utiliser des heuristiques, qui ne sont que des recettes qui fonctionnent. Le supply chain scientist doit rassembler tous ces éléments pour garantir des économies réelles, non seulement en pourcentages mais en dollars effectifs. Il doit s’engager dans cette vision globale. C’est de cela qu’il s’agit pour un supply chain scientist.
Kieran Chandler: D’accord, mais vous avez mentionné qu’un supply chain scientist devrait être responsable du logiciel et des personnes. Qu’en est-il des départements IT ? Ne devraient-ils pas être responsables de cela ? Après tout, ce sont eux qui ont mis en place le logiciel et, souvent, ce sont eux qui l’ont développé.
On dirait qu’une quantité considérable de responsabilités repose sur les épaules d’un seul supply chain scientist. Attendez-vous à un miracle ?
Joannes Vermorel: Oui, la responsabilité est assez énorme. Cependant, il y a une différence significative. Je pense que la responsabilité principale de l’IT est de s’assurer que le système est opérationnel. L’IT doit gérer les opérations courantes et veiller à ce que tout fonctionne à chaque instant. Le supply chain scientist a une responsabilité différente. Cette personne n’est pas chargée de maintenir le tout en marche.
Kieran Chandler: Alors, quelle est exactement la responsabilité d’un supply chain scientist ?
Joannes Vermorel: La responsabilité d’un supply chain scientist est d’extraire des données et d’en donner du sens. C’est une tâche très différente. Cette personne n’a pas à gérer toutes les subtilités techniques liées au maintien en marche et à la sécurisation du système. Cela relève de la responsabilité de l’IT, qui est en effet très difficile. L’engagement du supply chain scientist consiste à s’assurer que la compréhension est correcte. La solution d’affaires qui découle de cette compréhension doit être rentable en identifiant précisément un problème que l’entreprise doit véritablement résoudre.
Kieran Chandler: Il semblerait que l’extraction et la préparation des données soient des tâches critiques. Cependant, les data scientists ne sont-ils pas insuffisamment formés dans ces aspects ? La plupart des cours de data science et boot camps concernent la programmation dans des langages comme Python et R.
Joannes Vermorel: C’est une excellente question. Les universités excellent dans certains domaines et sont faibles dans d’autres. Soyons réalistes : donner du sens aux données nécessite d’abord des données réelles. La plupart des grandes entreprises avec des supply chains importantes ne partagent pas leurs données avec les universités. Par conséquent, les universités utilisent comme matériel pédagogique ce à quoi elles ont accès. L’accès aux logiciels open-source est bien plus aisé que l’accès aux données confidentielles de supply chain.
Kieran Chandler: Il y a beaucoup de discussions sur les données personnelles, vous savez, similaires au RGPD en Europe. Cela exige des efforts importants de la part de chacun pour se conformer. C’est donc incidentel, mais cela complique la situation. Les universités, par exemple, veulent former les gens aux tâches les plus difficiles, là où ils pourront apporter le plus de valeur, mais c’est difficile. Il est donc beaucoup plus simple pour les universités de s’appuyer sur des langages de programmation et des cadres statistiques, car ils sont plus accessibles, plus mathématiques. Il est également plus facile de tester les étudiants sur ces sujets, ce que, en tant que professeur, vous devez à la fois enseigner et évaluer. Cela exige d’enseigner quelque chose pour lequel l’évaluation est possible. C’est une contrainte étrange, mais cela influence certainement ce que l’on peut enseigner à l’université.
Joannes Vermorel: Maintenant, le principal problème que je vois avec cet accent mis sur les outils statistiques, c’est qu’il peut mener à un excès de confiance. Il est bénéfique de savoir programmer, d’être à l’aise avec les statistiques. C’est certainement quelque chose d’utile, ce n’est pas négatif. Mais cela comporte un problème subtil. Cela peut rendre les gens trop confiants, leur faisant croire que savoir programmer, comprendre les statistiques, comprendre les mathématiques, est la clé pour résoudre les problèmes de supply chain.
Et ici, il y a une certaine sagesse chez de nombreux praticiens de supply chain qui sont souvent très basiques sur le plan technologique. Ils essaient de s’en tenir au bon sens, ils se contentent de leur feuille Excel. Et il y a de la sagesse là-dedans, car ils s’en tiennent à ce qui a du sens pour l’entreprise. Si la seule raison pour laquelle vous vous en tenez au bon sens est que vous manquez de connaissances en statistiques et en programmation, ce n’est pas idéal. Mais, en revanche, si tout ce que vous savez, c’est les statistiques et la programmation, cela ne fait pas de vous un expert en supply chain.
Ce n’est pas parce que vous maîtrisez ces domaines que cela se traduit automatiquement par des solutions qui généreront des euros ou des dollars supplémentaires. Je pense donc que c’est le plus grand danger. Nous produisons désormais des armées de personnes qui souffrent fréquemment d’un excès de confiance. La programmation est un moyen, pas une fin.
Kieran Chandler: C’est une perspective perspicace. Merci d’avoir apporté des éclaircissements sur le sujet des data scientists et, en effet, des supply chain scientists. C’est un sujet qui devient de plus en plus pertinent compte tenu de l’énorme quantité de données collectées dans notre vie quotidienne. Merci d’avoir pris le temps aujourd’hui.
Joannes Vermorel: Merci, Kieran.
Kieran Chandler: Et merci à nos auditeurs de s’être connectés à l’épisode d’aujourd’hui. Nous reviendrons très bientôt avec un autre. D’ici là, continuez de poser vos questions et de nous envoyer vos réflexions. Merci beaucoup de nous avoir suivis, et nous vous retrouverons très bientôt. Au revoir pour l’instant.