00:00:06 L’importance des données pour les projets d’optimisation et la démystification des mythes sur les données.
00:01:50 La collecte accidentelle des données et les défis liés à l’utilisation de données provenant de systèmes différents.
00:03:39 Les limites des séries temporelles et l’importance de la granularité transactionnelle.
00:06:18 La nécessité de données meilleures et plus pertinentes pour la prévision.
00:07:26 Exemple pratique : optimisation de stocks dans une chaîne de distribution et l’importance des données transactionnelles.
00:10:01 Le rôle des couches transactionnelles et du stockage des données dans la collecte de données historiques.
00:11:38 Les transitions de systèmes ERP et la nécessité d’améliorer les processus de prévision.
00:13:37 Les inconvénients du nettoyage des données et l’importance d’avoir des données couvrant tout le spectre.
00:15:20 L’utilisation des systèmes informatiques pour les opérations de supply chain et la précision des données.
00:17:31 L’importance de prendre en compte les niveaux de stocks et les retours dans la prévision.
00:19:24 Adapter l’approche de prévision en fonction d’une perspective spécifique au secteur.
00:21:46 Comprendre l’importance de meilleures données et élargir l’horizon des données pertinentes.
00:24:48 Avoir une compréhension claire de la génération des données et obtenir de meilleures prévisions.

Résumé

Kieran Chandler interviewe Joannes Vermorel, fondateur de Lokad, au sujet de l’importance de la collecte des données dans supply chain optimization. Vermorel suggère que les entreprises collectent souvent des données de manière accidentelle plutôt qu’intentionnelle à des fins d’optimisation, mais ces données peuvent tout de même être utiles pour les processus de prévision et d’optimisation. Il insiste sur l’importance des données granulaires, car regrouper les données en séries temporelles peut entraîner la perte d’informations précieuses. Vermorel conseille aux entreprises de travailler avec les données transactionnelles brutes et d’aborder leurs problèmes de supply chain avec une perspective spécifique au domaine. La conversation aborde également l’importance de prendre en compte des facteurs tels que la tarification, les retours, backorders et les mouvements de stocks dans les processus de prévision.

Résumé Étendu

Dans cette interview, Kieran Chandler, l’animateur, discute avec Joannes Vermorel, le fondateur de Lokad, de l’importance de la collecte des données et de son rôle dans la supply chain optimization. Ils abordent le mythe selon lequel les données doivent être parfaites pour que les machines puissent les exploiter et explorent comment les entreprises peuvent améliorer leurs processus de collecte de données.

Vermorel souligne que la plupart des entreprises collectent des données par accident, en tant que sous-produit de leurs systèmes transactionnels, plutôt qu’intentionnellement à des fins d’optimisation. Des systèmes tels que les ERP et les dispositifs de point de vente ont été initialement conçus pour simplifier les opérations banales, et non pour collecter un historique transactionnel complet. Cette collecte accidentelle de données peut néanmoins servir de base aux processus de prévision et d’optimisation.

Chandler se demande s’il existe des trésors de données inexploitées au sein des entreprises. Vermorel explique que les données générées par les systèmes d’entreprise sont souvent complexes et difficiles à interpréter, car elles reflètent davantage le fonctionnement interne du système informatique que la réalité du processus. Lorsque les entreprises tentent de mettre en place des processus de prévision, elles extraient souvent une version simplifiée de ces données, comme des ventes quotidiennes ou hebdomadaires. Cette simplification peut toutefois entraîner la perte d’informations critiques sur l’activité et ses opérations.

La granularité des données est une préoccupation majeure, car les données agrégées peuvent ne pas fournir suffisamment d’informations pour une prévision et une optimisation efficaces. Vermorel soutient que lorsque les entreprises transforment leurs données brutes en versions simplifiées, elles perdent une quantité massive d’informations qui pourraient être précieuses pour la supply chain optimization.

L’interview aborde l’importance de la collecte des données dans la supply chain optimization et met en lumière les défis auxquels les entreprises sont confrontées pour exploiter les données qu’elles collectent, souvent par accident. La conversation souligne que des données parfaites ne sont pas une condition préalable à une prévision et une optimisation efficaces, tout en reconnaissant qu’il existe une marge significative d’amélioration dans la manière dont les entreprises collectent, traitent et analysent leurs données.

Ils discutent des défis et de l’importance de travailler avec des données granulaires pour mieux optimiser la supply chain des processus.

Vermorel explique que de nombreuses entreprises agrègent leurs données en séries temporelles, ce qui simplifie les données en un seul chiffre par jour. Bien que cette méthode soit facile à manipuler, elle peut ne pas être pertinente ou utile pour prendre des décisions commerciales éclairées. Il affirme que de meilleures prévisions et la supply chain optimization peuvent être obtenues en travaillant avec des données au niveau transactionnel, car cela fournit plus de contexte et de perspicacité sur les opérations réelles de l’entreprise.

L’interview met en lumière certains écueils liés à l’utilisation de données agrégées, car elles peuvent être trompeuses et amener les entreprises à passer à côté d’scénarios. Par exemple, dans un scénario de chaîne de distribution, Vermorel explique comment l’agrégation des données peut conduire à une mauvaise interprétation de la demande au niveau des centres de distribution. En traitant les données sous forme de séries temporelles, les entreprises éliminent l’ambiguïté, ce qui peut être à la fois avantageux et désavantageux, car elles pourraient par inadvertance faire des hypothèses incorrectes sur leurs opérations.

La conversation aborde également les données historiques et comment de nombreuses entreprises perdent des informations précieuses lors de la transition entre différents systèmes ERP. Par le passé, la préservation des données n’était pas une priorité, car l’objectif des systèmes ERP était d’aider les entreprises à fonctionner plus efficacement. De plus, le stockage des données était autrefois coûteux, ce qui avait conduit à la mise en œuvre d’heuristiques permettant de se débarrasser des données de diverses manières. Cependant, de nos jours, le stockage des données est relativement bon marché, rendant leur préservation plus réalisable.

Vermorel souligne que lorsqu’il collabore avec des entreprises, ils constatent souvent que les processus de prévision existants ne constituent pas un point de départ adapté pour la supply chain optimization. Cela s’explique par le fait qu’une grande partie des informations pertinentes a été perdue à cause de la projection crud des données transactionnelles en séries temporelles. Il suggère plutôt que les entreprises se concentrent sur l’utilisation des données transactionnelles brutes pour optimiser leurs processus de supply chain.

Enfin, l’interview aborde le sujet du nettoyage des données. Vermorel affirme que les données transactionnelles brutes sont déjà suffisamment propres pour leurs besoins, et que le concept de “data cleansing” se réfère souvent à la simplification excessive des données en séries temporelles, ce qui peut ne pas être utile pour comprendre la véritable nature des opérations d’une entreprise.

Vermorel commence par expliquer que si les entreprises se contentent d’examiner leurs données de manière limitée, en ne considérant que certaines nuances de vert, leur compréhension du monde sera restreinte. Il souligne que les données doivent être perçues dans toute leur palette de couleurs pour obtenir une image plus précise. Il précise également que les données ne sont pas intrinsèquement incorrectes, mais qu’elles reflètent les processus de l’entreprise. Les entreprises doivent reconnaître leurs données pour ce qu’elles sont et les utiliser pour réaliser de meilleures prévisions.

Vermorel enchaîne en expliquant que les entreprises devraient reconnaître que leurs systèmes n’ont pas été initialement conçus pour produire des données mais pour faire fonctionner la supply chain. Le fait que les entreprises disposent de factures, de paiements et d’autres documents prouve que leurs données sont en grande partie correctes. Cependant, en matière de prévision, les entreprises omettent souvent des facteurs cruciaux tels que la tarification, les retours et les niveaux de stocks.

La tarification a un impact significatif sur la demande et la supply chain. Lorsque les entreprises examinent leurs processus de prévision, elles constatent généralement que la tarification est absente. Ce n’est là que la partie émergée de l’iceberg, car des facteurs tels que les retours et les niveaux de stocks sont également souvent absents. Vermorel explique qu’il est essentiel de comprendre les niveaux de stocks, car sans stock, il n’y aura pas de ventes. De même, les backorders représentent un type de demande unique qui ne doit pas être traité de la même manière que la demande régulière.

Vermorel conseille aux entreprises d’aborder leurs problèmes de supply chain avec une perspective spécifique au domaine. Elles devraient considérer quels facteurs sont les plus pertinents pour leur secteur et se concentrer sur ceux-ci. Par exemple, dans l’aérospatial, l’objectif pourrait être de minimiser les incidents d’avions au sol (AOG) en optimisant les investissements, tandis que dans le commerce de détail de produits frais, l’accent devrait être mis sur la maximisation de la loyauté client à long terme en garantissant la disponibilité et la fraîcheur des produits.

Au lieu de se concentrer sur la perfection et l’agrégation des données historiques, Vermorel suggère d’élargir les horizons des données pertinentes en prenant en compte des aspects banals tels que les prix, les retours, les backorders et les mouvements de stocks. Il souligne l’importance de comprendre comment les données sont générées pour éviter des situations de “garbage in, garbage out”. Vermorel soutient également que de meilleures prévisions devraient être mesurées en dollars et liées à une meilleure prise de décision, plutôt que de se fier aux métriques basées sur des pourcentages.

Transcription Complète

Kieran Chandler: Aujourd’hui, nous allons discuter de ce qu’une entreprise qui collecte déjà des données peut faire pour s’améliorer et démystifier le mythe selon lequel les données doivent être parfaites pour que les machines puissent les exploiter. Alors Joannes, si une entreprise collecte déjà des données, y a-t-il vraiment beaucoup plus qu’elle puisse faire ?

Joannes Vermorel: Oui, la première chose à comprendre est que la plupart des entreprises collectent des données de manière complètement accidentelle. Ce n’était jamais l’intention de collecter des données ; l’objectif était simplement de faire fonctionner l’entreprise. Par exemple, un ERP n’est pas conçu pour collecter des données, il est conçu pour que toutes les opérations banales qui se déroulent en permanence dans l’entreprise puissent s’effectuer avec le soutien d’un système informatique centralisé. Tout comme lorsque vous êtes au point de vente dans un magasin, la caisse enregistreuse électronique est là simplement pour accélérer le paiement. Le système n’a pas été réellement conçu ni mis en place dans le but de collecter un historique transactionnel complet de tous les reçus. Étant donné que ces systèmes collectent des données depuis des lustres, les entreprises se retrouvent avec une grande quantité de données, mais elles ne sont pas naturellement conçues pour l’optimisation. Il y a donc beaucoup de données en circulation, et généralement, au cours des dernières décennies, un processus de prévision ou d’optimisation finit par émerger à partir de cela. Mais cela ne signifie pas qu’il n’y a pas une marge de manœuvre énorme pour l’amélioration.

Kieran Chandler: Si les entreprises n’avaient pas l’intention de collecter des données lorsqu’elles ont commencé, cela signifie-t-il qu’il existe tout un trésor de données simplement stockées quelque part et qui n’ont pas vraiment été exploitées ?

Joannes Vermorel: Le problème, c’est que les données ne sont généralement pas collectées de manière intentionnelle. Elles sont simplement un artefact, un sous-produit de vos systèmes transactionnels. Elles ne sont pas exactement chaotiques ; c’est juste que, lorsqu’on examine les données telles qu’elles sont générées dans les systèmes d’entreprise typiques, elles apparaissent très étrangères. Elles ne reproduisent pas le monde réel ; elles reflètent habituellement davantage l’arrière-plan du système informatique que la réalité du processus. Par conséquent, lorsque les personnes dans une grande organisation lancent un nouveau processus, disons un processus ERP, et qu’elles veulent mettre en place une forme de prévision, elles se retrouvent avec des données très étranges et étrangères, comportant de nombreuses complexités accidentelles qui n’ont rien à voir avec le défi de la prévision. Typiquement, ce que font les entreprises, c’est extraire une version très simplifiée de ces données, de sorte qu’elles se retrouvent avec des ventes quotidiennes ou hebdomadaires, puis elles construisent leurs prévisions sur cette base. C’est là que se posent toute une série de problèmes : le fait que, une fois extraites sous forme de ventes quotidiennes ou hebdomadaires, ces données perdent beaucoup d’informations très critiques sur ce qui se passe dans l’entreprise.

Kieran Chandler: Mais quelle doit être la granularité de ces données ? Parce que si nous considérons une entreprise qui collecte des données depuis une vingtaine d’années, l’agrégation de ces données ne rend-elle pas les choses beaucoup plus gérables ? Par gérer, je veux dire que, quand vous agrégerez les données, vous les reformatez généralement de manière à ce qu’elles s’intègrent bien dans quelque chose qui fonctionne typiquement avec des séries temporelles. Et oui, les séries temporelles, c’est super pratique, vous savez, un nombre par jour, c’est aussi simple que cela. Vous obtenez une série, un nombre par jour, et ensuite vous voulez l’extrapoler dans le futur. C’est très simple. Il existe de nombreux modèles très performants qui peuvent fonctionner sur ce type de données, à partir de moyennes mobiles, nous pouvons avoir quelque chose d’un peu plus sophistiqué. Mais le problème, c’est que ce n’est pas parce que c’est facile que c’est réellement pertinent. Et c’est là le problème : il est très facile de le faire de cette manière, mais cela ne signifie pas que ce soit réellement pertinent pour l’entreprise.

Joannes Vermorel: Voilà le danger. Le problème, c’est que les gens pensent : “Oh, j’ai besoin de données plus désagrégées, donc je dois passer de données mensuelles à hebdomadaires ou de hebdomadaires à quotidiennes.” Ce n’est qu’un changement de l’intervalle d’agrégation. Ils diraient : “Oh, si nous le faisions mieux, nous passerions aux données horaires.” Ce n’est absolument pas là le problème. Le problème, c’est que lorsque vous pensez aux séries temporelles, vous encadrez déjà le problème d’une manière complètement différente de la façon dont les données existent réellement dans vos systèmes. Dans vos systèmes, il n’existe pas de séries temporelles. Ce qui importe, c’est d’avoir des données à la granularité des transactions car elles peuvent vous en révéler bien plus. Si vous voulez de meilleures prévisions avec de meilleures données, cela signifie, selon notre expérience, se rapprocher autant que possible de la manière dont les choses existent réellement dans votre système informatique, plutôt que d’avoir une version trop simplifiée dans laquelle toutes les informations pertinentes ont déjà été perdues.

Kieran Chandler: Donc les informations pertinentes se perdent, et en gros, les données que vous examinez pourraient être légèrement trompeuses. Quels sont les types de scénarios que vous pourriez manquer ?

Joannes Vermorel: Habituellement, ce sont des choses si banales que les gens les oublient même. Par exemple, prenons une chaîne de distribution de détail, comme l’alimentation. Imaginez que vous disposez d’une série de centres de distribution, et que chaque centre de distribution dessert, je ne sais pas, 20 supermarchés ou quelque chose comme cela. À quoi cela ressemble-t-il, vous savez, ce genre de choses ? Vous adoptez la démarche d’optimiser, disons, les stocks dans le centre de distribution. Ainsi, ce qui se passe, c’est que chaque jour, les magasins passent des commandes auprès du centre de distribution. Et lorsque vous commandez, je ne sais pas, 100 unités de quelque chose pour le supermarché, deux choses peuvent se produire au centre de distribution : soit ils honorent la commande, c’est-à-dire qu’ils expédient 100 unités généralement le lendemain, soit ils ne l’honorent pas. Donc, le magasin passe une commande de 100 unités et ensuite le centre de distribution n’envoie rien. Puis, le lendemain, le même magasin passe une autre commande de 150 unités.

Maintenant, la question est la suivante : si vous voulez prendre en compte la demande au niveau du centre de distribution pour ces deux jours, quelle est la demande ? Est-ce 100 unités plus 150 unités ? Mais cela semble erroné, parce que, voyez-vous, la raison pour laquelle le magasin passe une commande de 150 unités le deuxième jour est que la commande du jour précédent pour 100 unités n’a pas été honorée. En fait, ils devaient couvrir à la fois la demande du jour non honoré et celle du jour suivant. Vous finissez donc par commander davantage, mais c’est une erreur de penser que la demande est de 250 unités. Peut-être que la demande totale devrait en fait être de seulement 150 unités, car il faudrait complètement éliminer les 100 unités initiales. Mais la réalité peut être complexe.

Kieran Chandler: Commencez à produire des séries temporelles, vous savez, ces informations se perdent et toute l’ambiguïté qui existe, parce qu’il y a beaucoup d’ambiguïtés. Toutes ces ambiguïtés sont éliminées, et on pourrait dire que c’est une bonne chose. Soudainement, je peux faire travailler mes data scientists sur des données non ambiguës. Mais oui et non, car en supprimant l’ambiguïté, le problème est que vous avez déjà affirmé la manière dont fonctionne votre entreprise, et cette affirmation peut être totalement erronée.

Joannes Vermorel: L’une des raisons pour lesquelles les entreprises agrègent leurs anciennes données est qu’elles pourraient être en train de passer d’un système ERP à quelque chose de plus récent. Alors, est-il vraiment utile de réimporter toutes ces informations historiques dans le nouveau système ERP ? À l’origine, lorsque nous parlions de ce que nous appelons aujourd’hui les “yuppies”, ces couches transactionnelles de systèmes qui ne gèrent que les opérations de routine, leur objectif n’était pas de collecter des données historiques. Au début, disons à la fin des années 70 ou dans les années 80, conserver les données n’était pas le but, c’était simplement pour permettre à l’entreprise de fonctionner plus harmonieusement.

En raison du fait qu’à l’époque le computing hardware était très cher, comparé à aujourd’hui, et surtout que le stockage de données était également très coûteux, de nombreux software vendors ont fait ce qu’il fallait à l’époque. Ils ont mis en place des outils heuristiques pour se débarrasser des données de diverses manières. Je ne parle pas de nos jours, je veux dire que la plupart de ces heuristiques ou de ces systèmes n’ont tout simplement plus aucun sens, simplement parce que le stockage de données est désormais super bon marché.

Kieran Chandler: Alors, est-ce que ces entreprises devraient effectuer une sorte de nettoyage de données quelque part ? Ou dites-vous qu’elles devraient simplement prendre les données brutes et les laisser telles quelles ?

Joannes Vermorel: Les données sont déjà propres. Le problème, c’est que lorsque l’on parle de nettoyage de données, que cela signifie-t-il ? Si je vous dis que le problème est que vous voulez obtenir une image bonne et précise du monde, et que, pour une raison quelconque, vous décidez que la manière dont vous regardez le monde se limite à observer les choses dans une certaine nuance de vert. Ainsi, vous obtenez une image qui comporte uniquement des nuances de vert, et tout ce qui n’est pas vert sera simplement affiché en noir. Vous ne le verrez pas du tout. Ensuite, pour les éléments qui sont plus ou moins verts, vous n’obtiendrez que des nuances de vert, et voilà votre vision du monde.

Évidemment, vous diriez, “Je pense qu’il faut faire un peu de nettoyage de données ; cette image n’est pas très précise. Il faudrait peut-être l’améliorer.” Mais il vous faut un spectre complet de couleurs. Le problème n’est pas la nuance de vert ; il n’y a pas de nettoyage à faire. Votre image est ce qu’elle est. Le problème est simplement que, si vous voulez une meilleure représentation du monde, il vous faut l’intégralité du spectre des couleurs.

Kieran Chandler: Par conséquent, pour une meilleure prévision, la première chose à faire est de commencer à regarder l’entreprise telle qu’elle est. Les données ne sont pas incorrectes, elles sont simplement là où elles se trouvent, vous savez. Ce que je dis, c’est que produire des données n’a jamais été le premier objectif de l’ensemble de vos systèmes. Vos systèmes ont été mis en place pour que la supply chain puisse fonctionner, pour qu’il soit possible de produire, déplacer des choses et les vendre. Ainsi, toutes les couches dont vous disposez ne sont qu’un reflet de l’ensemble de ces processus, ce qui est tout à fait acceptable. Le fait que cela fonctionne et que vous ayez des éléments comme des factures, des paiements, etc., prouve que ces données sont en grande partie correctes. Elles ne seraient pas très correctes, sinon vous ne sauriez pas quoi facturer, vous ne sauriez pas combien payer vos fournisseurs, et ainsi de suite.

Donc, je pense qu’habituellement, pour la plupart des entreprises de nos jours, du moins pour celles qui utilisent des systèmes informatiques depuis des décennies, que ce soit en Europe, en Amérique du Nord et, en fait, dans la majeure partie de l’Asie à l’heure actuelle, tout est en place, c’est déjà solide. Le problème, c’est que lorsque vous abordez les prévisions de manière simpliste, il ne s’agit pas seulement des ventes. Cela peut concerner les retours, ou encore, par exemple, l’une des choses les plus basiques auxquelles les gens pensent : comment pouvons-nous améliorer nos prévisions ?

Joannes Vermorel: Habituellement, lorsque nous commençons à examiner ces séries temporelles, nous nous rendons compte que, vous savez quoi, vous ne connaissez même pas le prix. Quand nous commençons à travailler avec des entreprises qui souhaitent améliorer leur prévision, nous regardons simplement leur data pipeline qui génère la prévision, et nous constatons que la tarification est absente. Évidemment, les prix ont un impact massif sur la supply chain. Si soudainement vous appliquez une réduction de 50 % sur tous vos produits, votre demande va exploser, peut-être que votre rentabilité va également disparaître, mais quoi qu’il en soit, les prix ont généralement un impact énorme sur la demande et sur votre supply chain. La plupart du temps, lorsque nous examinons ces processus de S&OP et de prévision, la tarification est absente, mais ce n’est généralement que la partie émergée de l’iceberg.

Kieran Chandler: Nous en avons déjà parlé, et les gens se concentrent sur la demande, la tarification étant évidemment l’une des choses qu’ils peuvent examiner, mais peut-être vaudrait-il réitérer : quelles sont les autres sortes de choses qui pourraient présenter un intérêt ?

Joannes Vermorel: Habituellement, les retours sont absents, les niveaux de stocks le sont également. Vous pourriez penser : pourquoi aurait-on besoin de niveaux de stocks ? La réponse est, d’abord, que si vous êtes en situation de rupture de stock, alors vous ne vendrez rien simplement parce qu’il n’y a rien à vendre. Vous pourriez obtenir des commandes en attente, mais là encore, c’est un schéma très spécifique. Alors, pouvez-vous vraiment considérer une commande en attente comme équivalente à une vente régulière ? Je veux dire, cela demande un certain engagement. Une commande en attente, c’est fondamentalement lorsque le produit n’est pas disponible, donc je vais demander au fournisseur d’inscrire quelque chose en commande en attente pour qu’il soit expédié plus tard, et en tant que client, je suis prêt à accepter un délai important. Encore une fois, il s’agit d’une demande, mais ce n’est pas une demande de la même nature qu’une demande régulière. Donc, si vous affirmez qu’une unité de commande en attente équivaut exactement à une vente, eh bien, ce n’est pas vraiment le cas, pas vraiment.

Pour vous donner un exemple, si pour une raison quelconque il se trouve qu’une grande partie de la demande que vous avez, peut-être en B2B, provient de clients qui acceptent les commandes en attente et les longs délais de traitement s’ils peuvent obtenir un meilleur prix, alors, soudainement, du point de vue de la prévision, c’est très avantageux, car vous n’avez plus besoin de prévoir quoi que ce soit.

Kieran Chandler: Pouvez-vous parler de la demande et des commandes en attente ?

Joannes Vermorel: Quelque chose lié aux commandes en attente pour être expédiées plus tard : en tant que client, je suis prêt à accepter un délai important. Encore une fois, il s’agit d’une demande, mais ce n’est pas une demande de la même nature qu’une demande régulière. Donc, si vous affirmez qu’une unité de commande en attente équivaut exactement à une vente, eh bien, non, pas vraiment. D’ailleurs, pour vous donner un exemple, si pour une raison quelconque une grande partie de la demande que vous avez, peut-être en B2B, provient de clients qui acceptent les commandes en attente et les longs délais de traitement s’ils peuvent obtenir un meilleur prix, alors, du point de vue de la prévision, c’est vraiment très avantageux, car vous n’avez plus besoin de prévoir quoi que ce soit. Vous observez simplement les commandes en attente, et vous orchestrez vos supply chains de manière à ce que, lorsque le délai de livraison prévu arrive, vous ayez les marchandises prêtes. Mais vous n’avez pas nécessairement besoin de prévoir cette demande, car vous savez qu’elle est déjà connue à l’avance, puisqu’elle a déjà été commandée.

Kieran Chandler: Si vous souhaitez tirer le meilleur parti des données dont vous disposez actuellement, quel est alors votre conseil aux entreprises ?

Joannes Vermorel: La première chose est que vous devez aborder le problème d’un point de vue très spécifique au domaine. Vous devez vous demander, “J’ai une supply chain. Qu’est-ce qui compte vraiment ?” Et la réponse est, “Ça dépend.” Cela dépend vraiment du type de supply chain que vous exploitez. Si vous êtes dans l’aérospatiale, la question se résume à : “Pour chaque dollar investi dans ma supply chain, comment puis-je éviter le maximum d’incidents AOG (aircraft on ground) parce qu’il manque quelque chose, et que, par conséquent, un avion reste cloué au sol ?” Ainsi, en général, la question est : “Comment obtenir le maximum d’incidents AOG par dollar investi ?” Ce serait la perspective pour l’aérospatiale. Pour les produits frais, le problème est complètement différent. Ce serait : “D’accord, comment puis-je vraiment maximiser la fidélité à long terme de mes clients, puisque l’alimentation repose entièrement sur les achats répétés ?” Ainsi, ce que vous voulez, ce n’est pas le taux de service d’un seul produit, ce qui serait en quelque sorte inutile. Vous ne vous en souciez pas vraiment, car il existe tellement de substituts. Vous voulez vous assurer que vos clients fidèles, qui viennent dans votre magasin pour acheter non pas un seul produit, mais un panier complet, vivent une très bonne expérience. Et donc, si quelque chose manque, il y a toujours un substitut, et ils peuvent quitter vos magasins en étant pleinement satisfaits, non seulement de la disponibilité globale, mais aussi de la fraîcheur générale de ce qu’ils achètent. Cela fera partie de l’expérience globale, et encore une fois, la question sera : par dollar investi, comment optimiser cela ? La question est vraiment spécifique au domaine. Quelles sont les idées les plus pertinentes auxquelles vous devez réellement prêter attention ? Eh bien, c’est uniquement votre expertise dans le domaine qui vous permet de juger cela, et généralement, cela ne nécessite pas de compétences avancées en data science. C’est simplement, je dirais, une compréhension directe du domaine qui vous permet de déterminer si quelque chose est agréable à avoir ou totalement critique pour éviter de prendre des décisions vraiment stupides.

Kieran Chandler: Quel est le message principal d’aujourd’hui ?

Joannes Vermorel: Donc, si nous prenons pour objectif de cet épisode, c’est comment obtenir une meilleure prévision avec une meilleure traînée. Ce serait quelque chose que nous souhaitons atteindre, et de toute façon, de meilleures données ne sont typiquement pas ce à quoi vous vous attendez.

Kieran Chandler: Je veux dire, oui, vous pouvez disposer de données bien meilleures pour votre démarche de prévision, mais le problème est : que signifie vraiment “meilleur” ? Généralement, l’expérience locale veut dire des choses très spécifiques qui ne correspondent absolument pas aux attentes de la plupart des gens. Tout d’abord, de meilleures données signifient avoir une vue d’ensemble complète de tout ce que vous devriez examiner, et généralement, il ne s’agit pas d’Instagram, de vos réseaux sociaux ou des prévisions météo. Il s’agit de choses beaucoup plus banales, des éléments qui existent déjà dans le système. Ce sont des aspects que de nombreuses personnes, peut-être même ceux qui vous ont précédé, avaient déjà décidé de ne pas examiner.

Joannes Vermorel: Eh bien, notre message est que ces données méritent vraiment qu’on s’y intéresse. Je parle des prix, des retours, des commandes en attente, des mouvements de stocks, et tout le reste. Ils comptent, et la bonne nouvelle, c’est qu’ils sont déjà présents quelque part dans vos systèmes. Donc, tout d’abord, élargissez votre horizon quant à ce que vous considérez comme des données pertinentes. La deuxième chose serait d’oublier cette idée de préparation des données. Vous devez comprendre comment les données sont générées, pourquoi ? Parce que sinon, vous allez vous retrouver dans une situation de garbage in, garbage out. Comprendre les données est délicat, car cela signifie comprendre à la fois le logiciel et le processus suivi par les personnes qui opèrent avec ce logiciel.

Habituellement, la sémantique des données comporte deux volets : l’un se trouve dans l’esprit de la personne qui utilise le logiciel, et l’autre dans celui de l’ingénieur logiciel qui a conçu, à l’origine, le logiciel d’entreprise. Quand je dis “la personne”, hélas, il s’agit généralement de beaucoup, beaucoup de personnes, et dans le pire des cas, ces personnes ont des interprétations conflictuelles. Vous voyez, élargissez donc votre horizon en termes de données pertinentes, rien de très sophistiqué, juste des éléments banals pour votre entreprise, et pas seulement les ventes. Ensuite, vous devez comprendre ces données.

Enfin, si vous voulez obtenir de meilleures prévisions, tout se résume à ce que cela signifie, une meilleure prévision. Ensuite, nous arrivons au point où les gens diraient : “Oh, c’est un meilleur MAPE ou une meilleure MAE,” ou encore, vous savez, toutes sortes de mesures. Et encore, je dirais que si c’est exprimé en pourcentages, ce n’est tout simplement pas acceptable. Cela doit être exprimé en dollars. Et comme nous en avons discuté dans l’un des épisodes précédents sur le principe décisionnel avant tout, en fin de compte, une prévision ne peut être considérée meilleure que si elle conduit à de meilleures décisions.

Malheureusement, la seule manière de juger si une prévision est meilleure ou non est de l’évaluer à travers le prisme de la décision finale que vous prenez. C’est difficile, mais c’est ainsi que l’on procède. Si vous vous contentez de dire, “Oh, j’ai un meilleur MAPE, donc la prévision est meilleure,” c’est une très grande erreur, et vous ne serez même pas sur la voie qui, je dirais, mène à commettre des erreurs de type nationalisme, ou des erreurs de ce genre.

Kieran Chandler: Ouais, d’accord, je vais devoir composer avec ça, mais je suppose qu’il y aura probablement quelques IT managers qui vont nous remercier pour ça car ils vont devoir fouiller dans les archives maintenant. D’accord, c’est tout pour cette semaine. Merci beaucoup d’avoir suivi, et nous vous retrouverons dans le prochain épisode. Au revoir pour l’instant.