00:00:07 Introduction au sujet de l’apprentissage automatique dans l’industrie de la supply chain.
00:00:46 Introduction de l’invité Alexander Backus, responsable des données et de l’analyse chez IKEA.
00:02:20 Explication du concept de prophétie autoréalisatrice.
00:03:03 Discussion sur la façon dont une prophétie autoréalisatrice affecte la supply chain, tels que les objectifs commerciaux et l’influence de l’offre et de la demande.
00:07:14 Explication de la façon dont les boucles de rétroaction dans la supply chain rendent le monde plus complexe et comment un surplus d’un certain produit peut influencer ses ventes.
00:08:53 Discussion sur les boucles de rétroaction dans les supply chains et l’influence du comportement humain sur celles-ci.
00:10:41 Utilisation des données de vente dans la prévision de la demande et les conséquences potentielles de l’utilisation d’une approche naïve.
00:13:08 Problème de prévision nulle dans les systèmes d’apprentissage automatique et l’effet coup de fouet.
00:15:17 Explication du biais de rupture de stock et des techniques pour y faire face.
00:17:22 Discussion sur la prévalence des ruptures de stock et l’efficacité de la méthode pour faire face au biais de rupture de stock.
00:18:15 Explication de la façon dont la perception du client d’un produit peut affecter la demande et l’impact des niveaux de stock sur les ventes.
00:20:17 Explication du masquage des pertes et de son objectif.
00:20:26 Explication de la façon dont donner au modèle accès aux niveaux de stock peut l’aider à comprendre l’effet des fluctuations des niveaux de stock sur les ventes.
00:22:14 Discussion sur les limites de l’utilisation d’un modèle d’apprentissage automatique pour l’inférence causale et les effets des variables de confusion.
00:25:54 Explication de la façon dont la prévision probabiliste peut aider à réduire l’impact de la prévision nulle en reconnaissant la “flou” des informations disponibles.
00:27:04 Explication des avantages de l’utilisation d’un modèle de prévision probabiliste.
00:28:44 Avantages de l’utilisation d’un modèle de prévision probabiliste par rapport à une prévision ponctuelle.
00:30:42 Boucles de rétroaction et leur impact sur la prévision.
00:34:35 Comment les prix peuvent affecter la prévision.
00:36:32 Explication de l’observabilité partielle et de son défi dans la création d’un modèle de gestion de la supply chain.
00:37:04 Comparaison avec le concept de rétroaction de bandit et son application bien connue dans les systèmes de recommandation de commerce électronique.
00:37:17 Discussion sur les limites de l’apprentissage supervisé dans la prédiction de l’impact des décisions en matière de gestion de la supply chain.
00:38:01 Explication de l’algorithme d’apprentissage par renforcement basé sur les politiques.
00:41:06 Discussion sur les défis liés à l’application de l’algorithme d’apprentissage par renforcement à la gestion de la supply chain du monde réel et la solution consistant à commencer par l’apprentissage hors ligne à partir de données historiques.
00:44:55 Discussion sur la manière dont les habitudes et les pratiques passées affectent les mouvements de prix dans une entreprise.
00:46:41 Explication de l’exploitation et de l’exploration dans l’apprentissage par renforcement.
00:50:57 La nécessité de reconnaître les boucles de rétroaction dans la prévision en tant que changement de paradigme.
00:52:45 Les défis techniques et culturels liés à l’intégration de l’IA dans les processus commerciaux.
00:53:57 Discussion sur les défis liés à la modélisation et à la prise de décision dans l’industrie de la supply chain.
00:54:55 Reconnaissance de l’existence de boucles de rétroaction dans le processus de la supply chain.
00:55:06 Passage à une approche basée sur la prise de décision plutôt que sur la prévision.
00:57:27 La tendance dans l’industrie de la supply chain, en particulier chez les grandes entreprises de commerce électronique.
01:01:03 Les qualités recherchées lors de l’intégration de nouvelles personnes pour travailler sur les défis de la supply chain chez IKEA.

Résumé

Dans une interview animée par Nicole Zint, Joannes Vermorel, fondateur de Lokad, et Alexander Backus, responsable des données et de l’analyse chez IKEA, discutent de l’application de l’apprentissage automatique et de l’IA dans l’industrie de la supply chain. L’interview met en évidence l’impact des prophéties autoréalisatrices et des boucles de rétroaction sur la gestion de la supply chain et souligne les défis liés à l’utilisation de modèles d’apprentissage automatique dans la prévision. L’interview explore également des approches pour éviter le problème de prévision nulle, telles que l’utilisation de prévisions probabilistes, et l’importance de reconnaître l’incertitude dans la prévision de la supply chain. Les intervenants soulignent la nécessité d’accepter l’incertitude, de passer à des modèles de prise de décision et d’incorporer les changements de manière progressive pour améliorer la gestion de la supply chain.

Résumé étendu

Dans cette interview, Nicole Zint anime une discussion entre Joannes Vermorel, fondateur de Lokad, et Alexander Backus, responsable des données et de l’analyse chez IKEA, sur l’application de l’apprentissage automatique et de l’IA dans l’industrie de la supply chain. Ils discutent du concept de prophétie autoréalisatrice et de son impact potentiel sur les supply chains, du rôle des boucles de rétroaction et des défis liés à l’utilisation de modèles d’apprentissage automatique dans la prévision.

Une prophétie autoréalisatrice est une prédiction qui se réalise directement ou indirectement en raison de la rétroaction entre la croyance et le comportement. Dans la gestion de la supply chain, les prévisions peuvent avoir un impact sur les processus de prise de décision et finalement changer l’avenir. Vermorel souligne que les prophéties autoréalisatrices ne sont pas intrinsèquement bonnes ou mauvaises ; elles rendent simplement la situation plus complexe.

Les boucles de rétroaction sont courantes dans les supply chains, car les humains réagissent aux prévisions, ce qui peut ensuite affecter les prédictions futures. Vermorel souligne comment ces boucles peuvent se manifester de différentes manières, telles que l’ajustement des prix ou des emplacements de produits en fonction des niveaux de stocks. Il note également que les concurrents peuvent modifier leurs stratégies en réponse aux prévisions d’une entreprise, créant ainsi des boucles de rétroaction supplémentaires.

Backus explique que les données de vente sont une donnée clé pour les modèles d’apprentissage automatique dans la prévision, mais les ventes ne sont pas la même chose que la demande. Les données de vente peuvent être influencées par l’offre et d’autres facteurs, tandis que la demande est une quantité non observée qui doit être déduite. Il souligne l’importance de faire la distinction entre les deux et de prendre en compte leur interaction dans le processus de prévision.

Les modèles d’apprentissage automatique peuvent poser problème dans la prévision de la supply chain s’ils ne sont pas conçus pour tenir compte des boucles de rétroaction et des prophéties autoréalisatrices. Backus mentionne l’“effet fouet”, où de petites déviations dans la supply chain peuvent être amplifiées par le système. Cela peut entraîner des effets néfastes, tels que des ventes en spirale ou des prédictions inexactes. Il compare la prévision de la météo, qui n’est pas influencée par le comportement humain, à la prévision des résultats commerciaux, qui sont soumis à ces boucles de rétroaction complexes.

Pour atténuer les défis posés par les boucles de rétroaction et les prophéties autoréalisatrices, Vermorel suggère que les entreprises devraient embrasser la complexité des systèmes de supply chain et reconnaître que les prévisions ponctuelles peuvent être insuffisantes. Au lieu de cela, elles devraient chercher à comprendre et anticiper les impacts potentiels de leurs prévisions sur le comportement humain et les processus de prise de décision.

En résumé, l’interview explore les subtilités de l’utilisation de l’apprentissage automatique et de l’IA dans la gestion de la supply chain, mettant en évidence l’importance de comprendre les prophéties autoréalisatrices et les boucles de rétroaction pour améliorer la précision des prévisions et la prise de décision.

Le problème de prévision zéro se produit lorsque le système commande moins de stocks en raison d’une baisse présumée de la demande, ce qui entraîne une nouvelle baisse de la demande et une baisse continue des commandes. Pour éviter ce problème, Vermorel suggère de supprimer le biais de rupture de stock en changeant la métrique utilisée dans le modèle de prévision. Une approche consiste à annuler les mesures les jours où il y a des ruptures de stock. Cette méthode fonctionne bien lorsque les ruptures de stock sont relativement rares, mais est moins efficace dans les industries où les ruptures de stock sont fréquentes.

Une autre approche consiste à donner au modèle d’apprentissage automatique accès aux données historiques et futures sur les niveaux de stocks, ce qui lui permet d’apprendre l’effet des fluctuations des niveaux de stocks sur les ventes ou la demande futures. Cette méthode nécessite de prendre en compte toutes les décisions et les facteurs qui influent sur la demande, tels que les promotions, les prix, la capacité, les contraintes d’entrepôt et les forces du marché, dans le modèle de prévision.

Cependant, Backus met en garde contre l’utilisation d’un modèle d’apprentissage automatique standard sans toutes les informations nécessaires, ce qui peut entraîner des erreurs, telles que la confusion entre la cause et l’effet des variations des niveaux de stocks et des fluctuations de la demande. Pour éviter ces problèmes, il suggère d’utiliser des prévisions probabilistes, qui reconnaissent le caractère imprécis des informations disponibles et évitent de converger vers une confiance absolue en une demande nulle.

Les prévisions probabilistes répartissent les probabilités sur de nombreuses valeurs, ce qui rend plus difficile la convergence vers une confiance absolue en une demande nulle. Cette approche évite le gel des stocks à zéro en estimant des probabilités non nulles pour la demande future. Elle tient également compte de l’asymétrie entre le fait de servir un client et de conserver un stock supplémentaire pendant un jour supplémentaire, favorisant ainsi des niveaux de service plus élevés.

Malgré ses avantages, la prévision probabiliste n’est pas une solution parfaite. Elle peut encore sous-estimer la demande future en cas de ruptures de stock répétées. Cependant, elle offre une méthode plus robuste pour gérer les stocks et éviter le problème de prévision à zéro.

En conclusion, l’adoption de techniques d’apprentissage automatique et de prévisions probabilistes peut aider les professionnels de la chaîne d’approvisionnement à mieux prévoir la demande et à gérer les niveaux de stocks. En tenant compte des différents facteurs qui influencent la demande et en prenant en compte les incertitudes des données disponibles, les entreprises peuvent prendre des décisions plus éclairées et améliorer leurs performances en matière de chaîne d’approvisionnement.

Joannes Vermorel a souligné l’importance de reconnaître l’incertitude dans la prévision de la chaîne d’approvisionnement, car la modélisation parfaite des événements futurs est irréaliste. Il a discuté du concept de prévision probabiliste, qui reflète l’incertitude inhérente des événements de la chaîne d’approvisionnement, et de la manière dont il diffère des prévisions ponctuelles. Les prévisions probabilistes, a-t-il expliqué, impliquent des distributions de probabilité, ce qui rend le futur très différent du passé. Il a également évoqué les boucles de rétroaction comme une dimension supplémentaire pour enrichir les prévisions en les rendant dynamiques et conditionnelles au comportement futur.

Alexander Backus a approuvé les points de Vermorel et a expliqué comment donner aux modèles l’accès aux décisions précédentes, telles que les prix, peut atténuer les problèmes de prévision. Il a introduit le concept d’observabilité partielle, qui consiste à observer uniquement l’effet d’une décision sans connaître le contrefactuel. Afin de mieux prédire l’impact des décisions, Backus a suggéré de reformuler les problèmes d’apprentissage automatique pour produire des décisions optimales plutôt que des prédictions sur l’avenir. Cette approche s’appelle l’apprentissage par renforcement.

La conversation tourne autour des défis de la prévision et de la prise de décision dans la gestion de la chaîne d’approvisionnement en raison des boucles de rétroaction, des données limitées et des décisions non aléatoires. Ils soulignent la nécessité d’accepter ces boucles de rétroaction et de passer à un modèle qui produit des décisions plutôt que des prévisions. La tendance parmi les entreprises technologiquement orientées comme Amazon et Alibaba est de renoncer à l’idée d’une prévision parfaite et de se concentrer sur la prise de décision. Malgré les défis existants, les participants s’accordent à dire que l’industrie devrait travailler à incorporer ces changements de manière progressive afin d’améliorer la gestion de la chaîne d’approvisionnement.

Vermorel souligne l’importance d’accepter l’incertitude et la complexité irréductible des chaînes d’approvisionnement, qui sont composées d’êtres humains, de machines et de processus. Il préconise d’être approximativement correct plutôt qu’exactement faux. Backus insiste sur la nécessité de disposer de talents exceptionnels en science des données pour relever les défis au sein des grandes entreprises comme IKEA, soulignant le potentiel d’impact mondial et l’importance de remettre en question le statu quo.

Transcription complète

Nicole Zint: Bienvenue Alexander Backus, ici avec nous aujourd’hui dans nos locaux. Alexander est un expert dans ce domaine et est le responsable des données et de l’analyse chez IKEA. Comme toujours, nous aimerions commencer par laisser nos invités se présenter. Alexander, si vous le souhaitez, la parole est à vous.

Alexander Backus: Merci, Nicole. Merci de m’accueillir ici. C’est génial d’être ici à Paris avec vous. Je m’appelle Alexander Backus et je dirige l’analyse des données dans le domaine des opérations d’inventaire et de logistique chez IKEA Inka Group Digital. Je gère un groupe de scientifiques des données, d’ingénieurs des données et d’analystes de données travaillant dans des équipes de produits interfonctionnelles dans le but d’optimiser la planification des opérations logistiques d’inventaire. J’ai une formation en science des données et j’ai travaillé en tant que consultant pour de grandes entreprises telles que KLM Airlines, Heineken, Vodafone Ziggo et ING Bank. Après avoir obtenu un diplôme de troisième cycle en neurosciences cognitives, je pense que travailler en tant que scientifique des données dans la chaîne d’approvisionnement est un domaine vraiment passionnant car il combine de nombreuses conditions favorables à la science des données. Il y a beaucoup de données, il y a un impact sur la prise de décision dans le monde réel, donc c’est quelque chose de tangible, et vous n’impactez pas seulement le résultat financier, mais vous contribuez également à créer un monde plus durable en réduisant le gaspillage dans la chaîne d’approvisionnement. C’est ainsi que j’en suis arrivé là.

Nicole Zint: Avant d’approfondir ces sujets, expliquons d’abord le concept que nous allons aborder. Commençons simplement : qu’est-ce qu’une prophétie autoréalisatrice ?

Alexander Backus: L’idée est que la prévision que vous faites pour optimiser votre processus commercial a en réalité un impact sur un certain processus de prise de décision. Une décision est prise en fonction de votre prévision, du moins c’est ce que vous voulez. Lorsque cela se produit, cela signifie que votre prévision elle-même change l’avenir et modifie également les données qui sont utilisées pour prévoir la prochaine fois. Cela peut poser certains défis. Essentiellement, une prophétie autoréalisatrice est lorsque une prédiction se réalise parce qu’elle a été prédite. Ainsi, vous affectez l’avenir parce que vous pensiez qu’il serait d’une certaine manière. Vous n’affectez pas seulement l’avenir, mais vous créez également une réalité où la prévision devient la vérité, et cela peut se produire de différentes manières. Par exemple, si vous avez une prévision de votre entreprise ou de vos ventes, cela peut devenir l’objectif de votre entreprise.

Nicole Zint: Ainsi, les responsables marketing prennent certaines décisions, ils disent, d’accord, nous devons atteindre cet objectif car nous sommes un peu en dessous maintenant, nous devons vendre un peu plus et faire des promotions. Donc en réalité, la prévision que vous avez faite est devenue l’objectif qui a conduit à la prise de décision tout au long du processus, ce qui a un impact sur le résultat final des ventes dans cet exemple. Et cela peut se produire de nombreuses manières. Un autre exemple est lorsque vous avez une certaine prévision qui fait en sorte que vous sécurisez une capacité de livraison donnée ou une capacité de préparation dans vos entrepôts, et cela a un impact sur le délai de livraison. Ainsi, lorsqu’un client consulte votre site de commerce électronique et voit que le délai de livraison est très élevé ou très bas, cela peut aller dans les deux sens ; cela influence en réalité la demande des clients.

Alexander Backus: Exactement, donc la demande influence votre offre, et l’offre influence la demande. Cela va dans les deux sens, et c’est en fait cet effet auquel vous faites allusion, Joannes. En ce qui concerne les prévisions qui deviennent des objectifs commerciaux, comment voyez-vous cela affecter l’entreprise elle-même ? Quels sont les inconvénients lorsque la prévision est quelque chose que les gens cherchent à atteindre plutôt que de regarder réellement les performances de leur chaîne d’approvisionnement ?

Joannes Vermorel: Il n’y a pas d’inconvénients en soi. C’est plutôt une question de fonctionnement de la chaîne d’approvisionnement. Vous savez, les boucles de rétroaction sont partout. Nous traitons essentiellement des affaires humaines où ce qui surprend les praticiens, c’est que dans de nombreuses écoles d’ingénieurs et même dans de nombreuses entreprises, les gens abordent les prévisions comme l’approche de la prévision du mouvement des planètes, quelque chose où vous avez un cadre très clair où vous avez des observations passées, et vous pouvez faire une déclaration sur la position future de la planète. Mais vous, en tant que prévisionniste, n’avez aucun impact sur ces éléments observés, comme les planètes.

Nicole Zint: Donc, vous voulez dire qu’une prophétie autoréalisatrice n’est pas nécessairement bonne ou mauvaise, elle est simplement ?

Joannes Vermorel: Oui, exactement. Vous ne pouvez pas prétendre que cela n’a aucun impact, mais cela rend certainement la situation plus complexe et compliquée, en réalité un peu des deux. Et donc, là où cela devient un peu déconcertant, c’est que de nombreuses entreprises ont du mal à accepter tout ce qui n’est pas une prévision ponctuelle ou une prévision ponctuelle. Disons, vous avez un avenir ; c’est ça. Et c’est essentiellement quelque chose qui est complètement symétrique du passé. Vous avez vos observations passées, et vous aimeriez avoir un avenir aussi clair et net que le passé, essentiellement plus de la même chose.

Nicole Zint: Oui, plus de la même chose mais aussi vraiment de la même nature. Donc vous avez une vision parfaitement claire du passé et une vision parfaitement claire de l’avenir. Et d’ailleurs, dans le cas du mouvement des planètes, tant que vous ne regardez pas des millions d’années à l’avance, vous pouvez avoir une vision parfaitement parfaite de la position de ces planètes dans un siècle à partir de maintenant.

Joannes Vermorel: Maintenant, là où cela devient intéressant, c’est que dans la chaîne d’approvisionnement, vous avez des boucles de rétroaction partout. Chaque fois que vous vous engagez sur un produit en achetant beaucoup, vous créez en effet des attentes, et les gens ont l’impression qu’ils doivent vendre le produit, et ils feront tout ce qu’il faut pour que l’entreprise ne se retrouve pas avec des stocks massifs qu’elle n’a pas réussi à écouler. Ils s’organiseront de manière à ce que cette offre massive se transforme en ventes massives, ou du moins c’est ce qu’ils essaieront de faire. Ils ajustent le prix en fonction de ce qu’ils ont en stock, ou parfois des choses encore plus banales. S’il y a des magasins, si vous

Nicole Zint: Dans une direction légèrement différente, juste pour établir une plus grande différenciation, vous voyez ces boucles de rétroaction, elles sont partout et elles ne sont pas mauvaises. Elles sont simplement présentes, et encore une fois, la raison principale est que nous avons des êtres humains au milieu qui peuvent réfléchir et agir en fonction de ces améliorations futures. Donc chaque fois qu’il y a des humains dans la boucle, chaque fois que vous faites une déclaration sur le futur, les gens vont réagir en fonction de ces déclarations. Les chaînes d’approvisionnement sont très complexes, donc ces réactions peuvent prendre de nombreuses formes. Mais toutes les chaînes d’approvisionnement ont en commun d’avoir beaucoup de personnes, et parfois, par exemple, la boucle de rétroaction prend également la forme de l’annonce d’une pénurie de quelque chose. Alors les gens se précipitent pour acheter cette chose, et vous pouvez donc avoir une pénurie artificielle simplement parce que c’est un effet psychologique.

Joannes Vermorel: Exactement. Et l’idée que si vous annoncez une pénurie, vous allez très probablement causer une pénurie, ce n’est pas nouveau. C’est relativement prévisible, mais néanmoins, il est difficile d’anticiper tous ces signaux car soudainement vous devez être parfait. Oui, et soudainement vous devez modéliser, d’une certaine manière, la psyché des personnes qui se trouvent au milieu de la chaîne d’approvisionnement.

Nicole Zint: Joannes, tu continues de mentionner ces boucles de rétroaction. Alexander, puis-je te demander quelles données réelles sont renvoyées dans ces systèmes pour que nos téléspectateurs comprennent ? À quel moment de la chaîne d’approvisionnement renvoyons-nous les données ?

Alexander Backus: Bonne question. Je pense qu’une source très importante pour faire n’importe quel type de prévision est vos données de vente, et ce sont également les données clés qui sont affectées par les effets dont nous venons de parler. Donc si nous revenons à ce que Joannes expliquait, l’approche naïve de la prévision de la demande, ou de la prévision d’entreprise en général, est celle où vous prenez un modèle d’apprentissage automatique supervisé et vous commencez à le traiter comme un problème de régression de base. Donc vous dites : “D’accord, je vais simplement prédire cette quantité en fonction des données historiques en utilisant un algorithme d’apprentissage supervisé.” Et ensuite, si vous prenez ce modèle qui est entraîné pour prédire les ventes futures et que vous réfléchissez maintenant aux exemples des boucles de rétroaction que nous avons discutées, vous pouvez avoir des cas préjudiciables ou dégénérés ici. Donc lorsque votre modèle prédit une faible demande ou de faibles ventes, soyons très prudents de ne pas confondre les deux, mais ignorons un instant que les ventes ne sont pas la demande.

Et cela vous mettra dans une situation où vous prévoyez de faibles ventes, vous planifiez donc également une faible capacité, et donc vous vendez également moins, et ensuite vous descendez de plus en plus jusqu’à atteindre zéro. Donc le modèle commencera à apprendre que la demande diminue, mais elle diminue. Et cela peut aussi aller dans l’autre sens, en fait. Donc cela peut également augmenter de manière spirale dans ce sens.

Joannes Vermorel: Oui, il y a ces effets préjudiciables si vous utilisez un modèle d’apprentissage automatique pour apprendre de l’histoire afin de prédire l’avenir de cette manière plus naïve qui peut complètement échouer ici.

Nicole Zint: Cela ressemble un peu à l’effet bullwhip, où une erreur dans une chaîne d’approvisionnement ou une déviation par rapport à la norme est amplifiée par le système. Et vous avez également mentionné le fait que les ventes ne correspondent pas nécessairement à la demande, car vous pouvez vendre 50 unités de votre stock, mais si la demande était de 100, il ne sera enregistré que vos ventes sont de 50. Cette distinction est en fait liée au cœur de ce problème.

Alexander Backus: Oui, la demande elle-même est bien sûr une quantité non observée. Vous ne pouvez pas la mesurer, vous devez donc l’inférer. Et les données de vente sont les plus proches de cela, mais ce n’est certainement pas tout.

Nicole Zint: Donc, nous discutons de l’idée que les prévisions produites peuvent influencer la demande et les ventes, créant ainsi une boucle de rétroaction. Certains ont décrit la différence entre prédire la météo et prédire les affaires, où prédire la météo n’affecte pas celle-ci, tandis que prédire les affaires peut effectivement l’impact. Alexander, pourriez-vous expliquer cette boucle de rétroaction, et comment évitons-nous le problème de prévision nulle que vous avez mentionné?

Alexander Backus: Certainement. Lorsqu’un modèle d’apprentissage automatique apprend à partir de ses propres données de sortie, il peut amplifier les écarts par rapport à la norme. Par exemple, si la demande diminue légèrement pour une raison quelconque, le modèle peut indiquer au système de commander moins. En conséquence, la demande diminue encore plus parce que moins est commandé, et le modèle suggère ensuite de commander encore moins, ce qui conduit à un problème de prévision nulle. Ce problème est particulièrement courant avec la prévision des séries temporelles. Joannes, comment évitons-nous ce problème avec les systèmes d’apprentissage automatique?

Joannes Vermorel: La prévision nulle est quelque chose que vous obtenez lorsque vous ne supprimez pas le biais de rupture de stock, qui peut être assez fort. Si vous êtes en rupture de stock, vous observez des ventes nulles, mais cela ne signifie pas qu’il n’y a pas de demande. Nous avons au moins trois techniques en production chez Lokad pour traiter le biais de rupture de stock. Une approche consiste à changer la métrique que vous optimisez avec votre modèle de prévision. Au lieu d’appliquer la métrique uniformément dans le temps, vous annulez les mesures les jours où vous avez des ruptures de stock. C’est une approche grossière, mais cela peut fonctionner.

Nicole Zint: Quelle métrique est généralement utilisée initialement que vous suggérez de changer?

Joannes Vermorel: Il existe des milliers de métriques, mais les plus simples sont L1, L2, ou même MAPE. La question est de savoir si vous appliquez la métrique uniformément dans le temps. La réponse est généralement non, vous ne voulez pas l’appliquer uniformément. Vous voulez annuler vos mesures les jours où vous avez des ruptures de stock.

Nicole Zint: Donc, annuler signifie supprimer la contribution d’un jour où il y a eu une rupture de stock?

Joannes Vermorel: Oui, vous supprimez la contribution d’un jour lorsque vous savez que votre signal est fortement déformé. Il fonctionne bien de supprimer ce signal, mais c’est une approche plutôt grossière.

Nicole Zint: Pas si vos ruptures de stock sont très fréquentes. Pour de nombreuses entreprises, les ruptures de stock sont statistiquement relativement rares. Elles ont un taux de service de plus de 95 %, donc cette méthode fonctionne bien si les ruptures de stock sont quelque peu exceptionnelles, un peu comme une catastrophe naturelle qui se produit assez rarement.

Joannes Vermorel: Non, je veux dire, par exemple, un magasin de marchandises générales, vous savez, votre supermarché. Ils ont un taux de service de plus de 95 % tous les jours, c’est bien. Cela ne fonctionnerait pas, par exemple, pour un magasin de luxe. Dans ce cas, un magasin de luxe, juste pour vous donner une idée, aurait généralement, disons, 500 articles sur un catalogue de 5 000. Donc, par définition, vous avez plus de 90 % de ruptures de stock tout le temps. Dans ce cas, ce n’est pas très sensé. Vous voyez, cela dépend vraiment de l’industrie. Il y a des industries comme, par exemple, l’alimentation, où vous vous attendez à des taux de service très élevés. Votre assortiment est axé sur des choses que vous êtes censé avoir. Par exemple, si votre supermarché vend habituellement un pack de bouteilles de soda, vous devriez pouvoir entrer dans le magasin en étant sûr de trouver ces unités. Parfois, ce ne sera pas le cas, mais ces événements seront rares. Donc, encore une fois, cela dépend des secteurs d’activité que vous examinez.

Nicole Zint: D’accord, et essentiellement, les ventes peuvent envoyer un mauvais signal sur la demande, comme vous l’avez expliqué. Si les ventes sont nulles, on peut rapidement supposer à tort que cela signifie une demande nulle, mais en réalité, cela peut être parce que vous n’avez pas ce stock. En fait, il y a une très forte demande pour cela. Et l’inverse est également vrai. Si vous avez une rupture de stock pour un autre produit qui se trouve être un bon substitut, alors vous pouvez voir les ventes d’un article augmenter alors qu’il ne reflète que le fait que vous êtes en train de manquer de stock pour quelque chose qui est comme un substitut moins cher. Néanmoins, la perception du client pourrait être que c’est un mauvais service.

Joannes Vermorel: Oui, car les clients pourraient être d’accord pour prendre le substitut, mais ils pourraient quand même penser que c’est une option inférieure. Donc, encore une fois, ce qui est intéressant, c’est que vous devez prendre en compte l’agent, les clients, et ce qu’ils pensent, et essayer d’ajuster votre modélisation de la demande pour capturer le genre de raisonnement de base qui va entrer dans votre base de clients.

Nicole Zint: Comment éviter ce problème de prévision nulle afin que des ventes nulles ne soient pas supposées être une demande nulle?

Alexander Backus: Jiran a mentionné de simplement ne pas tenir compte de ce signal, d’éviter simplement ces jours-là. En termes techniques, cela s’appelle le masquage des pertes.

Joannes Vermorel: Oui, vous supprimez essentiellement la contribution de ce point de données. Une autre technique simple consiste à donner au modèle l’accès aux niveaux de stock historiques et peut-être à certaines projections futures, afin que vous puissiez comprendre comment ces ventes sont influencées par les niveaux de stock.

Alexander Backus: Le modèle peut alors apprendre quel est l’effet des fluctuations de certains niveaux de stock sur les ventes ou la demande futures, si vous le modélisez. Essentiellement, l’effet des décisions.

Joannes Vermorel: Oui, c’est là que tout le monde veut aller, là où vous prenez toutes les décisions qui ont été prises en fonction de vos prévisions précédentes et vous les utilisez comme entrée pour votre modèle de prévision.

Nicole Zint: Lorsque vous le formez, ce ne sont pas seulement les décisions de stock qui ont un impact sur les niveaux de stock, mais cela peut aussi être des décisions marketing, comme même un objectif fixé par la direction de l’entreprise. Ils disent : “Hé, voici combien nous voulons vendre.” C’est une décision en soi car nous avons toutes ces forces du marché.

Alexander Backus: Oui, les forces du marché. Vous mettez tout cela dans la prévision en tant qu’entrée, comme les promotions, les données de tarification et les données de capacité. La capacité peut également influencer la demande. Si les délais de livraison explosent, les gens vont chercher des alternatives. Essentiellement, toutes les contraintes de l’entreprise, des entrepôts et tout ce qui peut affecter la demande servent de signaux d’entrée à votre modèle. Ensuite, le modèle peut apprendre de l’histoire quel est l’effet de ces signaux sur la demande et donc le corriger.

C’est en quelque sorte la deuxième étape de votre modélisation car il y a beaucoup de choses dont vous devez vous méfier ici. Une étape intéressante est que les utilisateurs métier veulent utiliser votre modèle pour faire ce qu’on appelle, en termes techniques, une inférence causale. Ils veulent ajuster des choses comme : “Que se passe-t-il si nous faisons cette promotion ou si nous réduisons les niveaux de stock ? Que se passe-t-il avec la demande ?” C’est un peu comme une simulation.

Pour que cela fonctionne, vous devez prendre beaucoup plus de précautions dans la modélisation. Si vous le faites comme je l’ai expliqué, votre modèle peut facilement apprendre des effets tels que lorsque le stock est bas, la demande est élevée, simplement parce qu’une campagne marketing, qui est la cause réelle, a fait baisser le stock et augmenter la demande. Cela confond le concept. Cela s’appelle un facteur de confusion ou une causalité inversée. Un modèle d’apprentissage automatique standard, qui n’a pas toutes les informations dont il a besoin, fera ce genre d’erreur.

Un exemple classique est lorsque vous essayez de prédire s’il fera chaud. Vous pouvez le prédire par le nombre de ventes de crème glacée. Eh bien, bien sûr, c’est un exemple typique de causalité inversée. Mais peut-être qu’ils ont baissé leur prix ou qu’ils étaient en rupture de stock, et c’était la raison réelle. Il y a beaucoup de choses possibles.

Mais vous devez être prudent. C’est une façon de commencer à donner à votre modèle plus d’informations sur les décisions qui ont été prises à son sujet et de vous assurer qu’il apprend à établir des liens. Cependant, cela restera assez difficile pour le modèle lui-même d’apprendre ces relations, surtout s’il y a beaucoup d’étapes intermédiaires pour lesquelles vous n’avez pas de données. Si vous donnez une prévision, ce n’est pas une certitude que quelqu’un dans l’entreprise la prendra et prendra des décisions dessus. Des informations seront ajoutées, des changements seront apportés par les planificateurs de l’entreprise, et vous serez aveugle à cela dans une certaine mesure. Cela devient à nouveau problématique et complexe.

Avant de nous plonger dans la façon dont nous abordons réellement ces nouveaux défis posés par la création d’une…

Nicole Zint: L’apprentissage automatique est un modèle plus intelligent qui prend des décisions et apprend. Alexander, comment chaque décision impacte-t-elle l’entreprise et comment pouvons-nous les comparer pour déterminer quelles décisions prendre ? Nous ne voulons pas seulement faire des prévisions, mais aussi comprendre les étapes intermédiaires. Mais avant d’entrer dans les détails, Joannes, nous avons mentionné un peu plus tôt ce modèle de prévision zéro, qui est un concept important dans ce modèle d’apprentissage automatique. Quelle est la différence dans les approches de prévision que nous adoptons chez Lokad ? Les prévisions probabilistes aident-elles à résoudre le problème de la prévision zéro et amplifient-elles, comme nous l’avons discuté, ces écarts par rapport à la norme qui deviennent simplement de plus grandes erreurs ? Comment la prévision probabiliste change-t-elle cela ?

Joannes Vermorel: La prévision probabiliste est très intéressante à cet égard et plus généralement pour la boucle de rétroaction. Il y a deux raisons complètement différentes à cela. La première est l’idée que nous introduisons une notion de flou, donc nous essayons d’être au moins approximativement corrects plutôt qu’exactement faux.

Lorsqu’il s’agit de situations avec des prévisions zéro, par exemple, ce qui se passe, c’est que lorsque vous avez des prévisions probabilistes, vous reconnaissez que la qualité des informations dont vous disposez tend à être assez floue. Vous n’avez pas une vision parfaite de ce qui se passe, et il sera donc beaucoup plus difficile, numériquement parlant, de converger vers une confiance absolue que la demande est vraiment à zéro. Donc ce n’est pas que le modèle de prévision probabiliste est tellement meilleur, c’est juste qu’il sera étalé et il évitera de se bloquer sur cette position zéro. Il considère toutes les probabilités sur de nombreuses valeurs, et lorsque vous ajoutez à cela le fait que vous avez généralement de fortes asymétries entre le fait de pouvoir servir ou simplement de pouvoir servir une unité à servir par rapport au fait de simplement garder une unité supplémentaire en stock pendant un jour supplémentaire, généralement dans de nombreuses situations, vous êtes très enclin à garder une unité supplémentaire pendant un jour plutôt que de prendre le risque de faire face à une rupture de stock. Le compromis est très orienté vers des niveaux de service plus élevés.

Ainsi, ce que vous obtenez avec les prévisions probabilistes, c’est une situation où vous avez des probabilités qui sont étalées. Vous n’avez pas votre prévision, qui est votre déclaration numérique sur l’avenir, qui s’effondre rapidement vers un état dégénéré, qui est de dire simplement que la demande future sera nulle. Elle connaîtra des problèmes, donc si vous avez des ruptures de stock répétées, la prévision probabiliste n’est pas magique. Il est fort probable que vous sous-estimiez la demande future réelle. Cependant, il est fort probable que vous évitiez que l’inventaire ne se fige à zéro simplement parce que vous estimez toujours qu’il existe une probabilité non nulle d’avoir une ou deux ou trois unités de demande. C’est le premier argument ; cela évite d’amplifier dans une direction.

Alexander Backus: Oui, il est également important de considérer que, surtout lorsque nous avons des boucles de rétroaction, les situations sont très difficiles à contrôler complètement. Il vaut mieux avoir quelque chose qui n’amplifie pas dans une direction, comme l’a mentionné Joannes.

Nicole Zint: Prétendre avoir une maîtrise complète de tout. Encore une fois, il ne s’agit pas du mouvement des planètes dont nous parlons. Des phénomènes où une inexactitude de 30 à 60 pour cent n’est rien, vous savez, ce n’est rien de surprenant.

Joannes Vermorel: Donc, nous parlons d’un degré d’inexactitude dans le genre d’affirmation numérique que nous faisons sur l’avenir qui est très élevé. La prévision probabiliste donne au moins quelque chose qui reflète cette énorme incertitude ambiante que nous avons. Encore une fois, nous essayons de modéliser des êtres humains, vous savez, des personnes qui peuvent réagir. C’est très, très difficile et la première chose à reconnaître est que vous n’êtes pas en contrôle. Je veux dire, ces personnes - ces clients, ces fournisseurs, ces concurrents - sont intelligents, ils jouent leur propre jeu, vous savez, ils font beaucoup de choses. Ce serait, je dirais, un peu d’hubris de prétendre que vous pouvez parfaitement modéliser tout ce qui va se passer. Ce serait la base du roman de science-fiction d’Asimov, où vous pouvez avoir une modélisation statistique parfaite de l’avenir de grandes civilisations. C’est extrêmement difficile et très probablement irréaliste.

Joannes Vermorel: La prévision probabiliste est également d’un grand intérêt pour une raison complètement différente. La deuxième raison est que, contrairement à la prévision ponctuelle où vous avez une symétrie complète entre le passé et l’avenir - avec la prévision ponctuelle, vous avez essentiellement une mesure par jour par SKU, ce serait vos ventes, par exemple, ou votre demande - et lorsque vous projetez dans l’avenir, vous vous retrouvez avec une mesure par jour par SKU. Donc la prévision est très symétrique par rapport à votre observation passée. Cependant, lorsque vous entrez dans le domaine de la prévision probabiliste, soudainement, ce que vous regardez est une distribution de probabilité ou une série de distributions de probabilité. Et donc, vous avez cette très forte asymétrie entre le passé et l’avenir. Soudain, l’avenir est complètement différent du passé. Dans le passé, vous avez des observations, elles sont uniques, il n’y a pas d’incertitude ou s’il y en a, c’est juste l’incertitude de la mesure elle-même. Je veux dire, il peut y avoir une erreur de saisie dans votre registre des ventes, mais en termes d’ordre de grandeur, c’est très, très petit. Cela peut être presque toujours approximé dans la supply chain comme aucune incertitude par rapport à l’avenir, où l’incertitude est vaste et ce sont vos distributions de probabilité.

Joannes Vermorel: Et donc, ce qui est très intéressant, et cela m’amène à la boucle de rétroaction, c’est que la boucle de rétroaction est encore une autre dimension supplémentaire. C’est un moyen d’enrichir la prévision pour la rendre plus robuste, mais d’une manière très différente car si la prévision probabiliste consistait à introduire des probabilités, la boucle de rétroaction consiste à faire de la prévision une fonction d’ordre supérieur. Fondamentalement, votre prévision n’est soudainement plus un résultat, même pas une distribution de probabilité, c’est un mécanisme dans lequel vous pouvez injecter une politique, une sorte de réaction, et vous obtiendrez un résultat différent. Donc vous voyez, cela devient quelque chose où vous savez simplement que si quelqu’un agit - et ce quelqu’un peut même être vous-même d’une certaine manière - vous aurez toujours un impact sur la prévision.

Nicole Zint: Donc la situation devient plus dynamique et holistique lorsque vous entrez dans le domaine des boucles de rétroaction. Pouvez-vous expliquer comment cela affecte la prévision et comment cela devient plus insaisissable ?

Joannes Vermorel: Lorsque vous entrez dans le domaine des boucles de rétroaction, vous traitez quelque chose de dynamique qui nécessite un ingrédient fonctionnel à sa base, comme une politique. Cette politique dicte comment vous réagissez en termes de stocks, de prix et de différents facteurs qui représentent votre prévision. La prévision devient plus insaisissable car ce n’est plus un simple objet. Elle est affectée par ces boucles de rétroaction, et lorsque les gens parlent de “prévision”, ils pensent généralement à une prévision ponctuelle. Lorsque nous entrons dans le domaine des prévisions de politique, nous étendons déjà les limites de ce que les gens peuvent imaginer. Lorsque nous disons qu’il s’agira de distributions de probabilité, il devient beaucoup plus difficile de visualiser.

Par exemple, le fait que vos prix vont évoluer pour aider à maintenir le flux de marchandises dans votre supply chain. Si une entreprise est sur le point de subir une pénurie massive, la réponse la plus naturelle est d’augmenter progressivement le prix afin que la pénurie soit moins grave. À l’inverse, si vous êtes sur le point de subir une situation de surstockage massif, la réponse naturelle est de baisser le prix pour augmenter la demande et liquider le surstock. La prévision que vous avez sur l’avenir dépend de votre politique de tarification dans ces exemples. Lorsque vous commencez à réfléchir aux boucles de rétroaction, votre prévision devient conditionnelle, en tenant compte d’une politique qui est en partie sous votre contrôle.

Nicole Zint: Alexander, êtes-vous d’accord avec les forces et les différences que Joannes vient de souligner entre l’approche de prévision probabiliste et une série temporelle ?

Alexander Backus: Oui, donner à votre modèle accès aux décisions précédentes telles que la tarification peut atténuer ce problème. Joannes a parlé de séries temporelles et de prévision probabiliste à cet égard. Cependant, nous n’avons pas seulement l’effet de votre prévision sur les décisions futures et les données d’entraînement ; nous avons également ce qu’on appelle l’observabilité partielle. Cela signifie que vous n’observez que l’effet de la décision qui est prise, et vous ne savez pas ce qui se serait passé si vous aviez eu plus de capacité ou plus de stocks. C’est un contre-factuel. Le défi est de créer un modèle suffisamment bon pour prédire avec précision l’impact de toutes les décisions.

Ce phénomène est très bien connu dans les systèmes de recommandation du commerce électronique et est sans doute moins connu dans la supply chain. On l’appelle la rétroaction de bandit. Le terme vient des bandits manchots multi-bras, une configuration de machine à sous dans un casino où vous n’observez que la récompense que vous obtenez de la machine à sous ou quel bras vous tirez.

Nicole Zint: Et puis c’est le même effet, et le système de recommandation est similaire à cela car si vous montrez une certaine publicité, vous ne savez pas ce qui se serait passé si vous aviez montré une autre publicité au client. Il existe des approches de modélisation spécifiques qui conviennent bien à cela, et la configuration naïve d’apprentissage supervisé dont j’ai parlé au début est en réalité là où cela pèche. Donc, cela ne permet pas de prédire l’effet de l’action. Au contraire, ce que vous voulez faire, c’est de reformuler votre problème d’apprentissage automatique, de sorte que le modèle ne devrait pas produire une prédiction sur le futur ; il devrait produire une décision optimale. Et c’est ce dont Joannes a également fait allusion, cela s’appelle une politique. Donc, vous apprenez un modèle qui dit ce que vous devriez faire. C’est la publicité que vous devriez montrer, ou dans un contexte de supply chain, c’est le stock que vous devriez déplacer de A à B, c’est la quantité de capacité que vous devriez réserver. Donc, les choses réelles qui affectent directement votre supply chain plutôt qu’une prévision à elle seule, à partir de laquelle vous prenez les décisions par vous-même que la machine ne sait pas quelles décisions vous avez prises. En théorie, vous pourriez en fait sauter complètement toute la prévision et dire simplement ce que vous devriez faire.

Alexander Backus: Il existe des algorithmes spécifiques d’apprentissage automatique, et la classe plus large s’appelle en réalité l’apprentissage par renforcement. C’est là que vous prenez une action dans le monde réel, vous observez l’effet de cette action, et vous devez le formuler en termes de récompenses, de récompenses financières. Et c’est là que vous obtenez la rétroaction, puis vous mettez à jour votre modèle en fonction de cette rétroaction. Vous avez mentionné les récompenses financières, donc un exemple serait, disons, si vous prenez la décision de commander autant de stock, puis vous observez comment la supply chain se comporte, combien d’argent est entré dans le compte, et ensuite cela est renvoyé dans le système pour qu’il comprenne, eh bien, lorsque nous avons pris ces décisions, voici le résultat, et ainsi de suite.

Joannes Vermorel: Oui, ce genre de renforcement financier ou d’objectif financier peut être plus complexe, en tenant compte des coûts de stockage, des opportunités manquées, et ainsi de suite. Il y a beaucoup de choses qui peuvent être élaborées à ce sujet, ou nous pouvons en rester là. C’est donc ce que vous optimisez ensuite avec cet algorithme d’apprentissage par renforcement. De cette façon, vous apprenez directement la politique, les décisions que vous devriez prendre. Vous embrassez en quelque sorte cette prophétie auto-réalisatrice plutôt que de l’éviter, dont nous avons commencé à parler au tout début de notre discussion. Donc, ce n’est pas bon ou mauvais ; cela ne peut tout simplement pas être ignoré. Et c’est une façon de contourner cela, d’avoir ce modèle qui prend en compte les décisions et apprend de l’impact des décisions précédentes pour créer des décisions de plus en plus meilleures.

Alexander Backus: Nous devrions réfléchir un peu aux implications de cela car cela signifie que vous devriez également être en mesure d’expérimenter. Et cela est, bien sûr, très difficile dans cette configuration si le modèle doit apprendre et voir ce qui se passe s’il fait A ou B.

Nicole Zint: Alors pourquoi cela n’a-t-il pas été appliqué essentiellement auparavant, ou n’est-ce pas appliqué partout ?

Alexander Backus: Eh bien, c’est l’une des raisons. Et aussi, les algorithmes d’apprentissage par renforcement typiques apprennent de manière en ligne, c’est-à-dire qu’ils prennent une action, puis ils apprennent de la rétroaction de récompense qu’ils obtiennent de cela. Cela pose problème dans les environnements réels où il y a beaucoup de risques impliqués, et aussi vous n’avez pas

Nicole Zint: Vous n’avez pas quelque chose pour démarrer cet algorithme, pour le faire produire des choses sensées dès le départ. Il démarre de manière aléatoire. Ou vous devez avoir un environnement de simulation très bon, ce que l’on voit souvent dans d’autres contextes d’apprentissage par renforcement comme AlphaZero qui apprend à jouer aux échecs avec Google DeepMind. Ils ont une simulation, donc ils ont une simulation informatique où cet algorithme d’apprentissage par renforcement peut jouer. Donc vous ne sacrifiez essentiellement pas la chaîne d’approvisionnement de quelqu’un d’autre.

Alexander Backus: Exactement, vous ne voulez pas de cobayes. Mais c’est un problème de poule et d’œuf dans notre cas ici car alors vous avez besoin d’un modèle très précis de la réalité. Et si vous l’avez, alors vous avez déjà résolu le problème. Donc, vous avez besoin d’une chaîne d’approvisionnement pour commencer à le faire, et vous ne voulez pas le faire. Vous avez besoin d’un modèle de votre chaîne d’approvisionnement. Si vous l’avez, vous ne devriez pas avoir besoin de l’entraîner, et vous devriez déjà être en mesure de trouver l’opportunité. Retour à notre point de départ.

Oui, mais il y a une direction prometteuse de nos jours où l’on apprend à partir de données historiques. Cela s’appelle l’apprentissage par renforcement hors ligne, où l’on apprend essentiellement à partir de décisions historiques qui ont été prises. Même si elles ne sont pas aussi bien réparties que vous l’auriez souhaité, il est toujours possible de former des algorithmes basés sur des données du monde réel qui ont été collectées précédemment.

Nicole Zint: Comme un point de départ ?

Alexander Backus: Oui, comme un point de départ. Et à partir de là, vous pouvez ensuite passer à des paramètres plus en ligne sans sacrifier vos approvisionnements, ou vous pouvez l’entraîner hors ligne avant de le lancer par lots. Il y a plusieurs options, mais cela présente également ses propres défis. Joannes, quel est votre point de vue sur ce que vient de décrire Alexander : commencer hors ligne, apprendre à partir de données précédentes, et ensuite, la machine contourne essentiellement ce problème de poule et d’œuf, devient suffisamment performante pour être appliquée à une véritable chaîne d’approvisionnement, donc dispose de données réelles supplémentaires avec lesquelles travailler, et continue à partir de là ? Quel est votre point de vue là-dessus ?

Joannes Vermorel: L’efficacité des données est presque toujours une préoccupation pour tout type d’algorithme d’apprentissage automatique dans la chaîne d’approvisionnement car vous n’avez jamais le luxe d’avoir une énorme quantité de données, du moins pas à la granularité à laquelle les décisions doivent être prises. Dans les décisions de chaîne d’approvisionnement, elles doivent être prises généralement au niveau du SKU. Et en raison du fait qu’il y a des lots qui ont lieu, même si nous regardons le SKU dans un magasin, il ne s’agira pas de millions d’unités par jour. Et si nous regardons le SKU dans une usine, alors il y aura de gros lots, et ce sera par lots de, disons, 10 000 unités. Et là encore, il ne s’agira pas de millions de lots par jour. Donc, la quantité d’observations pertinentes est encore relativement limitée.

C’est un aspect qui est toujours un défi pour l’apprentissage par renforcement car nous n’avons pas autant de données. Un simulateur est très intéressant, mais c’était aussi un point que j’ai brièvement abordé dans l’un de mes cours. Essentiellement, il y a une dualité entre une prévision probabiliste et un simulateur. Si vous avez une prévision probabiliste, vous pouvez toujours échantillonner des observations, et ainsi vous obtenez votre simulateur à partir de votre prévision probabiliste. Et si vous avez un simulateur, vous pouvez simplement exécuter de nombreuses simulations et calculer les probabilités respectives, et vous revenez à votre prévision probabiliste. Donc, il y a une très forte dualité.

Oui, c’est intéressant, mais cela repose sur une prévision probabiliste très précise, ce qui est très difficile.

Nicole Zint: La partialité de l’observation est un problème particulièrement difficile à résoudre car lorsque vous prenez un ensemble de données, disons, par exemple, vous voulez étudier les mouvements de prix. L’entreprise peut avoir fonctionné d’une manière spécifique au cours de la dernière décennie où elle ne faisait pas de mouvements de prix au hasard ; elle avait des habitudes très fortes. Parfois, les habitudes sont si fortes que cela crée des problèmes lorsqu’il s’agit de différencier ce qui est la cause réelle de quelque chose.

Joannes Vermorel: Et si l’entreprise, chaque année à la fin de janvier, décide d’avoir les premières soldes de l’année ? Ils ont une pratique où ils ajoutent de grosses réductions sur une grande variété de produits à la fin de janvier, ce que vous observerez comme une augmentation de la demande à la fin du mois. Mais quel est l’effet de la saisonnalité ? Observeraient-ils une augmentation de la demande à la fin du mois même sans les réductions ? Et quelle est la proportion de l’impact qui ne vient que des réductions ?

Alexander Backus: C’est le problème, en effet. Les décisions n’ont pas été prises au hasard, et donc ce que vous observez reflète assez largement les pratiques habituelles. Une façon de résoudre cela en apprentissage par renforcement est d’introduire un mélange d’exploration et d’exploitation. L’exploitation consiste à faire de son mieux à partir de ce que vous avez observé en fonction de ce que vous avez observé, et l’exploration consiste à essayer quelque chose de nouveau, mais avec l’attente que parce que c’est partiellement aléatoire, cela sera inférieur.

Joannes Vermorel: Alors pourquoi essayeriez-vous quelque chose que vous savez très probablement être inférieur ? La réponse est, eh bien, parce que c’est la seule façon dont vous pouvez finalement découvrir quelque chose qui se révèle être supérieur. C’est l’idée de sacrifier, essentiellement, c’est un investissement pour la recherche et le développement. Et cela pourrait être quelque chose qui peut prendre des formes très banales. Cela pourrait être, par exemple, disons que vous êtes dans un magasin, vous vendez des bougies.

Alexander Backus: Et vous réalisez, et si vous essayiez de vendre les mêmes bougies mais à un prix quatre fois plus élevé ou quatre fois plus bas ? Les deux options peuvent être valables. Peut-être que si vous passez une très grosse commande auprès de l’un de vos fournisseurs et que vous augmentez considérablement la quantité, vous pourriez potentiellement baisser considérablement le prix d’un produit de base. Je prends délibérément une bougie, donc vous pourriez avoir un prix beaucoup plus bas, et peut-être que vous multiplieriez par 10 la demande que vous avez observée.

Joannes Vermorel: Ce serait un compromis intéressant. Ou bien prendre une toute autre voie et dire : “Je vais opter pour quelque chose de beaucoup plus haut de gamme, ajouter de la saveur ou du parfum, et quelque chose d’autre, un meilleur emballage, et multiplier le prix par quatre.” Au lieu d’avoir un dixième de la demande que j’avais auparavant, j’ai toujours la moitié de la demande mais pour un produit qui a un prix beaucoup plus élevé.

Alexander Backus: Cependant, si nous regardons l’histoire, il est très probable que les variations que nous avons observées étaient simplement de petites variations par rapport à la référence. Notre histoire ne comprend pas ces scénarios plus fous, si vous voulez.

Joannes Vermorel: Oui, et encore une fois, cela peut être une question de “et si vous prenez un produit et que vous dites : ‘Je vais introduire cinq variantes de cinq couleurs différentes’.”

Nicole Zint: Vous savez, quel est le degré de cannibalisation que j’observerai, ou est-ce que j’atteins réellement de nouveaux marchés ? Encore une fois, si je prends des bougies et que je dis que je vais introduire plusieurs couleurs pour les bougies, dans quelle mesure ces bougies de différentes couleurs vont-elles se cannibaliser, et dans quelle mesure vais-je réellement satisfaire une demande entièrement nouvelle ?

Joannes Vermorel: Je ne sais pas, et peut-être que cet enregistreur pourrait me donner un aperçu de cela. Mais dans une large mesure, ce que nous constatons généralement, c’est que dès que les entreprises commencent à introduire une sorte de hasard piloté par une machine, il y a très peu de hasard. C’est beaucoup plus une question de schémas habituels. Et encore une fois, cela dépend également de la manière dont ces entreprises fonctionnent. Lorsqu’il y a, par exemple, une décision de tarification, ce n’est généralement pas seulement une personne qui a eu l’idée. Il y a une méthode derrière cela, et les gens ont été formés pour dire : “Dans ce genre de situation, vous devriez faire une remise sur le produit car c’est la pratique habituelle et cela a du sens.” C’est bien, mais cela signifie aussi que la plupart des variations de prix que vous observez dans les données historiques suivent toujours un petit nombre de schémas qui sont précisément les méthodes en place.

Alexander Backus: Mais sûrement, c’est quand même un bon point de départ. Comme vous l’avez mentionné, que faites-vous d’autre ? Soit vous sacrifiez une chaîne d’approvisionnement, soit vous créez une excellente simulation, mais cela repose également sur l’idée que vous disposez de bonnes données pour vous baser dessus. Mais, comme je l’ai mentionné, si nous le faisons de manière hors ligne, si nous examinons notre historique de ventes existant ou les données que nous avons, même s’il peut y avoir cette chute de régime où nous pourrions ne pas voir cette énorme déviation par rapport à la norme pour observer les différentes conséquences de cela, est-ce toujours le bon point de départ, selon vous ?

Joannes Vermorel: Je pense que le bon point de départ est légèrement différent. Le bon point de départ est d’abord de reconnaître que chaque fois que nous avons des boucles de rétroaction, c’est fondamental. Si nous reconnaissons que ces boucles de rétroaction sont réelles et que nous voulons les aborder, cela représente un changement de paradigme dans notre approche de la prévision elle-même. Vous voyez, c’est un véritable point de départ. Le reste relève de la technique. Il existe de nombreux modèles. Les modèles les plus simples d’apprentissage par renforcement, comme les bandits, peuvent être incroyablement simples. Certains sont incroyablement complexes, mais ce sont des détails techniques. Ce que j’ai observé dans les chaînes d’approvisionnement du monde réel, c’est que le plus grand défi pour commencer à adopter quelque chose d’aussi simple que ces boucles de rétroaction est de reconnaître qu’elles auront en réalité des conséquences profondes sur les prévisions elles-mêmes. Les prévisions ne seront jamais les mêmes, et je ne parle pas quantitativement. Je parle en termes de paradigme, vous ne pouvez plus regarder ces prévisions de la même manière. Ce n’est même plus le même objet. C’est quelque chose d’une nature différente, et c’est très difficile car généralement, la question que je reçois est : “Est-ce que mes prévisions seront plus précises ?” L’un des défis est que dès que nous commençons à examiner ces boucles de rétroaction, comment mesurez-vous même la précision lorsque vous avez des boucles de rétroaction ? C’est une question à part entière. C’est une question difficile.

Alexander Backus: Oui, si je peux rebondir là-dessus, je pense que nous avons discuté des défis techniques et des défis liés à la disponibilité des données. Mais je suis tout à fait d’accord avec Joannes sur le fait que la principale raison pour laquelle cela n’a pas été appliqué ou adopté dans les entreprises est également qu’il a un impact profond sur votre processus métier. Donc, dans ce genre de cadre théorique…

Nicole Zint: Alors, selon vous, qui sont les acteurs les plus technologiquement orientés de l’industrie du e-commerce ?

Joannes Vermorel: La tendance est, je crois, si je regarde les acteurs très agressifs sur le plan technologique, ce serait les dd.com, les Amazon.com, Alibaba.com. Vous savez, ces entreprises de commerce électronique qui sont en avance sur leur temps. Oui, elles sont vraiment au sommet de leur art. Elles sont très, très efficaces.

Alexander Backus: Je suis d’accord avec ça. Ces entreprises sont certainement des leaders de l’industrie en ce qui concerne la technologie et l’innovation.

Nicole Zint: Donc, le monde a beaucoup changé au fil des ans. Que pensez-vous, Joannes, du monde dans lequel nous vivons aujourd’hui ?

Joannes Vermorel: Eh bien, ce n’est pas aussi simple qu’avant. Le monde progresse toujours, mais nous avons eu beaucoup de surprises ces dernières années. Il est clair que nous ne sommes pas à la fin de l’histoire où tout est prévisible. Le monde est chaotique, et nous devons embrasser l’incertitude et la complexité des êtres humains, des machines et des processus dans les chaînes d’approvisionnement. Nous ne pouvons pas avoir un contrôle total, donc mon approche consiste à être approximativement correct pour tout capturer plutôt que d’être exactement faux.

Nicole Zint: C’est une vision vraiment intéressante. Et vous, Alexander, quel type de talent recherchez-vous lorsque vous intégrez de nouvelles personnes dans votre équipe ?

Alexander Backus: Chez IKEA, nous sommes toujours à la recherche de grands talents en science des données pour résoudre les défis au sein d’une grande entreprise. Nous avons beaucoup de données et un potentiel d’impact à l’échelle mondiale, nous devons donc remettre en question le statu quo.

Nicole Zint: Merci à vous deux pour vos idées. Cela a été un plaisir de vous avoir avec nous aujourd’hui.

Joannes Vermorel: Oui, merci.

Alexander Backus: Merci de m’avoir invité.