00:00:00 Introduction des invités
00:01:27 Le rôle de Warren chez Optimal Dynamics et son livre
00:03:06 Défis et prévisions dans le transport de camions complets
00:04:31 L’article de Warren et la compréhension de l’incertitude
00:06:41 Le parcours de Joannes et son succès dans les logiciels
00:08:12 Accepter l’incertitude et la perspective académique sur la supply chain
00:09:39 Décisions séquentielles et difficultés de collaboration avec l’industrie
00:11:13 Prévisions probabilistes vs déterministes
00:13:27 Métriques pour les prévisions probabilistes et compréhension des difficultés
00:15:28 Importance de la couverture des prévisions et des prévisions précises
00:17:09 Le parcours de Lokad avec les prévisions probabilistes et les défis
00:19:15 La difficulté des problèmes d’incertitude et le manque d’une communauté unifiée
00:21:05 Décisions et incertitude en programmation mathématique
00:23:03 Expériences variées en laboratoire et applications du livre ADP
00:25:07 Nécessité d’une boîte à outils dans la supply chain et transition vers une nouvelle approche
00:27:35 Optimisation déterministe et approximation de la fonction de coût
00:29:57 Google Maps comme exemple d’anticipation
00:31:51 Anticipation stochastique et approximations de la fonction de valeur
00:33:21 La perspective de Joannes sur la prise de décision et l’énoncé du problème
00:35:29 Importance d’un état correct, d’une fonction de transition et de la fonction de coût
00:37:28 Considérer la dimensionnalité du problème et les problèmes de grande envergure
00:39:15 Fragilité des solutions et comparaison avec le réseau de supermarchés
00:41:16 Approche de résolution de problèmes et rédaction d’un livre sur l’analyse de la supply chain
00:43:44 La simplicité dans la conception des modèles et les différents types d’incertitude
00:45:13 Importance d’itérations rapides et des contraintes du monde réel
00:47:51 Importance de la tractabilité informatique et développement d’un outil graphique
00:50:27 Rôle de l’instrumentation dans l’optimisation et les défis de l’industrie
00:53:11 Travailler avec les transporteurs et critique de l’approche académique
00:55:23 Le parcours de Joannes, de la prévision à la prise de décision
00:58:28 Difficulté d’accès aux données et gestion des prévisions futures
01:00:32 Importance de prendre en compte les perturbations majeures et d’accepter des modèles pessimistes
01:02:45 Variabilité dans la supply chain et l’industrie de la mode
01:04:43 Renouveler les produits annuellement et prévoir les nouveaux produits
01:06:27 Importance de modéliser l’incertitude et critique des règles d’entreprise
01:08:16 L’approche de Warren en optimisation stochastique et dans la gestion des stocks
01:09:56 Planification pour les situations de contingence et la prise de décision dans l’incertitude
01:11:39 Importance de l’affectation en temps réel dans le camionnage et de la sélection de la bonne charge
01:13:27 Défis dans la prise de décision dans l’incertitude et problèmes avec les personnes instruites
01:15:45 Les limites d’Excel pour gérer l’incertitude et la compréhension des PDG
01:19:30 Les limites des livres sur la supply chain et l’importance d’outils conviviaux
01:21:46 Les initiatives éducatives de Lokad et la création de jeux de données pertinents
01:25:01 Trois questions essentielles pour la résolution de problèmes et le développement de catégories de décision
01:27:48 Le défi des MBA non quantitatifs et les entreprises enterrant les décisions sous des flux de travail
01:30:26 Le prix de la simplicité et l’apprentissage séquentiel comme outil de prise de décision
01:32:33 Enseigner le concept de viser plus haut et les défis des politiques rigides
01:34:34 La difficulté de comprendre le concept d’exploration et l’importance de l’apprentissage actif
01:37:41 Les différences entre le camionnage et la supply chain et l’ampleur du secteur du camionnage complet
01:40:04 Le titre du livre, son objectif, son style d’enseignement, et les cinq éléments de modélisation
01:42:39 Éloges pour Optimal Dynamics, Lokad, et le partage d’idées académiques
01:43:22 Remarques de clôture et remerciements

À propos de l’invité

Warren B Powell est professeur émérite à l’Université de Princeton, où il a enseigné pendant 39 ans, et est actuellement Chief Innovation Officer chez Optimal Dynamics. Il fut le fondateur et directeur du CASTLE Lab, qui se concentrait sur l’optimisation stochastique avec des applications dans le transport de fret, les systèmes énergétiques, la santé, le le e-commerce, la finance et les sciences de laboratoire, soutenu par plus de 50 millions de dollars de financements provenant du gouvernement et de l’industrie. Il a été pionnier d’un nouveau cadre universel pouvant être utilisé pour modéliser tout problème de décision séquentielle, y compris l’identification de quatre classes de politiques couvrant toutes les méthodes possibles de prise de décision. Cela est documenté dans son dernier livre avec John Wiley: Reinforcement Learning and Stochastic Optimization: A unified framework for sequential decisions. Il a publié plus de 250 articles, cinq livres, et a formé plus de 60 doctorants et post-doctorants. Il est le récipiendaire, en 2021, du Robert Herman Lifetime Achievement Award de la Society for Transportation Science and Logistics, ainsi que du Saul Gass Expository Writing Award en 2022. Il est fellow d’Informs, et récipiendaire de nombreux autres prix.

Résumé

Dans une récente interview sur LokadTV, Conor Doherty, Joannes Vermorel et l’invité Warren Powell ont abordé les prévisions probabilistes et la prise de décision dans les supply chains. Warren Powell, professeur à la retraite de Princeton et Chief Innovation Officer chez Optimal Dynamics, a partagé son parcours professionnel et ses réflexions sur la planification dans l’incertitude. Joannes Vermorel, PDG de Lokad, a évoqué sa transition des méthodes déterministes vers la prévision probabiliste, critiquant le manque d’application concrète dans le monde réel du milieu académique. Les deux se sont accordés sur la supériorité des prévisions probabilistes, malgré leur complexité et les difficultés des entreprises à les appliquer. La conversation a mis en lumière le besoin d’une perspective plus large et d’une approche unifiée pour gérer l’incertitude dans la prise de décision.

Résumé étendu

Dans une récente interview animée par Conor Doherty, Responsable de la Communication chez Lokad, Warren Powell, professeur à la retraite de l’Université de Princeton et Chief Innovation Officer chez Optimal Dynamics, et Joannes Vermorel, PDG et fondateur de Lokad, se sont engagés dans une discussion stimulante sur les prévisions probabilistes et la prise de décision séquentielle dans la supply chain en présence d’incertitude.

Warren Powell, vétéran chevronné dans le domaine de la prise de décision dans des secteurs complexes, a commencé par partager son parcours professionnel. Son travail a débuté avec la déréglementation du transport de fret aux États-Unis, ce qui l’a incité à se concentrer sur la planification dans l’incertitude. Il a également évoqué son rôle chez Optimal Dynamics, une startup avec laquelle il collabore, où il accompagne ses anciens doctorants et envisage de nouvelles orientations pour l’entreprise.

La conversation s’est ensuite orientée vers le livre de Powell, “Reinforcement Learning and Stochastic Optimization,” qui explore le domaine de la prévision distributionnelle ou probabiliste. Powell a partagé une anecdote sur une entreprise qui souhaitait comprendre la valeur d’offrir une réduction à un expéditeur si elle pouvait prédire les chargements futurs. Cela a suscité son intérêt pour le sujet et l’a conduit à explorer les défis de la prévision dans le truckload trucking en raison de sa nature stochastique.

De son côté, Joannes Vermorel a partagé son parcours passant des méthodes déterministes à la prévision probabiliste. Il a expliqué avoir pris conscience que les méthodes déterministes ne fonctionnaient pas et de la nécessité d’accepter l’incertitude dans les problèmes de supply chain. Il a également critiqué le milieu académique pour son manque d’application concrète et sa focalisation sur la démonstration de théorèmes et la réalisation de travaux numériques.

La discussion s’est ensuite penchée sur la différence entre la prévision déterministe et probabiliste. Powell a expliqué que, bien que la prévision déterministe fournisse un chiffre unique exploitable, elle ne tient pas compte de la variabilité du monde réel. Il a soutenu que la prévision distributionnelle, qui offre une gamme d’issues possibles, est supérieure, bien que les entreprises aient souvent du mal à comprendre et à appliquer ce concept.

Vermorel a acquiescé à Powell, ajoutant que la prévision probabiliste nécessite des métriques plus complexes et une compréhension approfondie des distributions de probabilité. Il a comparé la prévision déterministe à l’observation d’une infime section détaillée d’un bureau au microscope, tandis que la prévision probabiliste offre une vue plus large et plus complète.

La conversation s’est conclue par le partage par Vermorel de son expérience dans la mise en œuvre de la prévision probabiliste chez Lokad. Il a noté qu’il avait fallu plusieurs années pour comprendre comment optimiser les décisions en se basant sur ces prévisions. Il a également évoqué l’absence d’une communauté unifiée ou d’un paradigme pour traiter l’incertitude dans la prise de décision. Powell a acquiescé, décrivant le domaine des décisions et de l’incertitude comme une “jungle” en raison de la variété des communautés, des langues et des systèmes de notation. Il a partagé ses diverses expériences dans différents domaines, du transport de fret aux systèmes énergétiques, et comment ces expériences lui ont permis de réaliser les limites de certaines approches et la nécessité d’une perspective plus large.

Transcription complète

Conor Doherty: Bon retour. Identifier et évaluer des décisions viables dans la supply chain est difficile, notamment si vous utilisez encore des métriques traditionnelles. Warren Powell, l’invité d’aujourd’hui, a passé 40 ans à analyser la prise de décision dans divers domaines complexes. De plus, il a écrit cinq livres, environ 250 articles, et est un professeur à la retraite de Princeton. Alors, Warren, tout d’abord, bon retour chez Lokad. Ensuite, pour ceux qui auraient manqué votre première apparition, pourriez-vous vous réintroduire et donner un aperçu de ce que vous avez accompli ?

Warren Powell: Eh bien, merci de m’avoir reconduit. J’ai eu une carrière intéressante. Ma carrière a commencé avec la déréglementation du transport de fret aux États-Unis, et c’est ainsi que j’ai été plongé dans cette industrie appelée truckload trucking. L’une des premières problématiques évoquées fut l’incertitude et la manière de planifier dans l’incertitude, ce qui a en grande partie défini ma carrière. J’ai exercé dans plusieurs domaines variés.

J’ai terminé ma carrière en aidant ma startup, Optimal Dynamics, dans le truckload trucking, ce qui avait d’ailleurs lancé ma carrière. Nous utilisons une variété de techniques, mais heureusement, j’ai pu travailler sur suffisamment d’applications différentes pour réaliser qu’il y a plus d’un outil dans cette boîte à outils de l’incertitude. J’attends donc avec impatience cette discussion. C’est agréable de parler avec d’autres personnes qui partagent ma passion pour la modélisation de l’incertitude.

Conor Doherty: Merci. Et vous avez mentionné Optimal Dynamics. Vous êtes le Chief Innovations Officer, le CIO. Je n’avais jamais entendu ce terme auparavant. Pourriez-vous expliquer ce que vous y faites ?

Warren Powell: On aime m’appeler Yoda. Je ne fais pas partie de la direction. Personne ne travaille pour moi. J’ai cinq de mes anciens doctorants qui y travaillent, et je collabore avec eux de la même manière que lorsque j’étais professeur en laboratoire. J’attends qu’ils lèvent la main et disent, “Hé, nous avons besoin d’aide.” Sinon, je passe mon temps à réfléchir et à envisager de nouvelles orientations pour l’entreprise si l’opportunité se présente.

Mais de temps en temps, il m’arrive d’être rappelé pour aider sur un problème, et j’ai inventé quelques nouvelles innovations qui ont été utiles. Mais je suis vraiment là pour aider l’entreprise quand elle a besoin, et sinon, je préfère rester en retrait. J’ai appris qu’en tant qu’académicien, l’un des plus grands défis, surtout lorsque l’on travaille avec des personnes brillantes, est de savoir quand intervenir et quand rester en retrait. Et ainsi, cela m’a donné beaucoup de temps pour écrire des livres et ce genre de choses.

Conor Doherty: En fait, en parlant d’écriture de livres, l’un de vos ouvrages, “Reinforcement Learning and Stochastic Optimization,” est l’un des sujets qui nous intéressait le plus d’aborder avec vous. Votre approche de la prise de décision, et je sais que vous vous intéressez à la prévision distributionnelle ou probabiliste adoptée par Lokad. Pour bien démarrer l’interview, qu’est-ce qui vous fascine tant dans la prévision distributionnelle et a mené à cette conversation aujourd’hui ?

Warren Powell: Eh bien, le plus grand défi lorsque je me suis attelé à modéliser mon problème de truckload, c’est que dans le camionnage, le truckload trucking est très dispersé. Vous pourriez avoir un chargement entre une paire de villes, ou pas. Lorsque vous envoyez un chauffeur, par exemple de Chicago à Atlanta, une fois arrivé à Atlanta, il y a des chargements dans des directions très variées. Vous pourriez avoir un chargement à destination du Texas, ou pas. Donc, vous êtes face à quelque chose qui vaut 0 ou 1. Que prévoyez-vous ? Prévoyez-vous zéro ou un, ou est-ce que vous prévoiriez 0,2, qui est l’attente la plus réaliste ?

I had a company here in the United States, Schneider National, that back in the 1970s saw that deregulation was coming in, and they worked with a faculty member at the University of Cincinnati on building early optimization models, but they were all deterministic. And somebody from Schneider visited me at Princeton and looked at me and said, and this was somebody with a masters in operations research, “Warren, truckload trucking is stochastic.” J’avais une entreprise ici aux États-Unis, Schneider National, qui, dans les années 1970, avait anticipé l’arrivée de la déréglementation, et ils avaient collaboré avec un membre du corps professoral de l’Université de Cincinnati pour construire les premiers modèles d’optimisation, mais tous étaient déterministes. Et quelqu’un de chez Schneider m’a rendu visite à Princeton, m’a regardé et a dit, et c’était quelqu’un titulaire d’une maîtrise en recherche opérationnelle, “Warren, le truckload trucking est stochastique.” Nous ne savons pas quelles charges seront disponibles, même demain. Nous adorerions savoir quelle serait la valeur de donner un rabais à un expéditeur s’il nous révélait les charges à venir. Et je me souviens avoir assisté à ce dîner en pensant, “Oh mon Dieu, quelle excellente question.” Ce n’est pas que je ne connaisse pas la réponse, c’est que je ne sais pas comment l’appréhender.

Plus tard, dans les années 1980, j’ai écrit un article que j’appelle mon article de musée. En fait, il circule sur Internet en tant que l’article de musée. J’ai cinq manières différentes de modéliser ces problèmes de transport par camion complet, abordant toutes l’incertitude de façon différente, et j’étais parfaitement conscient qu’aucune d’elles ne fonctionnerait. Et donc, me voilà, à la fin des années 1980, me disant : “Je ne sais plus quoi faire. Rien de ce qui sortait de la communauté académique ne fonctionne.”

C’est ainsi qu’a débuté ce processus pluri-décennal au cours duquel j’ai fini par prendre le contrôle et j’ai eu ces moments d’illumination. J’en ai eu un énorme dès le début des années 2000. Schneider est venu me voir et a dit : “Hé, Warren, nous avons vraiment besoin d’aide. Pourrais-tu nous construire ce modèle ?” Ce modèle est finalement devenu le logiciel fondamental pour Optimal Dynamics. Mais même depuis la création de ce modèle, capable de gérer l’incertitude, c’est à ce moment-là que mon travail sur la programmation dynamique approchée a vu le jour.

Je dirais que tous les quelques années, j’ai eu un nouveau de ces grands moments d’illumination. En fait, même depuis l’obtention de mon diplôme, j’ai eu plusieurs autres moments d’illumination. Je veux dire, ce domaine est tout simplement d’une richesse incroyable, et je ne cesse d’avoir ce genre de moments du type “Oh mon Dieu, je n’y avais jamais pensé de cette manière.”

Conor Doherty : Joannes, est-ce que cela correspond à la manière dont tu es arrivé à la prévision probabiliste ? Beaucoup de moments d’illumination ?

Joannes Vermorel : Oui, enfin, en quelque sorte. Pour moi, ce fut un parcours légèrement différent car lorsque j’ai lancé Lokad en 2008, j’ai d’emblée adopté les théories classiques de la supply chain. Ce n’était donc pas qu’une personne venait vers moi en prononçant même le mot “stochastique”. Je suis presque certain que la plupart des personnes que j’avais rencontrées jusqu’à très tard dans ma vie, si j’avais prononcé le mot “stochastique”, elles n’auraient pas su si je parlais de quelque chose comme une variante d’élastique ou quelque chose du genre.

Mais bon, ils étaient intelligents, mais ils n’étaient pas statisticiens ni probabilistes ou autre. Ainsi, mon parcours fut plutôt le suivant : durant les premières années de Lokad, j’ai effectivement appliqué ces méthodes déterministes avec un certain succès en tant que fournisseur de enterprise software, ce qui signifie que tu parviens réellement à vendre tes produits. Cela ne veut pas dire que cela fonctionne réellement, tu sais, ce sont deux critères différents. On peut réussir en tant que fournisseur d’entreprise et avoir quand même rien qui fonctionne vraiment.

Il y a eu des concurrents qui ont fait toute leur carrière en procédant ainsi. Mais il m’a fallu réellement quelques années pour réaliser que cela ne marchait tout simplement pas, et que cela ne marcherait jamais. Que la perspective dominante, la perspective de la supply chain, fondée sur cette approche entièrement déterministe où il n’existe aucune incertitude, ne conduisait pas au succès imminent. Il ne s’agissait pas d’obtenir encore ce 1 % supplémentaire de forecast accuracy qui, soudainement, permettrait de faire marcher les choses.

Non, il m’a fallu plusieurs années, plutôt quatre ans, pour en finir avec l’idée que malgré les progrès réalisés dans la prévision, malgré l’amélioration des processus, en améliorant tout, le succès n’était tout simplement pas au coin de la rue. Et ainsi, nous avons eu ce moment d’illumination, mais c’était plus par désespoir que par la suite d’une grande conversation avec quelqu’un de particulièrement éclairant. Quoi qu’il en soit, nous en sommes arrivés là petit à petit. Cela a pris du temps. Mais je dirais, avancé d’une dizaine d’années maintenant, que c’est devenu douloureusement évident. Je dirais que mes toutes premières années chez Lokad furent consacrées à tenter de résoudre les problèmes de supply chain sans intégrer l’incertitude. C’était simplement une impasse, et il m’a fallu quelques années pour en arriver là.

Warren Powell : Quels sont les défis que j’ai rencontrés, si je puis me permettre, venant du milieu académique, alors Joannes, quand je te parle, j’ai presque l’impression de m’adresser à un collègue académique, mais tu viens du secteur industriel. Mon laboratoire était inhabituel dès le premier jour. J’ai dû aller sur le terrain, frapper à la porte des entreprises et obtenir de l’argent. La National Science Foundation, qui finance de nombreux universitaires, avait une politique explicite dans mon domaine. Ils disaient : “Nous ne finançons pas la recherche. Nous la bénissons. Allez chercher de l’argent dans l’industrie, et ensuite nous saupoudrerons un peu de poussière d’ange NSF.”

Mais nous avons beaucoup trop d’universitaires, et cela persiste encore aujourd’hui, où ils ne collaborent pas avec l’industrie, travaillant donc avec des modèles inventés, prouvant leurs théorèmes, réalisant leurs travaux numériques, et ce, entièrement au sein de la communauté académique. Et cela est particulièrement vrai dans le cas de l’optimisation stochastique. Ce n’est pas aussi vrai avec le machine learning. Les spécialistes du machine learning se rendent sur le terrain, obtiennent des ensembles de données réelles, ajustent des modèles.

Ce n’est même pas vrai pour l’optimisation déterministe. Il n’y a pas de pénurie d’optimisation déterministe dans le monde réel. Mais ce que j’aime maintenant appeler des décisions séquentielles – ce qui, soit dit en passant, m’éloigne de ce mot stochastique – il y a quelque chose dans ce domaine : une mer de publications présentant des modèles inventés par des universitaires qui ne comprennent pas vraiment quels sont les problèmes réels parce qu’il est difficile de collaborer avec l’industrie, et il faut obtenir des entreprises, et j’ai eu des entreprises. Elles devaient travailler sur ce que l’on appelait plus tard le “bleeding edge”, où elles devaient être l’entreprise où j’ai appris ce qui fonctionnait et ce qui ne fonctionnait pas.

C’est vraiment un problème lié à la manière de fonctionner des universitaires. Pour ma part, j’ai eu une carrière de publication fructueuse, mais vers la fin, je me suis dit : “Tu sais, c’est un peu un jeu.” Pour être publié, il faut suivre un certain style exigé par les revues, et la communauté de l’optimisation stochastique n’est pas une seule communauté. Il y en a plus d’une dizaine. Chacune a ses propres langages, styles, outils et techniques, et elles en sont toutes très fières, prouvant leurs théorèmes et réalisant même des calculs, mais presque rien de tout cela ne fonctionne en pratique.

Conor Doherty : Eh bien, merci. Pour souligner ce point, la différence entre une approche purement académique et une approche plus pratique – nous parlions de la prévision déterministe par opposition à la prévision distributionnelle ou probabiliste. Je vais simplement utiliser le terme probabiliste par facilité. Warren, à toi de commencer, pour esquisser pour les personnes qui entendent cela pour la première fois cette dichotomie. Quelle est, selon toi, la différence entre la prévision déterministe et la prévision probabiliste, et pourquoi la probabiliste est-elle, disons, supérieure à ton avis ?

Warren Powell : D’accord, donc chaque fois que je rencontre quelqu’un du monde des affaires qui utilise le mot prévision, je dis immédiatement qu’il fait référence à une prévision ponctuelle. Tout le monde adore la prévision ponctuelle. Ils veulent savoir : “Je vais vendre 500 gadgets ou deux voitures ou il y aura six chargements de fret.” Ils adorent ce chiffre parce qu’il est exploitable. Il indique : “Oh, il y aura six camions, donc je dois avoir six conducteurs.”

Le problème, et d’ailleurs, cela se produit tous les jours dans le transport par camion complet, c’est que vous aurez un expéditeur de premier plan, mais il sait qu’il fait partie de vos meilleurs expéditeurs et il appellera et, pour citer les mots d’un répartiteur, dira : “Écoute, ce type peut avoir besoin de 10 à 20 camions.” Eh bien, c’est assez frustrant, mais c’est la réalité du dispatching. Or, dans les modèles de prévision, toutes les mathématiques sont conçues pour produire un chiffre unique.

Les gens aiment aussi avoir un chiffre unique. Il est exploitable, facile à comprendre. Si vous dites, “Écoutez, ce sera quelque part entre 10 et 20,” vous vous demandez combien de conducteurs je suis censé avoir pour satisfaire une demande comprise entre 10 et 20. Eh bien, je vais vous dire ce que font les camionneurs. Ils diront, “Eh bien, c’est un camionneur vraiment important. Peut-être que je n’aurai pas 20 conducteurs, mais peut-être 17. Mais s’il se présente et qu’il n’a besoin que de 12, alors je prendrai ces cinq conducteurs et les enverrai ailleurs.” Et ils auront ce que l’on appelle en optimisation une solution de repli. C’est comme, “Eh bien, si cela se produit, voici ce que je ferai.”

Mais tout le monde adore cette prévision ponctuelle. J’ai commencé à faire de la prévision distributionnelle dans les années 1990 lorsque je travaillais avec Yellow Freight. J’ai dit, “Écoutez, j’adorerais faire des intervalles de confiance,” et ils ont rétorqué, “Nos gars ne savent tout simplement pas comment gérer cela.” Notre plus gros problème, il n’y a pas si longtemps, nous travaillions avec un grand expéditeur qui s’était énormément enthousiasmé pour la prévision distributionnelle, puis il a dit, “Bon, prenons-la et voyons quelle est sa précision.” Je vois Joannes sourire. C’est comme, “D’accord, alors comment gères-tu le, ‘Oh, c’est génial, la prévision distributionnelle, ça a l’air cool. Quelle est sa précision ?’ Comment réponds-tu à cette question, Joannes ?”

Joannes Vermorel : Oui, enfin, avec quelque chose comme le cross entropy ou toute autre métrique qui fonctionne pour la prévision probabiliste, le CRPS en est une autre. Mais en effet, c’est le cas. Lorsque l’on entre dans le domaine de ces distributions de probabilité, on a toujours des métriques, mais elles ne sont pas aussi simples et intuitives que celles que l’on pourrait expliquer à des collégiens. La norme un, norme deux, les collégiens, vous saisissez un peu. Quelle est la distance ?

Lorsque l’on aborde les distributions de probabilité, pour être honnête, ce n’est pas si difficile. Ce n’est pas particulièrement compliqué si vous adoptez, disons, la méthode du maximum de vraisemblance ou autre. Ce n’est pas quelque chose pour lequel il faut avoir un doctorat en statistiques pour comprendre, mais cela prendra plus de deux minutes. Et quant à l’intuition, il vous faudrait probablement passer par le formalisme, ce qui prendrait environ une demi-heure, voire deux heures si vous êtes très ignorant.

Warren Powell : Oui, et à ce moment-là, les gens du monde des affaires commencent à décrocher et se disent, “Oh oui, j’ai compris. Alors, quelle est sa précision ?”

Joannes Vermorel : C’est quelque chose de très étrange. Il s’agit d’obtenir une prévision plus riche. Lorsque nous avons ces décisions que nous souhaitons optimiser, cela consiste à améliorer la profondeur de notre vision. Que vois-tu ? Je veux dire, tu fais une projection sur l’avenir, une déclaration concernant l’avenir. Mais pas seulement quelle précision, mais à quel point ta prévision est-elle complète, quelle en est la couverture ?

C’est vraiment quelque chose d’inusité, car avec la prévision ponctuelle, on obtient quelque chose d’une netteté incroyable. C’est un peu comme si tu prenais un microscope et que tu zoomais mille fois sur un point de ton bureau. Tu peux examiner un millimètre carré avec une vision parfaite, mais le reste de ton bureau reste invisible. Et les gens disent : “Oh, tu sais quoi ? Je pense que j’ai besoin d’un microscope plus grand pour pouvoir observer ce millimètre carré encore plus nettement.” Or, la prévision probabiliste, c’est “Non, tu devrais probablement jeter un œil sur le reste du bureau plutôt que de te concentrer uniquement sur ce point que tu vois déjà assez nettement comparé au reste.”

Warren Powell : Voici quelque chose que tout entrepreneur, surtout dans le secteur de la vente au détail, comprendra parfaitement : la couverture de la demande. Et ils diront, “Écoutez, nous voulons satisfaire 97 % de la demande.” Ce n’est pas une demande inhabituelle. Mais comment satisfaire 97 % sans le concept de prévision distributionnelle ? C’est ici que tu peux revenir en disant, “Oui, mais vous voulez couvrir 97 % de la demande. Je ne peux pas y parvenir tant que je n’ai pas de prévision distributionnelle. Me faut-il 20 unités supplémentaires ou 200 unités supplémentaires ?” C’est donc peut-être le prélude pour dire, “Écoutez, vous voulez couvrir un pourcentage élevé de votre demande. Je veux dire, personne ne veut couvrir la demande moyenne. Vous serez en rupture de stock la moitié du temps. Il faut donc apprendre à intégrer cette exigence commerciale très familière dans le, ‘Eh bien, si vous voulez cela, alors nous devons recourir à la prévision distributionnelle ou probabiliste.’”

Joannes Vermorel : Et le plus intéressant, c’est qu’une fois chez Lokad, nous avons commencé à faire cela en 2012, et pour faire le lien avec ton livre, il nous a fallu quelques années après avoir commencé la prévision probabiliste pour réussir à comprendre comment réaliser une optimisation sophistiquée par-dessus. Parce que, tu vois, je dirais que la prévision probabiliste a été difficile à accepter, du fait que nous devions l’adopter. Cela fut la première étape de mon parcours chez Lokad.

Il s’est avéré qu’en 2012, la prévision probabiliste était devenue très populaire, pour des raisons tout à fait différentes, dans le domaine du deep learning. Elles étaient très prisées dans le deep learning car les métriques de cross entropy, par exemple, fournissaient des gradients très abrupts qui facilitaient l’optimisation. Ainsi, la Deep Learning Community utilisait ces prévisions probabilistes, bien qu’elle ne s’intéressât absolument pas aux probabilités. Elle se contentait de la prévision ponctuelle, mais les gradients extrêmement abrupts obtenus essentiellement grâce au cross entropy offraient de très belles propriétés numériques pour faire fonctionner ces modèles.

Ce fut donc, disons, un léger écart. Nous avons commencé à utiliser ces prévisions probabilistes pour elles-mêmes, au lieu de n’être que des astuces numériques astucieuses pour les gradients. Mais une fois cela en place, vous réalisez que, d’accord, j’ai des décisions que je souhaite optimiser. Je veux choisir la meilleure option et, évidemment, il s’agit d’affaires récurrentes, de sorte qu’il y a en quelque sorte cette séquence de décisions.

Et finalement, vous vous retrouvez en vous demandant : “De quel outil logiciel ai-je besoin pour résoudre cela ?” Et c’est là, pour faire le lien avec ton livre, que se présente un problème très difficile, car le principal défi à lequel j’ai été confronté était même un semi-vide en termes de paradigmes. Il n’existe pas, comme tu l’as dit, une demi-douzaine de communautés où l’on pourrait publier, mais à mon sens, même aujourd’hui, il n’existe pas encore une communauté vraiment unifiée qui traite de ces problèmes liés à l’incertitude et qui souhaite optimiser et aller de l’avant. Ce n’est tout simplement pas le cas.

C’était donc un jeu de hasard. J’avais un peu fait de l’apprentissage par renforcement, de l’optimisation classique. Mon défi résidait vraiment dans ce manque de paradigmes. Et ce qui est assez intéressant dans ce livre très fourni, tu sais, de 1100 pages, c’est que tu proposes réellement tes propres paradigmes pour réfléchir au domaine et le découper en différentes parties. Et oui, je veux dire, ce livre reste vraiment unique en son genre. Il n’y en a tout simplement pas beaucoup.

Je veux dire, si vous souhaitez avoir un livre sur, disons, les classificateurs, il y a, vous savez, pour le machine learning, environ 500 livres qui vous présentent tous les classiques, allant de la classification linéaire aux machines à vecteurs de support, en passant par les arbres de gradient booster et autres. Il y a environ 500 livres qui encadrent le problème de la classification, etc. Ici, c’est encore vraiment, je dirais, quelque chose dans lequel, eh bien, désolé pour ma réponse très longue, la communauté ne s’intéresse pas encore vraiment au problème.

Warren Powell: Oui, le problème des décisions et de l’incertitude est un domaine incroyablement riche. Si vous vous tournez vers la programmation mathématique déterministe, il y a effectivement beaucoup de programmes mathématiques déterministes, mais ils suivent tous le paradigme fondamental instauré par George Dantzig. Vous avez une fonction objectif, une contrainte, une variable de décision, un algorithme. Bon, et comme tout le monde se conforme à ce cadre, le machine learning, les statistiques, le machine learning, encore une fois, c’est essentiellement une fonction que vous essayez d’ajuster aux données.

Maintenant, il existe de nombreux ensembles de problèmes différents, mais comme ils s’inscrivent tous essentiellement dans cette même approche, voici l’une des familles de fonctions. Ainsi, la plupart des livres de statistiques populaires vous exposeront à toutes ces fonctions différentes. Et donc, lorsque vous suivez un cours de statistiques ou de machine learning, pratiquement tout le monde ressort avec un ensemble d’outils sensiblement identique. Et cela leur permet également d’utiliser ces logiciels du domaine public.

Une fois que vous mélangez décisions et incertitude, en 2014, j’ai donné cette conférence, un tutoriel lors de l’INFORMS, et je l’ai intitulé “The Clearing the Jungle of Stochastic Optimization.” Et j’ai dû écrire un article tutoriel. Je me souviens toujours d’un des rapports des évaluateurs. L’un d’eux disait : “Oh, ce n’est pas si mal. Peut-être devriez-vous l’appeler ‘The Garden of Stochastic Optimization’.” Et j’ai éclaté de rire en disant : “Vous n’avez jamais essayé de publier un article dans ces domaines. C’est une jungle parce que vous avez toutes ces communautés différentes, bien plus d’une douzaine, et elles parlent des langues différentes. J’en ai compté huit systèmes de notation fondamentalement différents. Et puis, bien sûr, il y a les retombées.”

Donc, le reinforcement learning a adopté la notation des processus de décision de Markov, mais le contrôle stochastique a sa propre notation et la programmation stochastique, avec ses arbres de décision. C’est un véritable bazar. Mais chacune de ces approches possède une communauté assez importante. Ainsi, elles ont leur groupe de personnes qui parlent toutes le même langage. Et lorsque vous écrivez des articles, ils s’attendent à certaines choses.

J’ai dirigé un laboratoire qui était suffisamment grand et diversifié. Ainsi, alors que j’ai débuté et terminé dans le transport de fret, j’ai, entre-temps, dirigé tout un laboratoire sur les systèmes énergétiques. J’ai réalisé énormément de travaux sur l’optimal learning et la science des matériaux. Ce fut une expérience intéressante pendant un certain temps. Le e-commerce, la finance, et à Princeton, vous devez réaliser un mémoire de fin d’études de premier cycle. J’ai supervisé environ 200 mémoires. Et croyez-moi, quand vous supervisez suffisamment d’étudiants et abordez une grande diversité de problèmes, à l’époque où je venais d’écrire mon livre ADP et je pensais, “Wow, ADP est génial. Regardez, je peux optimiser des compagnies de transport par camion. Et ce n’est pas factice. C’est du réel. Il fut un temps où je disais : “Mais ce n’est pas juste une application farfelue. C’est une application industrielle réelle. Ça doit pouvoir tout faire.” Eh bien, je me suis complètement trompé.

D’accord, c’était lors de la deuxième édition de mon livre ADP que j’ai rédigé un chapitre, le chapitre six, qui disait : “Vous savez quoi, il semble y avoir ces quatre classes de politique.” Je n’avais pas les quatre. J’en avais trois. La quatrième, je me suis trompé. Et six mois après l’avoir envoyé à l’éditeur, je me suis exclamé : “Oh mon Dieu, j’ai trouvé la quatrième classe de politique.” Et à partir de là, jusqu’à la parution du grand livre en 2022, j’ai continué d’évoluer, j’ai écrit un autre article tutoriel en 2016, puis le grand moment est arrivé lorsque l’European Journal of Operational Research m’a invité à rédiger un article de synthèse.

C’est alors que Roman Slowinski, l’un des rédacteurs en chef, m’a invité à le faire, et cet article a fini par constituer le plan de ce grand livre. Dès que j’ai terminé cet article, je me suis dit : “Bon, c’est le nouveau livre”, et j’envisageais de faire une troisième édition de mon livre ADP, mais j’ai réalisé : “Non, je ne peux tout simplement pas, ADP, signifiant ici l’approximation de la fonction de valeur, est un outil très puissant pour un nombre très restreint de problèmes, et si vous avez un marteau, et que vous avez votre marteau préféré — et nous avons tous nos marteaux favoris, tout le monde en milieu académique a son marteau favori — vous pouvez trouver des problèmes qui s’adaptent à votre marteau.”

Mais si vous venez d’un domaine d’application, prenons un domaine d’application riche comme la gestion de la supply chain, eh bien, vous allez avoir besoin d’une boîte à outils. Vous ne pouvez pas aborder la gestion de la supply chain avec un simple marteau, et peu importe le marteau que vous possédez, vous devrez y aller avec une boîte à outils complète, car réaliser des prévisions distributionnelles, c’est bien beau, mais au final, il faut prendre une décision, ce qui signifie que vous prenez une décision dans l’incertitude.

Conor Doherty: Eh bien, merci. Je vais immédiatement te passer la parole, Joannes. Est-ce que cela correspond à ta vision de la manière dont nous prenons des décisions ici chez Lokad, dans le contexte de la gestion de la supply chain ?

Warren Powell: Eh bien, l’une de mes plus grandes transitions, c’est que j’ai cette diapositive PowerPoint que j’adore. J’ai environ quinze livres qui s’y rapportent, tous traitant d’une sorte de problème de décision séquentielle. Chacun de ces livres, dont l’un est mon livre ADP, est comme un marteau cherchant un clou. Nous avons tous notre technique favorite pour prendre des décisions, si bien que les livres ont été écrits autour d’un ou deux marteaux fondamentaux.

Si vous venez d’applications, vous commencerez à réaliser que tous ces marteaux sont bons. Aucun d’eux ne fonctionne pour tous les problèmes. Quand vous venez réellement d’un côté applicatif, vous ne pouvez pas choisir votre problème. Les universitaires travaillant sur des méthodes, eux, choisissent le problème sur lequel tester leurs méthodes. Quand vous venez d’une application, vous ne pouvez pas. On vous dit : “Voici le problème à résoudre. Qu’allez-vous faire ?”. Et mon grand accomplissement professionnel a été de réaliser que toutes ces méthodes se répartissent en ces quatre classes, puis dans l’article de 2019, j’ai compris que ces quatre classes se regroupaient en deux grandes catégories.

La catégorie la plus simple prend une décision basée sur une fonction qui ne planifie pas l’avenir, mais qui possède des paramètres modulables qu’il faut ajuster pour qu’ils fonctionnent bien dans le futur. L’exemple le plus simple dans les supply chains est celui du passage de commande de stocks. Lorsque les stocks descendent en dessous d’un certain niveau, vous passez commande pour atteindre un autre niveau. Je ne prévois pas l’avenir. Je ne planifie pas. Ce n’est qu’une règle, mais ces niveaux de commande doivent être ajustés pour fonctionner correctement au fil du temps.

Le deuxième, et probablement le plus simple, est généralement un modèle d’optimisation déterministe, simplifié, mais avec des paramètres modulables. C’est ce que j’ai baptisé “cost function approximation”. On ne le trouve nulle part ailleurs qu’en priorité dans mon grand livre, même s’il est largement utilisé dans l’industrie. Les professionnels diraient : “Oui, nous faisons cela tout le temps. Nous pensions simplement que c’était une astuce de l’industrie.”

Je me suis rendu compte que si vous prenez un programme linéaire qui est une approximation d’un problème stochastique complexe, puis que vous y intégrez des paramètres modulables pour prendre en compte des éléments tels que des stocks tampons, des corrections de rendement ou une marge de sécurité, par exemple, les compagnies aériennes font cela en se disant : “D’accord, quand je vole d’Atlanta à New York, il pourrait y avoir un retard dû au mauvais temps. J’ajoute donc 20 minutes supplémentaires.”

Réaliser ces problèmes déterministes avec des paramètres modulables est exceptionnellement puissant. Les universitaires ont tendance à le réduire en disant “Oh, ce n’est que du non-sens déterministe”. J’en suis venu à penser que ce n’est pas sans ressembler à la prévision paramétrique. Ainsi, quand vous faites des prévisions, vous savez que la demande est une fonction du prix. Eh bien, un prix plus élevé entraînera une demande plus faible. Imaginons une fonction décroissante, peut-être simplement une ligne, peut-être une courbe en S, et ajustons la meilleure fonction possible. Nous pouvons faire la même chose avec des modèles déterministes paramétrés.

Maintenant, les universitaires adorent l’autre classe de politiques. Ce sont celles qui prennent une décision maintenant en planifiant pour l’avenir. Par exemple, si je prends une décision maintenant, j’agis immédiatement. Disons que je dispose d’une certaine quantité de stocks. Je réapprovisionne mes stocks. Cela me place dans un certain état dans le futur, et j’en retire la valeur. C’est ce que l’on appelle la programmation dynamique ou l’équation de Bellman. Les universitaires raffolent de l’équation de Bellman, ou, si l’on vient du milieu de l’ingénierie, on parle de l’équation Hamilton-Jacobi. Et si vous suivez un cours dans n’importe quelle bonne université qui enseigne comment prendre des décisions dans le temps en situation d’incertitude, la première chose qu’ils vous montreront sera l’équation de Bellman.

J’ai écrit un livre de 500 pages entièrement consacré à l’approximation de l’équation de Bellman. J’en étais très fier. C’est une technique puissante qui fonctionne pour énormément de problèmes. Bon, honnêtement, allez dans une communauté d’affaires où les gens prennent des décisions séquentielles et demandez-leur : “Combien ont déjà entendu parler de l’équation de Bellman ?” et la quasi-totalité dira non. Personne n’utilise l’équation de Bellman.

La toute dernière catégorie est celle du look ahead complet. Je prends Google Maps comme exemple. Si vous voulez planifier un itinéraire vers une destination, vous devez planifier sur l’ensemble du parcours. Il existe plusieurs modèles de planification qui nécessitent de se projeter dans l’avenir. Ils n’utilisent pas une fonction de valeur. Ils élaborent explicitement un modèle complet pour l’avenir, et cela se fait bien plus souvent que de sortir et de faire une approximation de la fonction de valeur.

Les universitaires adorent donc ces techniques plus avancées. Quand vous entrez dans le monde réel, vous trouverez principalement l’une des trois catégories de politiques : les règles simples telles que “order up to”, “buy low, sell high” ou “wear a coat”. Pour les problèmes plus complexes, j’utilise un modèle déterministe qui n’est pas trop compliqué. J’y intègre quelques paramètres modulables, puis je les ajuste. La troisième technique est le look ahead déterministe, à l’image de Google Maps. Ce sont les trois grandes catégories.

Je pense que si vous pouviez dresser la liste de toutes les décisions que chacun prend, en tout lieu et en toute circonstance, 97% de ces décisions seraient prises avec ces trois catégories de politiques. Devinez quoi ? Elles ne sont pas mises en avant dans les livres. C’est vers cela que je me dirige. Une grande partie de cette réflexion, je vais la vous attribuer ; vous ne trouverez pas cette discussion particulière même dans mon grand livre, donc cela devra attendre la deuxième édition.

C’est mon moment “aha” où je me suis dit, vous savez, prenons les quatre classes de politiques, prenons le look ahead, et divisons-le en deux : le look ahead déterministe et le look ahead stochastique. Maintenant, j’en ai cinq politiques, et je me suis demandé lesquelles d’entre elles étaient les plus utilisées. La catégorie un, la plus répandue, regroupe ces trois premières : les approximations de fonctions de politique comme les règles simples, les approximations de fonctions de coût qui sont déterministes paramétrées, et le look ahead déterministe. Ce sont les trois grandes.

Il arrive toutefois que nous ayons besoin d’un look ahead stochastique. Par exemple, je commande depuis la Chine ; cela prend normalement cinq semaines, mais cela pourrait prendre sept. Eh bien, si vous vous dites, “Bon, je prévois sept semaines”, c’est en réalité une forme de look ahead stochastique que l’on appelle l’optimisation robuste utilisant une prévision probabiliste. Parce que je prévois le maximum possible plutôt que le scénario habituel.

Les approximations de la fonction de valeur, sujet de mon précédent livre, se situent tout en bas. Honnêtement, je pense que c’est un excellent outil pour de nombreux problèmes. Si vous en avez vraiment besoin, il vaudrait mieux faire appel à un expert, mais pour le quotidien, vous n’allez tout simplement pas l’utiliser. C’est bien trop difficile à mettre en œuvre.

Maintenant, certaines personnes parleront de reinforcement learning. Dans les débuts, le reinforcement learning n’était qu’un autre nom pour la programmation dynamique approchée. Ce n’étaient que différents termes pour désigner la même chose. La communauté ORL a découvert exactement ce que j’avais découvert ; ils se sont rendu compte, “Wow, cela ne fonctionne pas toujours.” Si vous comparez la première édition du livre de Sutton et Barto, où vous ne verrez que de la programmation dynamique approchée, et passez à la deuxième édition, si vous savez ce que vous cherchez, vous trouverez les quatre classes de politiques dans cette deuxième édition. Mais je pense toujours que la plupart des gens, lorsqu’ils disent utiliser le reinforcement learning, veulent dire la programmation dynamique approchée. Les informaticiens sont bien meilleurs que nous tous pour commercialiser leurs outils.

Conor Doherty: Eh bien, merci. Je vais te passer directement la parole, Joannes. Cela correspond-il à ta façon de voir comment nous prenons des décisions ici chez Lokad ?

Joannes Vermorel: Enfin, pas tout à fait, mais pour être juste, cette répartition est, je crois, très techniquement correcte selon la manière dont on découpe le domaine. Je ne remettrai pas en cause ce point. Et quand je parle du domaine, j’entends le modèle intellectuel commun sur lequel nous nous sommes mis d’accord, avec des fonctions de transition d’état et une fonction de récompense, et ensuite, nous voulons optimiser ces décisions, etc. Donc, ici, si nous le prenons sous cet angle, je dirais que la manière dont tu le décris est correcte.

Mais la manière dont j’aborde personnellement le problème se fait sous des angles relativement différents. Ma première perspective, même avant d’envisager la liste des techniques, serait : qu’en est-il de l’énoncé du problème lui-même ? Le cheminement vers l’énoncé du problème est crucial. C’est une critique un peu injuste de ce livre parce qu’il fait déjà 1100 pages, et apparemment, vos éditeurs ne voulaient pas d’un livre de 3000 pages.

Chez Lokad, quand nous abordons cela, la première question que nous nous posons est jusqu’où nous devons approximer l’état. On pourrait penser que c’est une évidence, mais ce n’est pas le cas. Vous modélisez toujours le monde réel, et vous ne le modélisez pas jusqu’à la position de chaque atome, il y a donc une énorme marge de manœuvre dans la définition de ce que constitue un état. Ensuite, il y a la fonction de transition, qui, elle aussi, offre une grande latitude quant à la manière dont on peut passer d’un état à une autre version de cet état.

Je crois que cela fait partie de la résolution du problème. Si vous faites le mauvais choix à ce stade, si vous définissez un état de manière beaucoup trop granulaire ou si la fonction de transition est beaucoup trop complexe, vos outils s’effondreront par la suite. Donc, pour moi, la première chose est de prendre la bonne décision et d’avoir le bon paradigme pour cela. Il en va de même pour la fonction de coût ou la fonction de récompense.

Nous avons un cas classique pour des clients qui doivent évaluer le coût d’une rupture de stock ou le coût d’accorder une remise. Si vous accordez une remise une fois, vous cédez une partie de votre marge. Ce n’est pas grave, vous pouvez le mesurer, c’est assez simple. Mais ensuite, vous créez aussi une mauvaise habitude, car les gens s’attendent à ce que cette remise soit de nouveau appliquée. Vous vous créez donc un problème pour plus tard.

Il est très difficile d’évaluer précisément le comportement, combien de fois les gens se souviendront de vos remises précédentes, etc. C’est votre fonction de transition ; vous devez l’approximer. Pour moi, la première étape consisterait à faire des approximations avant d’approximer les différents rouages du processus algorithmique avec ce cadre.

Ma perspective commence plus tôt, avec la définition même des modèles. Je ne considère pas que le modèle en général, ce que vous voulez optimiser, soit acquis d’avance. Pour moi, cela fait partie de la méthodologie. Ce serait la première chose. Désolé, je n’ai pas fini. La deuxième chose, qui relève davantage de mon parcours en informatique, est d’examiner la dimension du problème.

Il est très différent d’attaquer un petit problème, comme quelques milliers de décisions, par exemple un itinéraire dans une ville avec quelques centaines de livraisons, etc. Pour moi, mille décisions constituent un problème très minime. Nous avons des problèmes où nous avons jusqu’à un milliard de variables. Si nous nous intéressons à une grande supply chain, comme un hypermarché, vous pouvez avoir dans un hypermarché 100 000 SKUs. Si vous avez mille hypermarchés, cela donne 100 millions de SKUs. Pour chaque SKU, il y a une demi-douzaine de décisions, et vous répétez cela quelques semaines dans le futur. Vous pouvez donc vous retrouver avec des problèmes soit super petits, comme l’optimisation d’itinéraire, soit très grands, qui ne tiendraient même pas en mémoire.

Pour moi, ce serait le type de problème où, si je devais l’aborder, je commencerais par essayer de capter les caractéristiques clés du problème. La dimensionnalité en fait partie. Une autre caractéristique, tout aussi importante, sera la difficulté de progresser vers une solution meilleure. Si je prends ces deux exemples, l’optimisation d’itinéraire est quelque chose de très non linéaire, très fragile. Il vous suffit de déplacer, d’échanger deux emplacements, et vous pouvez passer d’une solution très médiocre à une solution excellente rien qu’en échangeant deux points. Votre solution se comporte donc un peu comme un cristal : elle présente cette fragilité. Il est très facile de la perturber et de passer de quelque chose de bien à quelque chose de très terrible.

D’un autre côté, si je considère ce spectre de problèmes avec mon réseau de supermarchés, si je décide de placer une unité qui était censée être ailleurs, le problème devient très insensible. Vous disposez d’une grande marge de manœuvre. Vous cherchez à obtenir quelque chose de beaucoup plus correct d’un point de vue directionnel. Ce spectre va des propriétés cristallines aux propriétés de boue. Les propriétés cristallines sont fragiles et cassantes, et se brisent facilement, tandis que les propriétés de boue sont informe. Tant que vous êtes correct directionnellement, c’est acceptable. Ce serait la deuxième considération.

La troisième concerne la caractéristique temporelle que vous recherchez. Les exigences temporelles vont du pilotage de robots dans un entrepôt, où vous voulez des réponses en temps constant et une utilisation de mémoire constante en quelques millisecondes, à d’autres contextes. Quand on dit que vous avez 10 millisecondes pour fournir une réponse, sinon, nous avons toutes sortes de problèmes, contrairement à un autre problème comme l’achat à l’étranger, où il faudra 10 semaines pour venir de Chine. Si votre calcul prend 24 heures, ce n’est pas un problème. Nous pouvons nous permettre ces 24 heures ; nous n’avons aucune contrainte.

Voilà un peu comment je segmente le domaine. Je comprends que la manière dont je segmente le domaine n’en dit pas long sur les algorithmes que vous souhaitez utiliser, mais je m’en sers pour éliminer ce que je considérerais même comme des solutions potentielles pour le type de problèmes qui m’intéressent.

Warren Powell : J’adore que vous veniez d’un domaine d’application. L’une des choses que j’ai constatées lorsque j’ai commencé à écrire mon livre sur l’analytics supply chain, qui est le premier livre que j’ai jamais écrit autour d’une classe de problèmes, c’est que tous mes autres livres se sont fondamentalement concentrés sur les méthodes, et c’est très amusant.

Maintenant, reconnaissez mon grand livre sur un point : j’ai un chapitre entier, de 90 pages, dédié à la modélisation, mais abordée de manière très générique. J’apprécie absolument tout le processus que vous avez décrit. Ceci est une variable d’état. Dans des problèmes complexes, j’ai quelques tutoriels où je dis que nous avons cinq éléments du problème, en commençant par les variables d’état. Mais lorsque je fais de la modélisation, je traite la variable d’état en dernier.

De plus, cela est vraiment itératif. Vous allez passer par un processus de modélisation. La variable d’état n’est qu’une information. Vous parcourez le modèle et vous vous dites : d’accord, j’ai besoin de ceci, de cela, de cela—ah, voilà ma variable d’état. Mais, par exemple, comment prenez-vous des décisions ? Cela dépend de la manière dont vous modélisez l’incertitude. Comment modélisez-vous l’incertitude ? Cela dépend de la manière dont vous prenez des décisions.

J’explique donc le processus de modélisation de l’incertitude et de prise de décision comme l’ascension de deux échelles. N’arrivez pas avec une méthode incroyablement sophistiquée pour prendre des décisions sous incertitude si votre modèle ne comporte qu’un modèle probabiliste très basique. Avec nos problèmes complexes, nous pouvons élaborer des modèles d’incertitude aussi compliqués que nous le souhaitons.

Généralement, vous ne partez pas d’un modèle des plus compliqués. Vous commencez par quelque chose de plus basique. Ensuite, vous voulez disposer de quelque chose qui prend des décisions. Il n’est pas nécessaire de faire quelque chose d’incroyablement compliqué, puisque ce n’est qu’un modèle élémentaire. Une fois que vous avez un modèle de décision décent, vous pouvez revenir à votre modèle d’incertitudes, car peut-être souhaitez-vous désormais obtenir d’autres indicateurs de risque.

Maintenant, vous voulez que les décisions prennent en compte le risque. Vous gravissez donc cette échelle, et je suis sûr que l’ensemble de votre processus chez Lokad a été itératif. Nous voulons toujours le modèle le plus simple qui résout le problème. La question est : qu’est-ce qu’il faut pour atteindre les objectifs commerciaux ? Et c’est un processus d’apprentissage.

Joannes Vermorel : Absolument. Je rends du crédit à votre livre. Je pense que vous y énumérez, je crois quelque chose comme, j’oublie, environ 15 types différents d’incertitude, et c’est probablement la liste la plus longue que j’aie vue, et oui, c’est une préoccupation bien réelle. Quand vous parlez d’incertitude, les gens pensent, oh, vous ne parlez que des imprécisions de la prévision ponctuelle. Et je dirais, certainement pas, il existe tant de sources d’incertitude. Cela peut être le prix des commodités dont vous dépendez qui varie, cela peut être la main-d’œuvre dont vous dépendez, qui peut faire grève, ne pas être qualifiée ou tout simplement absente.

Il peut également s’agir de la possibilité d’avoir des problèmes de logement dans vos sites. Ici, on envisage l’incertitude uniquement à travers le prisme des imprécisions de vos ventes, car ce n’est qu’un aspect : la prévision de la demande en ventes, la prévision ponctuelle des ventes, c’est extrêmement restreint. Je suis tout à fait d’accord avec vous. Être super itératif chez Lokad est exactement ce que nous faisons, ce qui soulève une autre question, une grande préoccupation, à savoir la productivité des ingénieurs que vous devez mobiliser pour itérer plus rapidement.

Chez Lokad, la manière dont nous abordons généralement ces problèmes d’optimisation stochastique est d’identifier des programming paradigms. Nous avons une collection de ces paradigmes. Ils ne sont pas unifiés, mais plutôt comme une petite bibliothèque de choses que vous pouvez utiliser. Ces paradigmes vous offrent un angle pour avancer relativement rapidement dans la mise en œuvre de votre solveur. Ici, je suis entièrement d’accord avec le processus itératif. Le défi, d’un point de vue commercial, est que mes clients sont très impatients.

Nous devons itérer très rapidement, mais nous traitons de quelque chose de compliqué impliquant de l’algorithmique poussée. Ils doivent faire implémenter leur algorithme dans un temps fini. Une autre considération, rarement évoquée, est que nombreuses sont les méthodes que j’ai vues dans les livres et qui fonctionnent si vous avez des professeurs d’université super intelligents avec une décennie pour implémenter l’algorithme. Dans le monde réel, si vous avez 100 heures pour l’implémenter, certaines méthodes sont incroyablement difficiles à réussir au niveau de l’implémentation. C’est pourquoi disposer de ces paradigmes de programmation aide. Ils offrent une manière de coder qui fonctionnera en production dans un temps fini tout en permettant d’itérer sur le processus.

Warren Powell : Vers la fin du chapitre 11, je crois que dans la toute dernière section, j’ai une sous-section sur les aspects moins techniques de l’évaluation des politiques. Ainsi, dans le livre, j’écris partout que l’optimisation de politique consiste à maximiser sur les politiques, en prenant l’espérance de quelque chose. Vers la fin du chapitre 11, téléchargeable depuis le site, j’énumère environ cinq qualités différentes, dont la complexité méthodologique qui en fait partie. Quand on examine une méthode, absolument, ce que vous venez de dire est très important : la tractabilité computationnelle, la transparence. Nous avons tous codé des algorithmes, et la solution obtenue est telle, ce qui nous laisse perplexes, et le client ne comprend pas, alors vous voulez pouvoir dire : eh bien, voici pourquoi le résultat est ainsi, car cela pourrait être dû à une erreur de données, ou à un changement de règle.

Je veux dire, chez Optimal Dynamics, nous obtenons ces données des compagnies de camionnage et nous vivons toutes les mêmes anecdotes que vous rencontrez, et lorsqu’ils n’aiment pas une réponse, ils souhaitent qu’elle soit corrigée rapidement. L’un des outils graphiques les plus puissants et importants que j’ai développés dans mon laboratoire à l’université est un outil appelé Pilot View, qui comporte deux modules. L’un est une carte où vous pouvez observer les flux et les filtrer de mille manières sophistiquées, et l’autre, que j’appelle mon microscope électronique, vous permet d’afficher des chauffeurs individuels et des chargements individuels, de cliquer sur n’importe quel élément et de voir quel chauffeur a été assigné à quel chargement, mais pas seulement cela : quels chargements nous avons envisagés, car si j’ai un millier de chauffeurs et un millier de chargements, je ne peux pas examiner toutes les combinaisons possibles de ces un million de possibilités, et cela n’a rien à voir avec l’algorithme, mais tout avec le générateur de réseau.

Nous utilisons donc des outils sophistiqués, mais il se peut que j’aie un chauffeur que je n’ai pas assigné à un chargement, pourquoi ? Eh bien, peut-être parce que la pénalité était trop élevée, peut-être parce que le coût était trop important, ou peut-être parce qu’une de mes règles d’élagage ne l’a tout simplement pas pris en compte, et cela s’est produit. Et bien sûr, quand le client se plaint, vous avez besoin d’une réponse très rapidement, car une fois sur le terrain, c’est fini pour les algorithmes compliqués.

Joannes Vermorel : Je m’identifie énormément à cela. Je ne suis pas l’auteur de cette observation, je l’ai trouvée sur Internet, je ne me souviens plus exactement de qui l’a formulée, mais l’essentiel était que, pour déboguer un algorithme, il vous faut être deux fois plus intelligent que pour l’implémenter.

Donc, si vous optez pour un algorithme qui est déjà implémenté avec tout votre génie, cela veut dire qu’une fois en production, lorsque vous voudrez déboguer, il vous faudra être deux fois plus intelligent, ce qui n’est même pas possible, puisque l’implémentation représentait déjà le meilleur de vous-même. Il vous faut donc une solution qui ne soit pas le reflet de votre maximum, afin que, lorsque vous voudrez la déboguer, vous puissiez le faire. De plus, je suis tout à fait d’accord avec ce que vous décrivez, à savoir cet outil de support. Le rôle de l’instrumentation est absolument fondamental et, je pense, c’est également quelque chose d’important, bien que difficile. Ce livre contient énormément de choses, je vous le reconnais, ce n’est pas un livre qui manque d’insights, le rôle de l’instrumentation est primordial.

La communauté classique de l’optimisation, dans le sens déterministe, se contenterait de dire : de combien de secondes CPU avez-vous besoin et quelle est la performance de la solution obtenue, et c’est tout. Mais lorsque vous entrez dans le domaine de l’optimisation stochastique, vous aurez besoin d’une instrumentation de support étendue pour comprendre ce qui se passe. Et je pense que c’est aussi quelque chose où il existe un type d’écart paradigmatique dans la manière de l’approcher, car cela signifie qu’il ne s’agit pas seulement de l’outil qui vous permet de générer la décision, mais aussi de tous les instruments que vous pouvez ajouter pour comprendre votre processus de prise de décision, non pas nécessairement une décision isolée, mais l’ensemble du processus, et sans cela, les gens soulèveraient des inquiétudes, et vous resteriez bloqué, incapable de simplement dire : faites-moi confiance, c’est bon. Dans l’optimisation stochastique, cela ne fonctionne pas aussi bien que dans l’optimisation mathématique classique.

Warren Powell : Oui, c’est évidemment un beau défi que de travailler avec l’industrie. J’ai fait cette expérience depuis le début de ma carrière. Ce n’est qu’au début des années 1990, lorsque j’ai créé mon laboratoire et embauché quelques programmeurs professionnels — tous titulaires d’un doctorat, mais là uniquement pour coder — que, sans ces deux personnes, mon laboratoire n’aurait jamais décollé. C’est incroyable comment, je ne sais pas si cela vous est déjà arrivé, votre algorithme présente une solution qui ne vous convient pas, qui ne plaît pas au client, et tout le monde se retrouve autour de la table, se grattant la tête en se demandant ce qui ne va pas, chacun avançant une théorie basée sur son domaine de compétence. Alors je me dis : Oh mon Dieu, je pense que l’algorithme pourrait être plus sophistiqué, pendant que l’un s’inquiète des données et l’autre d’une erreur de programmation, et à chaque exercice, différentes personnes proposent une hypothèse, et nous finissons tous par avoir tort.

C’est vraiment incroyable. Évidemment, j’aimerais m’asseoir avec vous à un moment donné et en apprendre davantage sur vos problèmes pour obtenir les données brutes. Dans mon secteur du transport de camions, nous ne travaillons qu’avec des transporteurs qui utilisent déjà un système TMS commercial, et cela ne signifie pas que c’est parfait, mais cela montre que nous sommes bien plus avancés. Mais c’est un défi, c’est très amusant. Une chose que j’aimerais que nous fassions davantage serait de défier la communauté académique avec des problèmes du monde réel, et j’ai, en quelque sorte, renoncé à la communauté académique.

Ils ne sont pas là pour résoudre des problèmes, ils sont là pour démontrer des théorèmes et rédiger des articles. J’ai vécu ce monde pendant presque 40 ans, et je le comprends, mais je pense qu’il est fondamentalement défaillant. Ainsi, une chose que j’ai eue avec mes entreprises de transport de marchandises, c’est qu’elles étaient toutes prêtes à partager des données. Ce n’est pas le cas avec les expéditeurs.

Je n’ai jamais rencontré d’expéditeur prêt à partager des données de supply chain. C’est hors de question, ils ne vont pas le faire. J’ai réalisé un grand projet de supply chain pour Pratt and Whitney, le fabricant de moteurs à réaction, et il était financé par le gouvernement et approuvé par la société qui les possédait, appelée United Technologies, mais ils n’ont même pas voulu écouter une proposition de partage de leurs données. Ils ont dit, “Oh mon dieu, c’est bien trop exclusif.”

Et donc, ils se sont engagés avec enthousiasme dans le projet où nous devions écrire notre propre générateur de données sophistiqué et inventer des demandes aléatoires partout dans le monde, et ils ont dit, “Non, certains de nos fournisseurs sont vraiment secrets, vous savez, nous ne pouvons même pas laisser quelqu’un savoir qu’il existe un fournisseur qui fait cela n’importe où dans l’État du Connecticut.” Ils ont tout simplement dit non, ce serait, ce serait trop d’informations.

Il est donc difficile de traiter ces problèmes du monde réel dans un environnement où l’on ne peut pas obtenir les données. Je me suis inscrit à l’Université Rutgers, je suis désormais executive in residence dans leur département de gestion de la supply chain, et j’espère les convaincre de créer un simulateur avec de fausses données, en essayant au moins de les amener à travailler sur des problèmes réalistes simulés.

Joannes Vermorel : Je me retrouve parfaitement dans la série de problèmes auxquels vous avez fait face. Je pense que je venais de l’autre extrémité du spectre de la supply chain. D’un côté, il y a le transport routier qui relève presque de décisions finales à court terme, et encore plus extrême serait le pilotage de robots, c’est une extrémité du spectre.

À l’autre extrémité du spectre, il y a le S&OP, ventes et opération, un plan ultra macro au niveau de l’entreprise, et tout le reste. Ensuite, il y a tout ce qui se situe entre les deux. Pour ma part, mon parcours venait de l’autre bout, du S&OP, très stratégique, très axé sur la prévision. Les premières années de Lokad, il n’était même pas question de décisions, c’était juste de la prévision pure.

Pour revenir à votre préoccupation, mon problème était que je constatais, dans le milieu académique – d’ailleurs, je suis un décrocheur de doctorat, je n’ai donc pas rendu mon directeur de thèse fier, et j’ai abandonné mon doctorat sans complexe pour créer Lokad – que le monde académique se focalise sur la précision de la prévision, en publiant 20 000 modèles pour améliorer les prévisions de ventes depuis la nuit des temps.

Dans l’industrie, nous avons exactement la situation que vous décrivez : dix personnes s’assoient autour de la table, chacune examine le problème sous son angle, et lorsqu’il s’agit de prévision – qui est l’étape pré-décisionnelle, juste avant de passer à l’action –, d’abord, elles veulent établir la prévision. Les gens luttent pour orienter la prévision vers le haut ou vers le bas.

Dans le S&OP, vous avez des commerciaux qui veulent sous-estimer la prévision, afin d’obtenir une prévision de ventes très basse pour pouvoir dépasser les attentes. Ensuite, vous avez des personnes de la production qui veulent gonfler la prévision, car si elles la gonflent, elles disposeront d’un budget plus important pour leurs actifs de production et, par conséquent, quelle que soit la commande qu’elles finiront par fabriquer, si elles ont plus de capacité, ce sera plus facile.

Il y a cette lutte où le service commercial veut faire chuter les chiffres, tandis que la production souhaite les envoyer vers les sommets, et ce n’est pas vraiment rationnel. Ce qui est intéressant, c’est que dans le milieu académique, des chercheurs publiaient un article dans lequel ils trouvaient une méthode incroyablement sophistiquée, s’appuyant sur une obscure théorie russe, pour éliminer 0,1 % de biais.

Puis on se retrouve dans cette salle avec une lutte où des personnes disent littéralement, “Je veux moins 50 %”, et une autre répond, “Je veux plus 50 %.” Cela crée une sorte de décalage. Accéder aux données a toujours été incroyablement douloureux.

Warren Powell : Une question sur la prévision, et j’aimerais savoir comment vous gérez cela. Il y a beaucoup de mathématiques pour utiliser l’historique afin de prévoir l’avenir, mais nous savons que très souvent l’avenir sera très différent du passé, pour de multiples raisons, et surtout, et je ne sais pas si l’avenir va monter ou descendre, mais je sais qu’il pourrait être bien différent de tout ce que j’ai vu jusque-là. Puis-je vous demander comment vous y faites face ?

Joannes Vermorel : Oui, absolument. La méthode typique consiste à introduire une sorte d’incertitude macro qui n’est pas exactement justifiée. Cela semble étrange. On pourrait penser : d’accord, nous avons la prévision de la demande, très bien, et nous allons ajouter une variable selon laquelle il y a 4 % de chance chaque année d’avoir une forte baisse de 30 % de la demande, de l’activité, de tout.

Puis les gens disent, “Wow, une baisse de 30 % en un an, c’est énorme. Pourquoi envisageriez-vous cela ?” D’après moi, si l’on regarde le 20e siècle, il y a eu deux guerres mondiales, ainsi qu’une série d’autres conflits. Puis, plus récemment, nous avons eu des confinements mondiaux et autres. Donc, dire que tous les 25 ans un astéroïde vient frapper votre industrie, je ne pense pas que cela soit si farfelu.

Mais les gens s’attendent à prévoir quelque chose qu’ils connaissent, et ici nous disons, non, vous n’avez pas vraiment besoin de tout savoir précisément. Vous pouvez simplement dire que nous allons supposer une grande disruption, peu importe ce que c’est, puis nous allons inventer des chiffres. Ces chiffres sont complètement fictifs, 4 % de probabilité annuelle, 30 % ; vous pouvez le modifier, vous pouvez dire cinq, ou 50 %.

Cela vous oblige à prendre en considération votre grande disruption en permanence. Nous servions, par exemple, des clients dans l’aviation. Les gens disaient, “Oh, ce n’est pas si fréquent.” Mais ça l’est, car quand on regarde l’industrie, par exemple, le Boeing 737 Max a été cloué au sol. Pour mon client, qui fournissait des avions et en possédait des dizaines, c’était un problème majeur.

En fin de compte, il faut accepter d’intégrer dans vos modèles des éléments incroyablement pessimistes. Cela reste généralement très difficile à vendre car ce n’est pas consensuel. Le problème n’est pas tant que les mathématiques soient insuffisantes, c’est qu’elles font peur, et les gens ne veulent pas avoir peur. Mais si vous ne vous préparez pas à ces événements majeurs à fort impact, vous serez pris au dépourvu. C’est aussi simple que cela.

L’autre chose, c’est que, d’une part, il faut accepter que c’est une vision très pessimiste : il faut se pencher sur ces grandes disruptions, s’y faire, et admettre qu’elles se produiront avec une certitude de 100 % si l’on leur laisse suffisamment de temps. C’est un aspect.

L’autre aspect est que la plupart de mes clients, lorsqu’ils envisagent l’incertitude et l’incertitude dans la prise de décision, ne voient que le mauvais résultat. Je pense que le problème vient de la variabilité. Les gens associent variabilité à issues négatives. Dans la production, des personnes comme Deming ont popularisé l’idée qu’il faut être constant. C’est une vertu cardinale. Il faut être absolument constant. Il est acceptable de produire des produits médiocres tant que c’est toujours médiocre. Ce sera bon marché, et les gens savent à quoi s’attendre.

Ce qui n’est pas acceptable, c’est de faire du bien et du mal en même temps. Non, il faut être absolument constant en toutes circonstances. Ainsi, les gens associent la variabilité en production à quelque chose de négatif. Mais est-ce vraiment le cas ? Une fois que vous quittez le monde de la production, la variabilité est-elle vraiment une mauvaise chose ? Naturellement, non.

Un exemple parfait serait la mode. Dans la mode, vous créez des produits qui peuvent être un succès ou un échec. Si vous pouvez augmenter la variance de vos succès et de vos échecs grâce à une loi qui présente une longue traîne, cela signifie qu’en augmentant la variance, oui, vous aurez plus d’échecs, mais vous pourrez aussi obtenir des succès d’un ordre de grandeur supérieur.

La variabilité dans la production est négative, mais dans la supply chain en général, ce n’est pas si mal. Si vous pouvez bénéficier d’un flux d’opportunités presque parfaitement constant, c’est super stable, mais si vous êtes perturbé, cela va vous anéantir, contrairement à quelque chose d’assez erratique, un peu cahoteux, où il y a une prise de risque constante que vous gérez soigneusement avec des décisions optimisées sous incertitude, de sorte que si vous commettez une erreur, cela ne vous tue pas.

Vous pourriez vous retrouver dans une situation où, lorsque la disruption survient, son impact n’est pas aussi important. Par exemple, si vous êtes dans une entreprise où vous vous attendez à ce que 98 % de vos produits soient reconduits d’une année sur l’autre, et que la loi change de sorte que 20 % de vos produits soient jugés illégaux parce que vous avez utilisé le mauvais produit, le mauvais processus, ou autre, cela sera un coup dur massif.

Vous étiez dans une entreprise où 2 % de vos produits changeaient chaque année, et maintenant 20 % sont éliminés en raison de la réglementation. Mais si vous êtes dans une entreprise où chaque année vous renouvelez, disons, 15 % de vos produits, eh bien, il y aura une année où vous atteindrez 20 %, mais vous pourrez vous rétablir beaucoup plus rapidement grâce à cette appétence pour les nouveautés que vous maintenez.

Toutes les incertitudes ne sont pas mauvaises. Parfois, en rechercher un peu est bénéfique. Par exemple, la plupart des praticiens de la prévision détestent prévoir les new products parce qu’ils n’ont aucun historique pour les séries temporelles. Si l’on regarde la littérature sur la prévision des séries temporelles, dans 99 % des cas, les gens excluent les produits sans historique. Pour moi, prévoir les produits sans historique est la chose la plus intéressante.

C’est là que se déroulent les véritables batailles de la supply chain. Ce sont ces produits qui sont nouveaux, qui pourraient être des succès et qui pourraient changer la trajectoire de l’entreprise. C’est donc une longue réponse à votre question.

Warren Powell : Je vais faire une remarque finale. L’une des choses que j’ai le plus appréciées dans mon cadre avec mes quatre catégories de politiques, c’est que cela me permet de dire : ne vous préoccupez pas de la décision. Nous choisirons l’une des quatre catégories, nous opterons pour quelque chose de raisonnable, ne vous inquiétez pas. Ce n’est pas le gros problème. Le gros problème, c’est la modélisation de l’incertitude. Si je peux éloigner les gens des complexités de la prise de décision sous incertitude pour qu’ils se concentrent davantage sur la modélisation des incertitudes, c’est la grande victoire.

Joannes Vermorel : Je suis entièrement d’accord avec vous. Les grandes entreprises, lorsqu’elles font face à l’incertitude, l’une des pires choses qu’elles puissent faire est d’inventer des règles pour réduire l’incertitude. Vous inventeriez des règles simplement pour simplifier votre problème. Par exemple, ils ont lu que UPS ne faisait que des virages à gauche dans ses circuits, et ensuite ils disent, d’accord, nous allons nous-mêmes ne faire que des virages à gauche parce que cela simplifie quelque chose.

Vous voyez que lorsque vous aviez autant de potentiel et d’options, tant d’incertitudes à gérer, l’une des approches les plus contre-productives est d’inventer toute une série de contraintes totalement inventées afin d’obtenir un problème qui devient plus gérable. Pour faire le lien avec vos cadres, je dirais que c’est la mauvaise méthode, car il existe des options pour aborder les vrais problèmes.

Alors, ne commencez pas à inventer des contraintes juste pour le plaisir, simplement parce que vous craignez qu’il n’existe jamais de solution pour votre problème. Il y a plein de solutions, donc vous devez retarder l’invention de règles et de contraintes uniquement dans le but de simplifier le processus de prise de décision.

Conor Doherty : Eh bien, je suis toujours là, et ça va. J’ai rédigé trois ou quatre pages de notes distinctes, mais l’une des choses – et cela fait suite à ce que vous avez dit – est que vous utilisez le terme managing financial risk, et j’ai écrit trade-offs, préoccupations d’affaires, évaluation de la performance, et gestion du risque financier.

Alors, Warren, en guise d’opportunité pour résumer votre cadre et votre approche de l’optimisation stochastique, je sais que votre perspective consiste à gérer les préoccupations d’affaires et à équilibrer les compromis inhérents à la prise de décision. Prenez tout le temps qu’il vous plaira, mais comment exactement votre cadre gère-t-il le risque financier associé, que ce soit à l’optimisation du routage, à la gestion des stocks, ou à la prévision et gestion des stocks pour des produits dont nous n’avons aucun historique ?

Warren Powell : Bien sûr. Tout d’abord, je pense que l’un des avantages que Johannes et moi avons, c’est que nous travaillons tous les deux sur de vrais problèmes. Et une fois que vous travaillez sur de vrais problèmes, vous en retirez certaines vérités sur lesquelles nous sommes tous d’accord, dont l’une est : modéliser d’abord, puis résoudre. Il faut comprendre le problème. Vous utilisez le mot risque, et pour moi, cela souligne qu’il faut parler d’incertitude, et que cela est bien plus compliqué qu’une distribution normale.

Les spécialistes des statistiques aiment, dès que vous traitez l’incertitude, introduire immédiatement la distribution normale à un étudiant. Ils diront, d’accord, nous avons une moyenne et une variance. Il y a du hasard autour de la moyenne, et ils ne semblent pas reconnaître que la plus grande source d’incertitude est la moyenne. Nous ne savons pas ce que sera la moyenne. La moyenne fluctue. Bien qu’il y ait du bruit autour de la moyenne, ce sont ces fluctuations qui posent le plus de problèmes.

Et puis, ces événements qui n’entrent pas vraiment dans une distribution de probabilité, ce sont des contingences. C’est comme, écoutez, je ne sais pas quelle est la probabilité, mais voici quelque chose qui pourrait se produire. Que ferais-je face à cette éventualité ? Et peu m’importe la probabilité. Il y a des choses qui, selon moi, peuvent arriver, et je dois savoir ce qu’il adviendra si ce navire arrive avec un mois de retard. Et si ce port se mettait à l’arrêt ? S’il y avait un tremblement de terre au Japon ? Ce sont de grands événements. Je n’ai pas nécessairement besoin de savoir exactement lequel, mais je dois préparer des plans de contingence.

Tout l’art de prendre des décisions sous incertitude, l’une des premières choses que j’aime dire, c’est que, bon sang, il y a beaucoup de mathématiques compliquées, mais réalisez-vous que nous, les humains, prenons constamment des décisions sous incertitude ? Au début de ma carrière, alors que je peinais vraiment avec mes problèmes de camions, je me disais : mais les répartiteurs de camions font déjà cela. Il faut se rappeler qu’une chose pour laquelle le cerveau humain excelle est la prise de décisions sous incertitude.

Beaucoup de ces questions, les gens diront, “oh, je n’aime pas le stochastique.” Et pourtant, cette même personne planifiera pour des événements aléatoires, des incertitudes et des contingences. C’est simplement quelque chose d’intrinsèque au cerveau humain, car, je suppose, nous, les animaux, avons dû y faire face tout au long de notre évolution. Le plus grand défi n’est pas de prendre des décisions sous incertitude, mais d’apprendre aux ordinateurs à prendre des décisions sous incertitude.

Et donc, je ne pense pas qu’il y aura jamais de fin à cette conversation. Nous devons quantifier, nous devons utiliser des ordinateurs parce que l’idée de salles pleines de personnes prenant des décisions devient un peu désuète. Dans les entreprises de camionnage, nous disposons d’une suite complète de modèles chez Optimal Dynamics, allant du stratégique jusqu’au temps réel. Mais le produit qui est absolument le fondement de ce que nous vendons est celui qui effectue la répartition en temps réel, car il n’existe aucun cadre du camionnage aux États-Unis qui ne pense pas que le problème numéro un de son entreprise est le poste de répartition, que ce soit vrai ou non – telle est leur conviction.

J’ai appris que l’idée de trouver le bon conducteur pour déplacer une charge n’est pas vraiment l’aspect le plus important. Ce qui compte le plus, c’est de choisir la bonne charge, et c’est un peu comme la gestion des revenus dans l’aviation. Il faut planifier un peu dans le futur, mais il est tellement difficile de trouver le bon conducteur qui rentrera chez lui et respectera les heures du DOT, que tout le monde se focalise intensément sur le problème du dispatching des conducteurs.

Mais il s’agit vraiment de trouver la bonne charge, car ce qui rend la recherche difficile, c’est que je peux devoir m’engager plusieurs jours, voire une semaine à l’avance, sans savoir où se trouveront mes conducteurs ni ce que je peux supporter. Il faut donc être capable de planifier en condition d’incertitude. Les répartiteurs le savent, et peut-être qu’ils n’ont pas d’outils sophistiqués, mais ils possèdent cette intuition du type, “Hé, c’est un bon endroit. J’aurai probablement un conducteur là-bas.”

J’ai vu des gens affirmer catégoriquement que nous ne traitons aucune incertitude parce que les PDG ne comprennent pas le stochastique. Non, ils ne comprennent pas le mot stochastique, ils comprennent tous l’incertitude. D’ailleurs, nous devons dépasser leur insistance à respecter les prévisions.

Je pense que l’un des plus grands problèmes chez les professionnels du transport – je parle ici du côté supply chain – c’est qu’ils ont tous un budget pour leur transport, spécifiquement pour le camionnage, et aucun d’entre eux ne respecte ce budget. Il s’agit toujours d’une estimation optimiste de leurs dépenses de transport, et ils finissent toujours par dépenser davantage; c’est tout simplement une conséquence du fait d’être un spécialiste de la supply chain qui doit planifier les actifs de transport.

Donc, il y a beaucoup de problèmes intéressants. Je ne pense pas que nous manquerons jamais de sujets de conversation.

Joannes Vermorel: Ouais, et franchement, pour rebondir sur votre exemple de l’esprit humain traitant des décisions en condition de certitude, je suis tout à fait d’accord. Et je constate cette situation très particulière où, en réalité, les discussions les plus difficiles ne se font pas avec des personnes peu instruites en mathématiques, ni, à l’autre extrémité du spectre, avec celles qui sont super instruites en mathématiques. Ce sont les zones d’ombre, les personnes complètement non instruites et les personnes super instruites.

Ce qui est difficile pour moi, ce sont les personnes légèrement instruites, car le fait amusant est qu’il est en réalité assez difficile de faire face à l’incertitude avec un ordinateur. Je suis tout à fait d’accord, et qu’est-ce que cela signifie pour une personne qui est légèrement instruite dans ce domaine ? Cela signifie Excel, Microsoft Excel.

Et donc le problème est, et j’ai vu cela très fréquemment, c’est qu’ils en savent un peu, donc ils connaissent Excel, et il y a alors ce problème de regarder l’univers uniquement à travers la solution à laquelle ils pensent. On se retrouve donc avec le profane qui ne sait rien d’Excel et qui, comme en jouant au poker, est devenu bon par l’habitude. Il n’a pas les théories, mais il parvient à jouer au poker et à performer de manière décente.

Et il en va de même pour le choix de la bonne charge. Je suis presque certain que vous trouverez de nombreuses personnes qui n’ont absolument aucun concept de probabilités mais qui, grâce à l’expérience, sont devenues d’excellents joueurs. Ils possèdent cette intuition, bien qu’ils n’aient pas le formalisme.

Et entre les deux, on obtient des personnes qui connaissent Excel et qui disent, “D’accord, il faut que j’implémente cela dans Excel.” Or, Excel est un outil terrible pour cela, car Excel ne traite pas les probabilités. Excel n’est pas conçu pour faire quoi que ce soit de type Monte Carlo, et c’est le pire des outils pour cela. Excel est parfait pour tenir votre comptabilité mais absolument terrible pour gérer tout type d’incertitude.

Et donc, ma situation la plus difficile concerne les personnes qui sont attachées à la solution Excel. Si quelque chose se situe en dehors d’Excel – que ce soit parce qu’il s’agit juste d’une intuition, qui est plus exacte que le calcul Excel, ou parce que c’est trop sophistiqué et ne rentre plus dans le cadre du calcul Excel – il y a alors un fort rejet.

Donc, c’est très intéressant et je me retrouve beaucoup dans ce cas, et j’observe que la majorité des personnes se cantonnent aux feuilles de calcul Microsoft Excel, ce qui constitue un véritable combat.

Et je pense que la plupart du temps, lorsqu’ils disent que le PDG n’aime pas cela, j’ai très souvent constaté qu’il s’agit d’une projection de leur propre perception du problème. Les PDG sont presque toujours – je veux dire, pour une entreprise d’une certaine taille – des personnes excellant dans la gestion d’une quantité énorme de chaos.

Je pense qu’il est très difficile pour quiconque d’atteindre le poste de PDG d’une entreprise, disons de quelques centaines de personnes et plus, sans être complètement indifférent au fait que le monde est super chaotique. Je veux dire, c’est votre quotidien : gérer des absurdités qui vous sont sans cesse lancées.

Donc, mon point de vue est que j’ai très souvent vu des gens me dire, “Oh, c’est trop compliqué. Le PDG ne comprendrait pas ou autre,” non, c’est leur propre peur projetée, vu qu’en tout cas le PDG a à peine le temps de comprendre quoi que ce soit à propos de cette entreprise. Ce sera donc juste l’une des mille choses que cette personne ne comprendra pas de sa propre entreprise, et ce ne sera tout simplement pas la dernière. Voilà, c’est, enfin, c’est mon avis. Qu’en pensez-vous ?

Warren Powell: Oui, souvent les PDG proviennent d’un tout autre niveau. Ils se concentrent sur la vue d’ensemble des finances, surtout dans les grandes entreprises. Les détails fins de ce qui se passe sur le terrain des opérations étaient probablement quelque chose qu’ils ont contourné au cours de leur carrière.

Je veux dire, autrefois, à l’époque où j’étais étudiant, de nombreuses personnes, même des sous-gradués de Princeton, pouvaient aller travailler pour Proctor and Gamble et passaient six mois sur le plancher de l’usine, avant d’accéder à la hiérarchie managériale. Ils étaient donc sur la voie rapide, mais on leur disait de commencer en bas. Cela a disparu dans les années 1980.

Dans les années 1980, quand j’ai commencé à enseigner à Princeton, aucun sous-gradué de Princeton n’est allé travailler pour une entreprise. La tendance était d’aller travailler pour des cabinets de conseil en management. Ainsi, ils acquéraient leur expérience de terrain en travaillant pour un cabinet de conseil, faisaient ensuite un MBA, revenaient, travaillaient quelques années de plus, puis partaient généralement pour un poste de cadre supérieur dans l’une des entreprises. Ils contournaient donc tous ces détails.

Pour en revenir à Excel, lorsque j’ai travaillé dans l’industrie du camionnage, les seules personnes que j’ai rencontrées étaient des camionneurs – enfin, pardon, des répartiteurs – et des managers de bas niveau. Il y avait très peu de personnes capables de faire même un travail de base sur une feuille de calcul Excel. Alors que dans la supply chain, il y en a des millions tous assis là à faire des tâches très basiques.

Maintenant, regardez les livres. Alors que je m’implique dans un véritable programme de supply chain à Rutgers, j’ai parcouru tous ces ouvrages et, soit les livres ne sont que des jeux mathématiques, soit ils simplifient vraiment les choses. Ainsi, non seulement vous avez ces personnes qui pensent pouvoir tout faire dans une feuille de calcul Excel, mais les livres ne leur enseignent que ce qui peut être réalisé dans une feuille de calcul Excel.

Et donc, je pense que nous avons plus qu’un simple problème de feuille de calcul Excel. Nous devons réfléchir à qui va résoudre ces problèmes et les utiliser. Je suis tout à fait d’accord avec vous dans le sens où, “Ce qu’il nous faut, ce sont de bons outils qui, en coulisses, peuvent être assez sophistiqués, mais qui doivent être faciles à utiliser.”

Chez Optimal Dynamics, nous nous concentrons énormément sur la facilité d’utilisation de nos outils. Mais en coulisses, tant que cela fonctionne, les gens veulent vraiment la meilleure solution possible. La supply chain, j’ai l’impression, lorsque je commence à y jeter un coup d’œil et à observer les gens par-dessus leur épaule en disant, “Il y a ce monde intéressant de la supply chain, mais ce qui se passe, c’est que, selon une statistique que j’ai vue, 93 % des gens font leur planification dans une feuille de calcul.”

Eh bien, vous êtes limité par ce que vous pouvez faire dans une feuille de calcul. Et donc, lorsque vous commencez à parler, vous savez, même à lancer des simulations simples – je veux dire, je peux faire une simple simulation de stocks dans une feuille de calcul – mais parlons plutôt d’introduire de longs délais d’approvisionnement chez plusieurs fournisseurs, eh bien, cela dépasse très rapidement les capacités d’une feuille de calcul. Cela dépasse également la compétence des personnes qui codent cette feuille de calcul et qui pensent pouvoir le faire seules.

J’ai une ancienne doctorante, qui est aujourd’hui notre chief analytics officer, d’une intelligence exceptionnelle, mais elle a passé huit ans à faire de la planification des opérations chez Kimberly Clark au Brésil. C’est toute une histoire, et à un moment donné, elle avait du mal avec, vous savez, les problèmes habituels de planification de stocks. Alors elle a fait appel à ses anciens collègues de McKenzie, où elle avait brièvement travaillé, et devinez quoi ? McKenzie ne connaissait que ce qui se trouvait dans les manuels, et elle a immédiatement compris qu’ils n’avaient aucune idée de ce dont ils parlaient, et elle les a expulsés sur-le-champ. Nous n’enseignons même pas aux meilleurs et aux plus brillants comment résoudre ces problèmes. Je ne parle pas de faire des mathématiques étranges, mais de réaliser des choses pratiques, le genre de modélisation qui devrait absolument être effectué pour résoudre le problème. Cela n’est enseigné nulle part.

Conor Doherty: Si je peux me permettre, cela est enseigné quelque part. Autopromotion sans vergogne.

Joannes Vermorel: Autopromotion sans vergogne. Chez Lokad, nous avons commencé à enseigner cela dans une demi-douzaine d’universités, principalement autour de Paris. Nous avons également lancé toute une série d’ateliers publics pour des situations de résolution de problèmes en supply chain, et l’un des plus grands efforts que nous ayons, notre plus grand investissement à réaliser, est de créer des ensembles de données.

Nous créons et publions donc les ensembles de données pertinents, et en effet, de mon point de vue, créer un ensemble de données entièrement synthétique est tout simplement trop difficile, il faut donc anonymiser complètement les données existantes des clients, avec leur accord. Nous prenons des données réelles, les anonymisons complètement, préservons les schémas inattendus, et les regroupons en ensembles de données relativement petits et bien organisés afin que les étudiants puissent s’attaquer au problème sans passer trois mois à gérer des incohérences dans les données. Je suis tout à fait d’accord, et d’ailleurs, mes deux parents ont commencé chez Procter & Gamble, donc je comprends parfaitement ce sentiment.

Warren Powell: Alors, vous enseignez, à quel type d’étudiants vous adressez-vous dans les écoles autour de Paris ?

Joannes Vermorel: Oh, c’est très classique. Le système français comporte deux ans de classes préparatoires, c’est-à-dire un examen national. Vous effectuez deux ans, passez des examens nationaux, tout le monde se voit attribuer des classements, et vos notes sont publiées dans le journal, donc si vous obtenez de mauvaises notes, c’est dans le journal, cela ne met pas la pression. Ensuite, il y a ce que l’on appelle les Grandes Écoles, qu’on peut considérer comme la mini Ivy League française. Les gens vont dans ces écoles d’ingénieurs. Je parle donc uniquement de trois segments : les écoles d’ingénieurs, les écoles de commerce et les écoles administratives. Ici, je ne parle que des écoles d’ingénieurs.

Warren Powell: L’ingénierie, d’accord. À Princeton, j’enseignais aux ingénieurs. Maintenant que je m’implique avec Rutgers, ce sera la première fois dans une école de commerce et j’ai déjà été averti en douceur que, parmi toutes les catégories d’étudiants dans l’école de commerce, ceux qui choisissent la gestion de la Supply Chain tendent à être un peu en bas de la liste en termes de compétences techniques. Les mieux classés se dirigent vers la finance, et il y a donc un effet de cascade. Je n’ai pas encore commencé, je ne vais pas donner un cours, j’enseigne aux enseignants, mais je compterai sur eux pour me dire : “Regarde, Warren, nous ne pourrons tout simplement pas nous en sortir comme ça.”

Une chose sur laquelle je me concentre, c’est que je dis : “Écoutez, il y a une partie très importante de mon cadre qui n’implique pas du tout les mathématiques. Elle comporte les trois questions suivantes, et vous ne pouvez pas y répondre – vous ne pouvez pas construire un modèle sans ces trois questions.” Même si vous n’allez pas construire un modèle, vous devriez tout de même, si vous voulez résoudre un problème, répondre aux trois questions suivantes : quels sont vos indicateurs, quel type de décisions prenez-vous, et quels sont les types d’incertitudes ?

En termes simples, c’est ainsi que nous le formulons ici, et donc je dis : pas de mathématiques, mais ce sont ces questions pour lesquelles, si je veux construire un modèle mathématique, je dois absolument avoir les réponses. J’ai donc décidé de me tourner vers le milieu des affaires et de poser des questions sur les indicateurs ; ils connaissent tous les indicateurs, ils ont des listes et des listes d’indicateurs. Puis, en abordant les décisions, je leur demande : “Avez-vous un petit livre rouge répertoriant les décisions que vous prenez ?” et ils vous fixent, interloqués.

Donc, après cette intervention, Joannes, je commence à générer une série de réflexions et de notes que je vais partager avec les autres membres du corps professoral de Rutgers. C’est un document Google Docs qui peut être édité publiquement et vous me verrez développer différentes catégories. Je viens tout juste de commencer la section sur les décisions et je vais te l’envoyer aussi, car je pense que tu vas t’amuser. Ce n’est pas pour un livre ou quoi que ce soit, ce n’est que du bavardage, c’est ma manière d’enseigner aux professeurs, car je ne peux pas leur dire quoi faire – les professeurs doivent dire, “Oh, c’est une bonne idée, je pense que je vais l’utiliser.” S’ils ne le font pas, alors l’idée ne pénètre pas dans la classe, mais je dois avoir confiance en leur connaissance de ce que les étudiants font. Il existe ce cours sur l’analyse des opérations, et c’est le cours où ils traitent des problèmes de stocks. Je pense que tu peux imaginer ce qui y est enseigné : c’est une présentation très basique et je me dis, “Je suis désolé, ne devrions-nous pas au moins leur montrer comment, même dans une feuille de calcul, on peut simuler un problème de stocks très basique.”

Donc je vais t’envoyer le lien vers le Google Doc. L’une des choses que j’aimerais compiler, et que je n’ai pas encore fait, je commence tout juste à y réfléchir, mais je n’ai pas fait de gestion de la supply chain durant toute ma carrière, j’ai travaillé sur un ensemble de problèmes beaucoup plus vaste. Je veux établir une liste de décisions. Ça ne va pas être une affaire de peu d’importance ; les décisions se déclinent en de nombreuses variétés et catégories, ce n’est pas que des stocks. Il y a la finance, il y a les décisions informationnelles, et au final, j’aimerais les consigner dans un tableau puis les envoyer autour en invitant les gens : “Hé, quelle catégorie est la mienne ou quels sont des exemples de décisions ?” parce que j’avais ce slogan qui disait : “Si tu veux gérer mieux quoi que ce soit, appelle ça une supply chain, tu dois prendre de meilleures décisions.” Je n’ai jamais entendu personne contredire cela, tout le monde est du genre “Ouais, c’est vrai.” Eh bien, si tu veux prendre de meilleures décisions, quelle est ta liste de décisions ? Et puis je reçois ces regards vides.

Alors je vais commencer par une approche très non quantitative, ce qui fait appel à ton intuition qu’il faut d’abord modéliser, et je pense qu’un MBA non quantitatif, c’est un bon défi pour eux, car répondre—puis bien sûr aux incertitudes, des carrières entières se construisent en identifiant les sources d’incertitude pour les supply chain—mais j’adore vraiment celle sur les décisions. Ne devrions-nous pas tous être capables de savoir quelles décisions nous prenons ? Je comprends pourquoi, dans le monde des affaires, ce n’est pas le cas, car c’est comme, “Eh bien, c’est le problème de quelqu’un d’autre, je vais juste évaluer dans quelle mesure il réussit.” Donc, dans les affaires, c’est entièrement le langage des indicateurs, mais ne devrait-il pas y avoir quelque part un petit livre rouge qui répertorie les décisions ?

Joannes Vermorel: Je suis tout à fait d’accord, et les décisions sont très difficiles car les grandes entreprises tendent à enterrer les décisions et les processus de prise de décision sous des workflows et des processus. En fait, elles ne perçoivent même plus une décision parce qu’une règle est appliquée qui est en réalité un processus de prise de décision. Et c’est devenu si omniprésent qu’elles ne la voient plus, c’est simplement ce qui dirige l’entreprise. Il peut s’agir d’une mauvaise politique, elle existe, elle oriente l’entreprise, elle engendre potentiellement des milliers de décisions par jour, et personne ne la voit. Une fois en place depuis un certain temps, cette chose n’est même plus soumise à commande. Il n’y a personne en charge de cela, tout comme l’air frais dans un bâtiment, cela se produit naturellement, les gens ne savent même plus exactement pourquoi, ça se contente d’être.

Je suis tout à fait d’accord avec ton idée de décision. C’est difficile car les gens ont une fausse conception des décisions. Ils pensent qu’une décision, c’est quelque chose qui se passe lors d’une réunion, avec de la tension et un patron, où des arguments seront présentés et le patron prendra la décision. C’est un type de décision, mais il existe des décisions beaucoup plus banales qui ont des conséquences bien plus importantes. Lorsqu’elles sont si banales que tu ne les remarques plus, c’est très intrigant.

Warren Powell: Parce que, comme tu l’as dit, ils ont déjà choisi la politique, donc une fois que tu fixes la politique, cela cesse d’être une décision. Et en réalité, la décision n’est pas la décision, la décision c’est la politique.

Maintenant, laisse-moi simplement proposer une autre perspective. Tu sais, je parle des politiques compliquées et des politiques simples. Une phrase que j’utilise assurément dans mon grand livre est que le prix de la simplicité, ce sont les paramètres réglables. Presque toute politique simple, comme les politiques SS, possède des paramètres réglables, et l’ajustement est difficile. L’ajustement est l’un de ces types universels de décisions. C’est un problème d’apprentissage actif.

Je donne une conférence lors d’un atelier sur l’analyse supply chain à Rutgers en juin, et l’une des choses sur lesquelles j’ai consacré une section entière, c’est qu’il y a quelque chose que absolument tout le monde, quel que soit le domaine, doit comprendre. Il existe une catégorie de problèmes de décision séquentielle appelée apprentissage.

Elle porte plusieurs noms. On peut parler d’essais et erreurs intelligents, de recherche stochastique ou de multi-arm bandit, mais ce sont des problèmes d’apprentissage. Il n’y a rien de physique. Lorsqu’il s’agit de quelque chose de physique, les choses se compliquent, mais il existe de nombreux problèmes où il n’y a rien de physique, c’est simplement de l’apprentissage.

Tu essaies ceci, cela a fonctionné ou non, et tu essaies autre chose. C’est une décision séquentielle, mais la seule chose que tu retires d’un moment à l’autre, c’est ce que tu as appris et ta conviction sur ce qui fonctionne le mieux.

L’apprentissage séquentiel devrait être enseigné au niveau licence, non pas dans un cours unique, mais tout au long du cursus, tout comme la statistique est enseignée sous différentes formes. L’apprentissage actif devrait être enseigné à tous ceux qui ne sont pas étudiants en anglais.

À moins que tu ne sois un étudiant en humanités, nomme n’importe quel domaine où tu n’as pas à recourir à une forme d’essais et erreurs intelligents. C’est un processus fondamentalement humain, et il existe des outils simples pour cela, afin de permettre aux gens de démarrer.

Il existe des politiques de base appelées politiques UCB que vous pouvez enseigner en une minute. Vous dites simplement : “Regardez, vous avez des choix discrets, voici à quel point je pense que chacun est bon, mais voici mon degré d’incertitude.”

Il existe un exercice simple qui montre que si tout ce que vous faites est de vous baser sur ce que vous pensez être la qualité, cela peut être sérieusement sous-optimal. Vous devez viser un peu plus haut, viser ce que quelque chose pourrait valoir. C’est une idée que l’on peut enseigner en une minute, et pourtant il y a des subtilités qui le rendent bien plus riche et cela doit vraiment être enseigné.

Joannes Vermorel: Je suis tout à fait d’accord. C’est très amusant parce que, venant d’un milieu du machine learning, chez Lokad c’était principalement le machine learning de prévision.

La situation typique était que ces politiques simplistes avec des paramètres réglables n’étaient jamais ajustées en pratique. Quand on accède enfin au jeu de données d’une entreprise, c’est compliqué, mais chez Lokad, nous finissons par obtenir le jeu de données.

Vous appliquez vos algorithmes d’apprentissage et vous réalisez qu’il y a très peu à apprendre, parce que l’entreprise a fonctionné avec un pilotage automatique incroyablement rigide pendant si longtemps que vous pouvez disposer de milliards de dollars ou d’euros d’historique et pourtant si peu de choses à en tirer, car vous n’avez fait que la même chose encore et encore sans aucune variation.

L’un des défis auxquels nous sommes confrontés est que, fréquemment, lorsque nous voulons apprendre, nous devons commencer à explorer et ajouter un peu de bruit. Ce bruit est uniquement destiné à l’apprentissage.

Il faut s’assurer que cela ne soit pas trop coûteux, mais l’idée de s’écarter de ce qui est considéré comme optimal – on n’a aucune idée si c’est optimal – est certainement celle par défaut, le statu quo, la pratique.

S’écarter de la pratique pour explorer au hasard quelque chose d’aussi abstrait que recueillir des informations sur l’aspect du paysage lorsqu’on dévie de ce que l’on fait habituellement est très déconcertant.

Il y a très peu de personnes issues des MBA et autres qui peuvent comprendre cette idée de laisser tomber de minuscules impulsions. Si vous êtes une grande entreprise, même une petite dose d’exploration, si vous opérez à grande échelle, vous apportera beaucoup d’informations au fil du temps.

Dans la fabrication, la déviation est mal vue. Vous voulez être aussi rigide et cohérent que possible. Mais dans l’apprentissage actif, si vous faites cela dans le monde de la supply chain et que vous soyez si rigide avec une politique qui reste immuable, vous apprenez à peine quoi que ce soit.

C’est un concept très étrange. Être initié à l’idée d’apprentissage actif, c’est-à-dire pouvoir sélectionner minutieusement vos écarts pour maximiser l’information obtenue, de sorte qu’il ne s’agisse pas simplement de faire quelque chose au hasard, mais avec l’intention d’apprendre, est crucial.

Warren Powell: Les perspectives que tu viens d’articuler sont d’une importance fondamentale telle qu’elles devraient être enseignées partout, dans tous les domaines, pas seulement dans les domaines analytiques.

On peut enseigner cela à un niveau analytique avancé ainsi qu’à un niveau de base, selon les étudiants. Je ne comprends pas pourquoi ce n’est pas enseigné.

J’écris un article pour Princeton localement pour dire, “regarde, 40 ans de Princeton, devine quel cours nous n’enseignons pas.” Environ la moitié de l’université est impliquée dans des départements où il y a une opportunité de recourir à une forme de pensée par essais et erreurs.

Nous pourrions continuer ainsi pendant plusieurs heures.

Conor Doherty: Je vais intervenir à nouveau pour boucler une boucle. L’un des plugs sans complexe, juste pour clarifier, lorsque tu parles de l’apprentissage pour les étudiants en supply chain, les ateliers que tu as mentionnés sont en réalité accessibles publiquement sur notre site web.

En ce qui concerne l’apprentissage de la programmation pour les problèmes de supply chain, nous disposons sur notre site web, docs.lokad.com, de ressources publiques et totalement gratuites. Ce sont des exercices guidés conçus par nos Supply Chain Scientists pour imiter le type d’arbres de décision dont tu parles.

Si tu veux évaluer la performance, l’analyse des fournisseurs, nous avons un tutoriel guidé gratuit pour cela où tu peux voir tous les extraits de code conçus spécifiquement pour ce genre de problèmes, par opposition à une approximation grossière dans un tableau Excel.

Warren Powell: Je sais que chez Lokad vous avez votre propre langage de programmation. J’ai trouvé cela très intéressant. J’adore les ressources que vous mettez à disposition. Nous essayons de faire quelque chose dans le même esprit pour le transport routier, mais le transport routier est un secteur très différent.

Nous essayons de proposer des contenus très éducatifs. Nous n’essaierions jamais de mettre en place quelque chose comme cela. D’abord, nous ne disposons pas de ce code simple, et il n’y a personne dans l’industrie du camionnage.

Une chose plutôt intéressante à propos du transport de groupage, c’est, eh bien, que nous n’avons pas beaucoup de concurrence. Ce n’est pas l’ampleur du secteur du camionnage de groupage, qui aux États-Unis représente environ 800 milliards de dollars par an. Je veux dire, c’est un grand marché, mais c’est une infime fraction des supply chain.

La supply chain est un véritable océan, tandis que le transport de groupage n’est qu’une mer ou quelque chose comme ça. Mais je vais porter l’attention du département de Rutgers sur vos ressources, car je pense que cela pourrait être très intéressant.

Je dois composer avec le fait qu’il s’agit d’étudiants en commerce que je dois amener à apprendre, et ils disposent aussi d’un département de génie industriel, et j’ai le sentiment que cela sera davantage du côté ingénierie.

Je pense en réalité que les deux départements devraient travailler ensemble, car cette première étape consistant à répondre à ces trois questions est vraiment difficile. Il faut vraiment savoir de quoi on parle. Il te faut donc une réflexion de consultant en management, intelligente et pertinente, pour y répondre.

Une fois que tu y as répondu, il te faut ensuite une compétence différente pour les transformer en analyses et utiliser un ordinateur pour t’aider. J’espère donc qu’à Rutgers, je connais assez bien les gens en génie industriel. Le groupe que je ne connais pas aussi bien est le département de gestion de la supply chain. Ils semblent apprécier ce que je dis, et je vais essayer de leur proposer de les réunir.

Conor Doherty: Je pense que cela dure depuis un bon moment maintenant et j’ai épuisé toutes mes questions. Mais il est de coutume chez Lokad d’offrir le dernier mot à l’invité. Alors Warren, je te laisse conclure avec un appel à l’action ou des plugs sans complexe. Cela ne nous dérange pas ici.

Joannes Vermorel: Il y a un appel à l’action clair, qui est d’acheter le livre. C’est un très bon livre, solide.

Warren Powell: Je recommande aux gens de ne pas commencer par le grand livre, mais de débuter avec un livre qu’ils peuvent télécharger gratuitement.

Tinyurl.com/SDAmodeling, c’est le livre que j’ai écrit pour le cours de premier cycle. Il s’appelle Sequential Decision Analytics and Modeling. Je travaille avec un éditeur, ils ne me paient rien, mais ils me permettent d’offrir le PDF gratuitement, la version publiée.

C’est le livre. Il adopte un style d’enseignement par l’exemple. Ainsi, à l’exception du chapitre un, qui présente le cadre universel et inclut des exemples de stocks, chaque chapitre, hormis le chapitre 7, se contente d’exemples différents, tous rédigés dans le même style avec un accent sur la modélisation.

J’ai donc mes cinq éléments : état, décision, information, transition, objectif. Je commence toujours par un récit, un récit en anglais simple, puis j’introduis les cinq éléments. Ensuite, je dis quelques mots sur la modélisation de l’incertitude — pas beaucoup. Puis je dis quelque chose comme : “Voilà une façon de prendre des décisions.”

Au moment où j’arrive au chapitre 7, j’ai donné des exemples de toutes les quatre catégories de politiques. Ainsi, le chapitre 7 dit : faisons une pause, examinons ce que nous venons de faire. Les chapitres restants, de 8 à 14, sont tout simplement des exemples plus avancés, y compris le beer game.

Le beer game est mon opportunité de traiter un problème multi-agent. L’un de mes chapitres préférés dans mon grand livre est le dernier chapitre sur le multi-agent. J’ai écrit ce chapitre en disant que, si je devais recommencer ma carrière aujourd’hui, le multi-agent serait tellement amusant.

Et, bien sûr, dans le monde de la supply chain, tout est multi-agent. Cela définit presque le problème en ce sens que vous n’en avez pas un seul. Par exemple, dans mon travail en transport routier, même s’il y a différents managers, nous agissons globalement comme si la société de transport routier était un agent unique.

La supply chain, tu ne peux pas. Ça ne fonctionne tout simplement pas. Il faut modéliser le fait que tu as tous ces composants qui interagissent, ce qui ouvre la porte à la modélisation de qui sait quoi. Donc, à présent, tu modélises l’organisation de l’information, et non plus seulement la commande de stocks.

C’est un domaine incroyablement riche. Je regarde 70 ans de rédaction de manuels et je me rends compte que nos livres semblent tellement en retard par rapport à ce qui est requis pour vraiment résoudre le problème. Cela me surprend un peu. C’est une belle opportunité. J’aimerais avoir quelques décennies de moins.

Donc, c’est génial que vous fassiez cette série télévisée. Je vais certainement la promouvoir. J’aimerais vraiment partager ce lien, mais j’indiquerai également aux gens de visiter votre site web parce que j’adore votre style académique.

Optimal Dynamics est une excellente entreprise. Je ne peux pas faire beaucoup de plugs sans complexe car elle est vraiment axée sur les transporteurs de groupage, mais je vais faire un plug sans complexe pour Lokad. J’aime votre style. Je vous mentionne parce que cela montre que vous avez un point de vue très académique.

J’adore votre envie de partager. Les universitaires aiment partager. Oui, nous aimerions gagner de l’argent, mais nous ne pouvons pas nous empêcher de partager nos idées et d’en être très fiers, comme vous devriez l’être. J’apprécie cela car j’ai parcouru votre site avec soin et cela m’aide à apprendre des choses et à adopter votre style.

Conor Doherty: Merci beaucoup. Je n’ai pas d’autres questions. Joannes, je te dis merci infiniment pour ton temps, Warren, merci énormément pour le tien. Et merci à tous de nous avoir suivis. À la prochaine.