00:00:00 Introduction des invités
00:01:27 Le rôle de Warren chez Optimal Dynamics et son livre
00:03:06 Les défis et les prévisions dans le transport routier de lots complets
00:04:31 L’article de Warren et la compréhension de l’incertitude
00:06:41 Le parcours de Joannes et son succès dans le logiciel
00:08:12 Accepter l’incertitude et la perspective académique sur la chaîne d’approvisionnement
00:09:39 Décisions séquentielles et difficulté de la collaboration industrielle
00:11:13 Prévisions probabilistes vs déterministes
00:13:27 Métriques pour les prévisions probabilistes et compréhension des difficultés
00:15:28 Importance de la couverture des prévisions et des prévisions précises
00:17:09 Le parcours de Lokad avec les prévisions probabilistes et les défis
00:19:15 Difficulté des problèmes d’incertitude et manque de communauté unifiée
00:21:05 Décisions et incertitude dans la programmation mathématique
00:23:03 Expériences de laboratoire diverses et applications du livre ADP
00:25:07 Besoin d’une boîte à outils dans la chaîne d’approvisionnement et transition vers une nouvelle approche
00:27:35 Optimisation déterministe et approximation de la fonction de coût
00:29:57 Google Maps comme exemple de prévision
00:31:51 Prévision stochastique et approximations de la fonction de valeur
00:33:21 La perspective de Joannes sur la prise de décision et l’énoncé du problème
00:35:29 Importance de l’état correct, de la fonction de transition et de la fonction de coût
00:37:28 Tenir compte de la dimensionnalité du problème et des problèmes à grande échelle
00:39:15 Fragilité des solutions et comparaison du réseau de supermarchés
00:41:16 Approche de résolution de problèmes et rédaction d’un livre d’analyse de la chaîne d’approvisionnement
00:43:44 Simplicité dans la conception du modèle et différents types d’incertitude
00:45:13 Importance d’une itération rapide et de contraintes du monde réel
00:47:51 Importance de la faisabilité computationnelle et développement d’un outil graphique
00:50:27 Rôle de l’instrumentation dans l’optimisation et défis de l’industrie
00:53:11 Travailler avec les transporteurs et critique de l’approche académique
00:55:23 Le parcours de Joannes de la prévision à la prise de décision
00:58:28 Difficulté d’accès aux données et gestion des prévisions futures
01:00:32 Importance de prendre en compte les perturbations majeures et d’accepter les modèles pessimistes
01:02:45 Variabilité dans la chaîne d’approvisionnement et l’industrie de la mode
01:04:43 Renouvellement annuel des produits et prévision des nouveaux produits
01:06:27 Importance de modéliser l’incertitude et critique des règles d’entreprise
01:08:16 L’approche de Warren pour l’optimisation stochastique et la gestion des stocks
01:09:56 Planification des contingences et prise de décision en situation d’incertitude
01:11:39 Importance de la répartition en temps réel dans le transport routier et sélection de la bonne charge
01:13:27 Défis de la prise de décision en situation d’incertitude et problèmes avec les individus instruits
01:15:45 Limitations d’Excel dans la gestion de l’incertitude et compréhension des PDG
01:19:30 Limitations des livres sur la chaîne d’approvisionnement et importance d’outils conviviaux
01:21:46 Initiatives éducatives de Lokad et création de jeux de données pertinents
01:25:01 Trois questions essentielles pour la résolution de problèmes et développement de catégories de décision
01:27:48 Le défi des MBA non quantitatifs et les entreprises qui enterrent les décisions sous des flux de travail
01:30:26 Le prix de la simplicité et l’apprentissage séquentiel comme outil de prise de décision
01:32:33 Enseigner le concept de viser plus haut et les défis des politiques rigides
01:34:34 Difficulté de comprendre le concept d’exploration et importance de l’apprentissage actif
01:37:41 Différences entre le transport routier et la chaîne d’approvisionnement et taille de l’activité de transport de camions
01:40:04 Titre du livre, objectif, style d’enseignement et cinq éléments de modélisation
01:42:39 Éloges pour Optimal Dynamics, Lokad et partage d’idées académiques
01:43:22 Remarques de clôture et remerciements
À propos de l’invité
Warren B Powell est professeur émérite à l’Université de Princeton, où il a enseigné pendant 39 ans, et est actuellement directeur de l’innovation chez Optimal Dynamics. Il a été le fondateur et directeur du laboratoire CASTLE, qui s’est concentré sur l’optimisation stochastique avec des applications au transport de marchandises, aux systèmes énergétiques, à la santé, au commerce électronique, à la finance et aux sciences de laboratoire, soutenu par plus de 50 millions de dollars de financement gouvernemental et industriel. Il a développé un nouveau cadre universel qui peut être utilisé pour modéliser n’importe quel problème de décision séquentielle, y compris l’identification de quatre classes de politiques qui couvrent toutes les méthodes possibles de prise de décision. Cela est documenté dans son dernier livre avec John Wiley : Apprentissage par renforcement et optimisation stochastique : Un cadre unifié pour les décisions séquentielles. Il a publié plus de 250 articles, cinq livres et a encadré plus de 60 étudiants diplômés et post-doctorants. Il est le lauréat 2021 du prix Robert Herman pour l’ensemble de sa carrière décerné par la Society for Transportation Science and Logistics, et du prix d’écriture expositive Saul Gass 2022. Il est membre de l’Informs et a reçu de nombreux autres prix.
Résumé
Lors d’une récente interview de LokadTV, Conor Doherty, Joannes Vermorel et l’invité Warren Powell ont discuté des prévisions probabilistes et de la prise de décision dans les chaînes d’approvisionnement. Warren Powell, professeur émérite de Princeton et directeur de l’innovation chez Optimal Dynamics, a partagé son parcours professionnel et ses idées sur la planification en situation d’incertitude. Joannes Vermorel, PDG de Lokad, a évoqué sa transition des méthodes déterministes aux prévisions probabilistes, critiquant le manque d’application du monde réel dans le milieu universitaire. Ils ont tous deux convenu de la supériorité des prévisions probabilistes, malgré leur complexité et les difficultés des entreprises à les appliquer. La conversation a souligné la nécessité d’une perspective plus large et d’une approche unifiée pour faire face à l’incertitude dans la prise de décision.
Résumé étendu
Lors d’une récente interview animée par Conor Doherty, responsable de la communication chez Lokad, Warren Powell, professeur émérite de Princeton University et directeur de l’innovation chez Optimal Dynamics, et Joannes Vermorel, PDG et fondateur de Lokad, ont engagé une discussion stimulante sur les prévisions probabilistes et la prise de décision séquentielle dans la chaîne d’approvisionnement en présence d’incertitude.
Warren Powell, un vétéran chevronné dans le domaine de la prise de décision dans des domaines complexes, a commencé par partager son parcours professionnel. Son travail a commencé avec la déréglementation du transport de marchandises aux États-Unis, ce qui l’a amené à se concentrer sur la planification en situation d’incertitude. Il a également discuté de son rôle chez Optimal Dynamics, une start-up avec laquelle il travaille, où il guide ses anciens étudiants en doctorat et envisage de nouvelles orientations pour l’entreprise.
La conversation s’est ensuite tournée vers le livre de Powell, “Reinforcement Learning and Stochastic Optimization”, qui explore le domaine des prévisions distributionnelles ou probabilistes. Powell a partagé une anecdote sur une entreprise qui souhaitait comprendre la valeur d’offrir une remise à un expéditeur s’il pouvait prédire les charges futures. Cela a suscité son intérêt pour le sujet et l’a amené à explorer les défis des prévisions dans le transport routier en raison de sa nature stochastique.
Joannes Vermorel, quant à lui, a partagé son parcours des méthodes déterministes aux prévisions probabilistes. Il a évoqué sa prise de conscience que les méthodes déterministes ne fonctionnaient pas et la nécessité d’embrasser l’incertitude dans les problèmes de chaîne d’approvisionnement. Il a également critiqué la communauté universitaire pour son manque d’application dans le monde réel et sa focalisation sur la démonstration de théorèmes et l’exécution de travaux numériques.
La discussion s’est ensuite portée sur la différence entre les prévisions déterministes et probabilistes. Powell a expliqué que si les prévisions déterministes fournissent un seul chiffre concret, elles ne tiennent pas compte de la variabilité du monde réel. Il a soutenu que les prévisions distributionnelles, qui fournissent une gamme de résultats possibles, sont supérieures, bien que les entreprises aient souvent du mal à comprendre et à appliquer ce concept.
Vermorel a convenu avec Powell, ajoutant que les prévisions probabilistes nécessitent des métriques plus complexes et une compréhension plus approfondie des distributions de probabilité. Il a comparé les prévisions déterministes à l’observation d’une petite section détaillée d’un bureau à travers un microscope, tandis que les prévisions probabilistes offrent une vue plus large et plus complète.
La conversation s’est conclue avec Vermorel partageant son expérience de mise en œuvre de prévisions probabilistes chez Lokad. Il a noté que cela avait pris plusieurs années pour comprendre comment optimiser les décisions basées sur ces prévisions. Il a également discuté du manque d’une communauté ou d’un paradigme unifié pour faire face à l’incertitude dans la prise de décision. Powell a convenu, décrivant le domaine des décisions et de l’incertitude comme une “jungle” en raison de la variété des différentes communautés, langues et systèmes de notation. Il a partagé ses expériences diverses dans différents domaines, du transport de marchandises aux systèmes énergétiques, et comment ces expériences l’ont amené à réaliser les limites de certaines approches et la nécessité d’une perspective plus large.
Transcription complète
Conor Doherty: Bienvenue de retour. Identifier et évaluer des décisions viables en matière de chaîne d’approvisionnement est difficile, en particulier si vous utilisez encore des métriques traditionnelles. Warren Powell, l’invité d’aujourd’hui, a passé 40 ans à analyser la prise de décision dans divers domaines complexes. De plus, il a écrit cinq livres, environ 250 articles, et est professeur émérite de Princeton. Alors, Warren, tout d’abord, bienvenue de nouveau chez Lokad. Deuxièmement, pour ceux qui auraient peut-être manqué votre première apparition, pourriez-vous vous présenter à nouveau et donner à tous un aperçu de ce que vous avez fait ?
Warren Powell: Eh bien, merci de m’avoir invité à nouveau. J’ai eu une carrière intéressante. Ma carrière a commencé lorsque le transport de marchandises aux États-Unis a été déréglementé, et j’ai donc été plongé dans cette industrie appelée transport routier de marchandises. L’une des premières questions dont ils ont parlé était l’incertitude et comment planifier en situation d’incertitude, et cela a fini par définir ma carrière. J’ai travaillé dans plusieurs applications différentes.
J’ai terminé ma carrière en aidant ma start-up, Optimal Dynamics, dans le transport routier de marchandises, qui est ce qui a commencé ma carrière. Nous utilisons différentes techniques, mais heureusement, j’ai pu travailler sur suffisamment d’applications différentes pour réaliser qu’il y a plus d’un outil dans cette boîte à outils de l’incertitude. Je suis donc impatient de participer à cette discussion. C’est agréable de parler à d’autres personnes qui partagent ma passion pour la modélisation de l’incertitude.
Conor Doherty: Merci. Et vous avez mentionné Optimal Dynamics. Vous êtes le directeur de l’innovation en chef, le CIO. Je n’avais jamais entendu ce terme auparavant. Pourriez-vous expliquer ce que vous faites là-bas ?
Warren Powell: Ils aiment m’appeler Yoda. Je ne suis impliqué dans aucune gestion. Personne ne travaille pour moi. J’ai cinq de mes anciens étudiants en doctorat qui travaillent là-bas, et je travaille pratiquement avec eux comme je le faisais quand j’étais professeur au laboratoire. J’attends qu’ils lèvent la main et disent : “Hé, nous avons besoin d’aide.” Sinon, je passe mon temps à réfléchir à des choses et à réfléchir également à de nouvelles orientations pour l’entreprise si l’occasion se présente.
Mais de temps en temps, je suis sollicité pour aider à résoudre un problème, et j’ai trouvé quelques innovations qui ont été utiles. Mais je suis vraiment là pour aider l’entreprise quand elle a besoin d’aide, et sinon, j’aime rester à l’écart. J’ai appris qu’en tant qu’universitaire, l’un des plus grands défis, surtout lorsque l’on travaille avec des personnes brillantes, est de savoir quand aider et quand rester à l’écart. Heureusement, cela m’a donné beaucoup de temps pour écrire des livres et des choses comme ça.
Conor Doherty: En fait, en parlant d’écriture de livres, l’un de vos livres, “Reinforcement Learning and Stochastic Optimization”, est l’une des choses qui nous intéressait le plus pour vous parler. Votre approche de la prise de décision et je sais que vous vous intéressez à l’approche de prévision distributionnelle ou probabiliste que Lokad utilise. Donc, pour commencer l’interview correctement, qu’est-ce qui vous fascine tant dans la prévision distributionnelle et qui a conduit à cette conversation aujourd’hui ?
Warren Powell: Eh bien, le plus grand défi lorsque j’ai commencé à modéliser mon problème de transport routier de marchandises, c’est que le transport routier de marchandises est très dispersé. Vous pouvez avoir une cargaison qui va d’une paire de villes à une autre, ou pas du tout. Lorsque vous envoyez un chauffeur, disons de Chicago à Atlanta, lorsque vous arrivez à Atlanta, il y a des cargaisons qui vont dans des directions très différentes. Vous pouvez avoir une cargaison qui va au Texas, ou pas du tout. Donc, vous avez quelque chose qui vaut 0 ou 1. Que prévoyez-vous ? Faites-vous zéro ou un, ou prévoyez-vous un 0,2, qui est l’attente la plus réaliste ?
J’ai eu une entreprise ici aux États-Unis, Schneider National, qui dans les années 1970 a vu que la déréglementation arrivait, et ils ont travaillé avec un membre du corps professoral de l’Université de Cincinnati sur la construction de modèles d’optimisation précoce, mais ils étaient tous déterministes. Et quelqu’un de chez Schneider m’a rendu visite à Princeton et m’a regardé en disant, et c’était quelqu’un avec une maîtrise en recherche opérationnelle, “Warren, le transport routier de marchandises est stochastique.
Nous ne savons pas quelles cargaisons seront disponibles même demain. Nous aimerions savoir quelle serait la valeur d’accorder une remise à un expéditeur s’il nous donnait les cargaisons à l’avenir.” Et je me souviens d’avoir été assis à cette conversation lors du dîner en pensant : “Oh mon Dieu, quelle excellente question.” Ce n’est pas que je ne connais pas la réponse, c’est que je ne sais pas comment y réfléchir.
Plus tard dans les années 1980, j’ai écrit un article que j’appelle mon article du musée. En fait, il est sur internet sous le nom d’article du musée. J’ai cinq façons différentes de modéliser ces problèmes de transport routier de marchandises, toutes traitant de l’incertitude d’une manière différente, et j’étais parfaitement conscient que aucune d’entre elles ne fonctionnerait. Et donc, là j’étais, à la fin des années 1980, en me disant : “Je ne sais pas quoi faire d’autre. Rien de ce qui sort de la communauté universitaire ne fonctionne.”
Cela a donc commencé ce processus de plusieurs décennies où je commençais à comprendre et j’avais ces moments d’illumination. Et donc, j’ai eu un grand moment au début des années 2000. Schneider est en fait venu me voir et m’a dit : “Hé, Warren, nous avons vraiment besoin d’aide. Pourriez-vous nous construire ce modèle ?” Ce modèle est finalement devenu le logiciel fondateur d’Optimal Dynamics. Mais même depuis la construction de ce modèle, qui pouvait gérer l’incertitude, c’est à ce moment-là que mon travail sur la programmation dynamique approximative est sorti.
Je dirais que tous les quelques années, j’ai eu un autre de ces grands moments d’illumination. En fait, même depuis que j’ai obtenu mon diplôme, j’ai eu quelques moments d’illumination supplémentaires. Je veux dire, ce domaine est tout simplement incroyablement riche, et j’ai toujours ce genre de moments où je me dis : “Oh mon Dieu, je n’y avais jamais pensé de cette façon-là.”
Conor Doherty : Joannes, est-ce que cela correspond à la façon dont vous êtes arrivé à la prévision probabiliste ? Beaucoup de moments d’illumination ?
Joannes Vermorel : Oui, en quelque sorte. C’était pour moi un parcours légèrement différent car lorsque j’ai créé Lokad en 2008, j’ai en fait suivi directement les théories de la chaîne d’approvisionnement mainstream. Donc, ce n’était pas tant quelqu’un qui venait me voir et même prononçait le mot stochastique. Je suis presque sûr que la plupart des gens que j’ai rencontrés jusqu’à très tard dans ma vie, si j’avais prononcé le mot stochastique, ils n’auraient pas été sûrs que je parlais de quelque chose comme une variante d’élastique ou quelque chose comme ça.
Mais bon, ils étaient intelligents, mais ils n’étaient pas statisticiens ou probabilistes ou quoi que ce soit. Et donc, mon parcours ressemblait plus à cela : au cours des premières années de Lokad, j’ai réellement appliqué ces méthodes déterministes avec beaucoup de succès en tant que fournisseur de logiciels d’entreprise, ce qui signifie que vous parvenez réellement à vendre vos produits. Cela ne signifie pas que cela fonctionne réellement, vous savez, ce sont deux mesures différentes. Vous pouvez réussir en tant que fournisseur d’entreprise et ne rien avoir qui fonctionne réellement.
Il y a eu des concurrents qui ont fait toute leur carrière en ne faisant que cela. Mais donc, il m’a fallu en fait quelques années pour réaliser que cela ne fonctionnait tout simplement pas, et que cela ne fonctionnerait jamais. Que la perspective mainstream, la perspective de la chaîne d’approvisionnement, qui repose sur cette perspective totalement déterministe selon laquelle il n’y a pas d’incertitude, que le succès n’était pas au coin de la rue. Il ne s’agissait pas d’obtenir encore ce 1% supplémentaire de précision des prévisions qui ferait soudainement fonctionner les choses.
Non, il m’a fallu plusieurs années, environ quatre ans, pour abandonner l’idée que malgré les progrès réalisés en matière de prévisions, malgré l’amélioration du processus, de tout, non, le succès n’était pas au coin de la rue. Et donc, nous avons eu ce moment de révélation, mais c’était plus par désespoir que par suite d’une grande conversation avec quelqu’un qui m’a éclairé. Donc, de toute façon, nous en sommes arrivés là un peu. Cela a pris du temps. Mais je dirais qu’aujourd’hui, une décennie plus tard, c’est maintenant douloureusement évident. Je dirais que mes premières années chez Lokad ont été consacrées à essayer de résoudre les problèmes de chaîne d’approvisionnement sans prendre en compte l’incertitude. C’était une impasse totale, et eh bien, il m’a fallu quelques années pour y arriver.
Warren Powell: Quels sont les défis que j’ai trouvés, si je peux, donc venant du côté académique, Joannes, quand je te parle, j’ai presque l’impression de parler à un collègue universitaire, mais tu viens du côté industriel. Mon laboratoire était inhabituel dès le premier jour. J’ai dû sortir et aller voir les entreprises, parler avec elles et obtenir de l’argent. La National Science Foundation, qui finance de nombreux universitaires, avait une politique explicite dans mon domaine. Ils disaient : “Nous ne finançons pas la recherche. Nous la bénissons. Allez chercher de l’argent auprès de l’industrie, et ensuite nous saupoudrerons de la poussière d’ange de la NSF.”
Mais nous avons beaucoup trop d’universitaires, et cela persiste encore aujourd’hui, où ils ne travaillent pas avec l’industrie, donc ils travaillent avec des modèles inventés, et ils prouvent leurs théorèmes, ils effectuent leurs travaux numériques, et tout cela se fait entièrement au sein de la communauté universitaire. Et cela est particulièrement vrai pour l’optimisation stochastique. Ce n’est pas aussi vrai pour l’apprentissage automatique. Les spécialistes de l’apprentissage automatique sortent, ils obtiennent de vrais ensembles de données, ils ajustent des modèles.
Ce n’est même pas vrai pour l’optimisation déterministe. Il n’y a pas de pénurie d’optimisation déterministe dans le monde réel. Mais ce que j’appelle maintenant les décisions séquentielles, cela me permet de m’éloigner de ce mot stochastique, il y a quelque chose dans ce domaine où il y a cet océan d’articles sur des modèles inventés par des universitaires qui ne comprennent pas vraiment quels sont les vrais problèmes parce qu’ils sont difficiles à travailler avec l’industrie, et il faut obtenir des entreprises, et j’ai eu des entreprises. Elles ont dû travailler sur ce qu’elles ont ensuite appelé la pointe de l’innovation, où elles devaient être l’entreprise où j’ai appris ce qui fonctionnait et ce qui ne fonctionnait pas.
Donc, c’est vraiment un problème de fonctionnement des universitaires. Une chose, j’ai eu une carrière de publication réussie, mais bon, vers la fin, je me suis dit : “Vous savez, c’est un peu un jeu.” Vous savez, pour être publié, il faut suivre un certain style que les revues veulent, et la communauté de l’optimisation stochastique n’est pas une seule communauté. Il y en a plus d’une douzaine. Elles ont toutes leurs propres langages, styles, petits outils et techniques, et elles en sont toutes très fières, et elles prouvent leurs théorèmes, et elles font même des calculs, mais presque rien de tout cela ne fonctionne en pratique.
Conor Doherty: Eh bien, merci. Pour souligner ce point, la différence entre une approche purement académique et une approche plus pratique, nous parlions de l’approche déterministe de la prévision par rapport à l’approche distributionnelle ou probabiliste. Je vais simplement utiliser le terme probabiliste pour simplifier. Warren, à vous d’abord, pour expliquer aux personnes qui pourraient entendre cela pour la première fois, cette dichotomie. Quelle est la différence, selon vous, entre l’approche déterministe de la prévision et l’approche probabiliste, et pourquoi l’approche probabiliste est-elle, disons, supérieure selon vous ?
Warren Powell: D’accord, donc chaque fois que je rencontre quelqu’un du monde des affaires qui utilise le mot “prévision”, je dis immédiatement d’accord, il veut dire prévision ponctuelle. Tout le monde aime la prévision ponctuelle. Ils veulent savoir : “Je vais vendre 500 widgets ou deux voitures ou il y aura six camions de marchandises.” Ils aiment ce chiffre parce qu’il est actionnable. Il dit : “Oh, il y aura six camions, donc je dois avoir six chauffeurs.”
Le défi, et d’ailleurs, cela se produit tous les jours dans le transport de charges complètes. Vous aurez un expéditeur important, mais il sait qu’il est l’un de vos principaux expéditeurs et il appellera et, pour citer les mots d’un répartiteur, il dira : “Regardez, ce gars peut appeler et avoir besoin de 10 à 20 camions.” Eh bien, c’est assez frustrant, mais c’est le monde réel dans la répartition. Mais dans les modèles de prévision, toutes les mathématiques sont conçues pour obtenir un seul chiffre.
Les gens aiment aussi un seul chiffre. C’est actionnable, c’est facile à comprendre. Si vous dites : “Eh bien, cela sera quelque part entre 10 et 20”, vous savez, combien de chauffeurs suis-je censé avoir pour répondre à une demande qui se situe entre 10 et 20 ? Eh bien, je vais vous dire ce que font les transporteurs routiers. Ils diront : “Eh bien, c’est un transporteur vraiment important. Peut-être que je n’aurai pas 20 chauffeurs, mais peut-être que j’en aurai 17. Mais s’il arrive et qu’il n’a besoin que de 12, alors je prendrai ces cinq chauffeurs et je les enverrai ailleurs.” Et ils auront ce qu’on appelle en optimisation un recours. C’est comme : “Eh bien, si cela se produit, voici ce que je ferai.”
Mais tout le monde aime cette prévision ponctuelle. J’ai commencé à faire des prévisions distributionnelles dans les années 1990 et je travaillais avec Yellow Freight. J’ai dit : “Eh bien, j’aimerais faire des intervalles de confiance”, et ils sont revenus en disant : “Nos gars ne savent tout simplement pas comment gérer cela.” Notre plus gros problème, il n’y a pas si longtemps, nous travaillions avec un expéditeur majeur et ils étaient vraiment enthousiastes à propos des prévisions distributionnelles, puis ils se sont retournés et ont dit : “Ouais, eh bien, prenons cela et voyons à quel point c’est précis.” Je vois Joannes sourire. C’est comme : “D’accord, alors comment gérez-vous la question du ‘Oh, c’est génial, la prévision distributionnelle, ça a l’air cool. À quel point est-ce précis ?’ Comment répondez-vous à cette question, Joannes ?”
Joannes Vermorel: Oui, je veux dire, avec quelque chose comme l’entropie croisée ou toute autre métrique qui fonctionne pour les prévisions probabilistes, CRPS en est une autre. Mais en effet, c’est le cas. Lorsque vous entrez dans le domaine de ces distributions de probabilité, vous avez toujours des métriques, mais ce ne sont pas des métriques faciles et intuitives que vous pouvez expliquer à des enfants de collège et qu’ils comprendraient. La norme un, la norme deux, au collège, on comprend un peu. Quelle est la distance ?
Lorsque vous entrez dans les distributions de probabilité, pour être honnête, ce n’est pas si difficile. Ce n’est pas particulièrement difficile si vous optez pour, disons, la méthode du maximum de vraisemblance ou quelque chose du genre. Ce n’est pas quelque chose pour lequel vous avez besoin d’un doctorat en statistiques pour comprendre, mais cela prendra plus de 2 minutes. Et puis l’intuition, vous devrez probablement passer par le formalisme et cela prendra environ une demi-heure, peut-être deux heures si vous êtes très ignorant.
Warren Powell: Oui, et à ce moment-là, les gens d’affaires, leurs yeux se vitrifient et ils se disent : “Oh ouais, j’ai compris ça. Alors à quel point c’est précis ?”
Joannes Vermorel: C’est quelque chose de très étrange. Il s’agit d’avoir une prévision plus riche. Lorsque nous prenons ces décisions que nous voulons optimiser, il s’agit d’améliorer votre profondeur de vision. Que voyez-vous ? Je veux dire, vous faites une projection sur l’avenir, une déclaration sur l’avenir. Mais pas à quel point c’est précis, mais à quel point c’est complet, à quel point votre prévision est-elle couvrante ?
Donc c’est quelque chose de très inhabituel car les gens diraient avec une prévision ponctuelle, ils auraient quelque chose d’incroyablement précis. C’est un peu comme si vous preniez un microscope et que vous zoomiez mille fois sur un point de votre bureau. Vous pouvez avoir votre microscope et regarder un millimètre carré sur votre bureau et avoir une vision parfaite, mais le reste de votre bureau, vous ne voyez rien. Et les gens disent : “Oh, vous savez quoi ? Je pense que j’ai besoin d’un microscope plus grand pour pouvoir regarder ce millimètre carré encore plus précisément.” Et la prévision probabiliste, c’est : “Non, vous devriez probablement jeter un coup d’œil au reste du bureau plutôt que de vous concentrer sur ce point que vous voyez déjà assez nettement par rapport à tout le reste.”
Warren Powell: Maintenant, voici quelque chose que tout chef d’entreprise, en particulier dans le secteur de la vente au détail, comprendra parfaitement, c’est la couverture de la demande. Et ils diront : “Regardez, nous voulons satisfaire 97% de la demande.” Ce n’est pas une demande inhabituelle. Mais comment satisfaire 97% sans le concept d’une prévision de distribution ? C’est là que vous pouvez revenir en disant : “Oui, mais vous voulez couvrir 97% de la demande. Je ne peux pas le faire tant que je n’ai pas une prévision de distribution. Ai-je besoin de 20 unités supplémentaires ou de 200 unités supplémentaires ?” C’est peut-être là que nous devons dire : “Eh bien, si vous voulez cela, nous devons faire de la prévision de distribution ou de la prévision probabiliste.”
Joannes Vermorel: Et la chose intéressante, c’est qu’une fois que nous avons commencé à le faire chez Lokad en 2012, et en lien avec votre livre, il nous a fallu en fait quelques années après avoir commencé à faire des prévisions probabilistes avant de vraiment réussir à comprendre comment faire une quelconque optimisation sophistiquée par-dessus. Parce que vous voyez, je dirais que la prévision probabiliste était difficile à accepter le fait que nous devions le faire. C’était donc la première partie de mon parcours chez Lokad.
Il s’est avéré qu’en 2012, la prévision probabiliste était devenue assez populaire pour des raisons totalement différentes dans l’apprentissage profond. Elle était très populaire dans l’apprentissage profond car les métriques d’entropie croisée, par exemple, donnent des gradients très raides qui aident à l’optimisation. Donc la communauté de l’apprentissage profond utilisait ces prévisions probabilistes, bien qu’elle ne s’intéressait absolument pas aux probabilités. Elle s’intéressait uniquement à la prévision ponctuelle, mais les gradients super raides que l’on pouvait obtenir avec essentiellement l’entropie croisée étaient des propriétés numériques très intéressantes pour faire fonctionner ces modèles.
Donc c’était un peu une déviation. Nous avons commencé à utiliser ces prévisions probabilistes pour elles-mêmes plutôt que d’être simplement des astuces numériques astucieuses pour les gradients. Mais ensuite, une fois que vous avez cela, vous réalisez que vous avez des décisions que vous voulez optimiser. Vous voulez prendre la meilleure option et évidemment, il y aura une répétition des affaires, donc il y a cette séquence de décisions.
Et vous vous retrouvez avec la question : “De quoi ai-je besoin en tant qu’instrument logiciel pour résoudre cela ?” Et c’est là que, en lien avec votre livre, c’est un problème très difficile car le principal défi auquel j’ai été confronté était même un semi-vide en termes de paradigmes. Il n’y a pas, comme vous l’avez dit, vous aviez une demi-douzaine de communautés où vous pouviez publier, mais il n’y a pas, à mon sens, même aujourd’hui, une communauté vraiment unifiée qui prend simplement ces problèmes d’incertitude où vous voulez faire de l’optimisation et qui les prend en charge. Ce n’est tout simplement pas là.
Donc c’était un peu au hasard. J’avais fait un peu d’apprentissage par renforcement, j’avais fait de l’optimisation classique. Mon défi était vraiment ce manque de paradigmes. Et c’est assez intéressant dans ce livre très dense, vous proposez en fait vos propres paradigmes pour penser le domaine et le découper. Et oui, je veux dire, ce livre est encore aujourd’hui unique en son genre. Il n’y en a pas tant que ça.
Je veux dire, si vous voulez un livre sur, disons, les classificateurs, pour l’apprentissage automatique, il y en aura 500 qui vous donneront tous les classiques des classificateurs, de la classification linéaire aux machines à vecteurs de support en passant par les arbres de renforcement de gradient, et bien d’autres encore. Il y a environ 500 livres qui définissent le problème de la classification, et ainsi de suite. Ici, c’est encore très, je dirais, c’est encore quelque chose que, eh bien, désolé pour ma réponse très longue, la communauté ne regarde tout simplement pas encore le problème.
Warren Powell: Oui, le problème des décisions et de l’incertitude est un domaine étonnamment riche. Si vous vous tournez vers la programmation mathématique déterministe, oui, il y a beaucoup de programmes mathématiques déterministes, mais ils suivent tous le paradigme fondamental établi par George Dantzig. Vous avez une fonction objectif, vous avez une contrainte, vous avez une variable de décision, vous avez un algorithme. D’accord, et parce que tout le monde s’inscrit dans ce cadre, l’apprentissage automatique, les statistiques, l’apprentissage automatique, encore une fois, vous avez une fonction, vous essayez de l’ajuster aux données.
Maintenant, il y a de nombreux ensembles de problèmes différents, mais parce qu’ils sont tous essentiellement dans cette même approche, voici l’une des fonctions d’une famille. Et donc la plupart des livres de statistiques populaires vous exposent à toutes les différentes fonctions. Et donc vous suivez un cours de statistiques ou d’apprentissage automatique, pratiquement tout le monde sort avec à peu près le même ensemble d’outils. Et cela leur permet également d’utiliser ces logiciels du domaine public.
Une fois que vous mélangez les décisions et l’incertitude, en 2014, j’ai donné cette conférence, un tutoriel à INFORMS, et je l’ai appelée “Éclaircir la jungle de l’optimisation stochastique”. Et j’ai dû écrire un article de tutoriel. Je me souviens toujours d’un des rapports des arbitres. L’arbitre dit : “Oh, ce n’est pas si mal. Peut-être devriez-vous l’appeler ‘Le jardin de l’optimisation stochastique’”. Et j’ai éclaté de rire et j’ai dit : “Vous n’avez jamais essayé de publier un article dans ces domaines. C’est une jungle parce que vous avez toutes ces communautés différentes, bien plus d’une douzaine, et elles parlent des langues différentes. J’ai compté huit systèmes de notation fondamentalement différents. Et bien sûr, vous avez les dérivés.
Donc l’apprentissage par renforcement a adopté la notation des processus de décision de Markov, mais la commande stochastique a sa propre notation et la programmation stochastique a sa propre notation, les arbres de décision. Et c’est un vrai désordre. Mais chacun a une communauté assez importante. Ils ont leur groupe de personnes qui parlent tous la même langue. Et quand vous écrivez des articles, ils s’attendent à certaines choses.
J’ai dirigé un laboratoire suffisamment grand et diversifié. Donc, alors que j’ai commencé et terminé dans le transport de marchandises, au milieu, j’ai dirigé tout un laboratoire sur les systèmes énergétiques. J’ai fait tout un tas de travaux sur l’apprentissage optimal et les sciences des matériaux. C’était une expérience intéressante pendant un certain temps. Le commerce électronique, la finance, et à Princeton, vous devez faire une thèse de fin d’études. J’ai donc supervisé environ 200 thèses. Et je vous dirai, lorsque vous supervisez suffisamment d’étudiants et que vous traitez suffisamment de problèmes, à l’époque où je venais d’écrire mon livre ADP et que je pensais : “Wow, ADP c’est génial. Regardez, je peux optimiser les entreprises de transport. Et ce n’est pas faux. C’est pour de vrai. Il y a eu un moment où je disais : “Mais ce n’est pas juste une application bidon. C’est une véritable application industrielle. Ça doit pouvoir tout faire.” J’avais tort.
Bon, c’est dans la deuxième édition de mon livre ADP que j’ai écrit un chapitre, le chapitre six, qui disait : “Vous savez quoi, il semble y avoir ces quatre classes de politiques.” Maintenant, je n’en avais que trois. La quatrième, je me suis trompé. Et six mois après l’avoir envoyé à l’éditeur, j’ai eu cette révélation : “Oh mon Dieu, j’ai trouvé la quatrième classe de politique.” Et à partir de là, jusqu’à ce que le grand livre de 2022 soit publié, j’ai continué à évoluer, et j’ai écrit un autre article de tutoriel en 2016, et puis la grande chose, c’est que la revue European Journal of Operational Research m’a invité à écrire un article de revue.
C’est Roman Slowinski, l’un des rédacteurs en chef, qui m’a invité à le faire, et cet article a fini par être le plan de ce grand livre. Dès que j’ai terminé cet article, je me suis dit : “D’accord, c’est le nouveau livre”, et je voulais faire une troisième édition de mon livre ADP, et ce que je dis, c’est : “Non, je ne peux pas, ADP, en particulier l’approximation de la fonction de valeur, c’est un outil très puissant pour un très petit nombre de problèmes, et si vous avez un marteau, et que vous avez votre marteau préféré, et nous avons tous nos marteaux préférés, tout le monde dans le milieu universitaire a son marteau préféré, vous pouvez trouver des problèmes qui correspondent à votre marteau.
Mais si vous venez d’un domaine d’application, prenez un domaine d’application riche comme la gestion de la chaîne d’approvisionnement, eh bien, vous aurez besoin d’une boîte à outils. Vous ne pouvez pas vous lancer dans la gestion de la chaîne d’approvisionnement avec un simple marteau, et peu importe quel marteau vous avez, vous devrez y aller avec une boîte à outils complète, car faire des prévisions de distribution, c’est bien, mais à la fin de la journée, vous devez prendre une décision, ce qui signifie que vous prenez une décision dans l’incertitude.
Conor Doherty : Eh bien, si je peux juste rebondir là-dessus car c’est parfaitement enchaîné. Lorsque vous parlez de la boîte à outils et que vous parlez de l’accent mis sur les prévisions probabilistes, en fournissant quelque chose de concret, et que les gens veulent quelque chose de concret, eh bien, pourriez-vous expliquer, dans le contexte de la gestion de la chaîne d’approvisionnement, comment votre cadre universel pour la prise de décision séquentielle conduit réellement à de meilleures décisions ?
Warren Powell : Eh bien, l’un de mes plus grands changements, j’ai cette diapositive PowerPoint que j’adore. J’ai environ 15 livres dessus, tous traitant d’un problème de décision séquentielle quelconque. Chacun de ces livres, et l’un d’entre eux est mon livre ADP, est un marteau à la recherche d’un clou. Nous avons tous notre technique préférée pour prendre des décisions, donc les livres ont été écrits autour d’un ou deux marteaux fondamentaux.
Si vous venez des applications, vous commencerez à réaliser que tous ces marteaux sont bons. Aucun d’entre eux ne fonctionne sur tous les problèmes. Lorsque vous venez réellement d’un côté application, vous ne pouvez pas choisir votre problème. Les universitaires travaillant sur des méthodes, nous choisissons le problème sur lequel tester nos méthodes. Lorsque vous venez d’une application, vous ne pouvez pas le faire. On vous dit : “Voici le problème que je dois résoudre. Que vas-tu faire ?”, et ma grande réalisation de carrière a été de réaliser que toutes les méthodes se classent dans ces quatre catégories, et puis dans l’article de 2019, j’ai réalisé que ces quatre catégories se classaient dans deux grandes catégories.
La catégorie la plus simple prend une décision basée sur une fonction qui ne planifie pas dans le futur, mais qui a des paramètres réglables que vous devez régler pour qu’ils fonctionnent bien dans le futur. L’exemple le plus simple dans les chaînes d’approvisionnement est la commande de stocks. Lorsque les stocks descendent en dessous d’un certain niveau, vous commandez jusqu’à un autre niveau. Je ne regarde pas vers l’avenir. Je ne planifie pas. C’est juste une règle, mais ces niveaux de commande doivent être réglés pour qu’ils fonctionnent bien dans le temps.
Le deuxième des plus simples est généralement, c’est presque toujours un modèle d’optimisation déterministe, simplifié, mais avec des paramètres réglables. Maintenant, c’est quelque chose que j’ai appelé “approximation de la fonction de coût”. Vous ne le trouverez nulle part ailleurs que dans mon gros livre, mais largement utilisé dans l’industrie. Les gens de l’industrie diraient : “Oui, nous le faisons tout le temps. Nous pensions juste que c’était un hack de l’industrie”.
Je me suis rendu compte que si vous prenez un programme linéaire qui est une approximation d’un problème stochastique compliqué, puis vous y mettez des paramètres réglables pour capturer des choses comme les stocks tampons ou les corrections pour le rendement ou un écart, vous savez, les compagnies aériennes le feront, elles diront simplement : “D’accord, lorsque je vole d’Atlanta à New York, il peut y avoir un retard dû aux conditions météorologiques. Je vais ajouter 20 minutes supplémentaires”.
Résoudre ces problèmes déterministes avec des paramètres réglables est extrêmement puissant. Les universitaires aiment le dénigrer en disant que c’est “Oh, juste des bêtises déterministes”. J’ai décidé que ce n’était vraiment pas différent de la prévision paramétrique. Donc, lorsque vous faites des prévisions, vous voulez savoir que la demande est une fonction du prix. Eh bien, un prix plus élevé entraînera une demande plus faible. Inventons une fonction décroissante, peut-être juste une ligne, peut-être une courbe en S, et trouvons la meilleure fonction possible. Nous pouvons faire la même chose avec des modèles déterministes paramétrés.
Maintenant, les universitaires adorent l’autre classe de politiques. Ce sont les politiques qui prennent une décision maintenant en planifiant dans le futur. L’une d’entre elles consiste à prendre une décision maintenant, maintenant je prends l’action. Disons que j’ai une certaine quantité de stocks. Je commande plus de stocks. Cela me met dans l’état futur, et j’obtiens la valeur d’être dans cet état. C’est ce qu’ils appellent la programmation dynamique ou l’équation de Bellman. Les universitaires adorent l’équation de Bellman, ou si vous venez de l’ingénierie, ils l’appellent l’équation de Hamilton-Jacobi. Et si vous suivez un cours dans n’importe quelle bonne université qui enseigne comment prendre des décisions dans le temps sous incertitude, la première chose qu’ils vont vous montrer, c’est l’équation de Bellman.
J’ai écrit un livre de 500 pages entièrement basé sur l’approximation de l’équation de Bellman. J’en étais très fier. C’est une technique puissante qui fonctionne sur de nombreux problèmes. Bon, je veux dire, honnêtement, allez dans une communauté d’entreprises où les gens prennent des décisions séquentielles et demandez : “Combien ont même entendu parler de l’équation de Bellman ?”, et presque personne. Personne n’utilise l’équation de Bellman.
La dernière classe est la planification à long terme. Je prends comme exemple Google Maps. Si vous voulez planifier un itinéraire vers une destination, vous devez planifier jusqu’au bout. Il existe plusieurs modèles de planification qui doivent planifier dans le futur. Ils n’utilisent pas une fonction de valeur. Ils font explicitement un modèle complet dans le futur, et cela se fait beaucoup plus souvent que de sortir et de faire une approximation de fonction de valeur.
Donc, les universitaires adorent vraiment ces techniques plus avancées. Lorsque vous sortez dans le monde réel, vous allez surtout trouver l’une des trois classes de politiques : les règles simples comme “commander jusqu’à”, “acheter bas, vendre haut” ou “porter un manteau”. Pour les problèmes plus complexes, je fais un modèle déterministe qui n’est pas trop compliqué. J’y ajoute quelques paramètres réglables et je les ajuste. La troisième technique est la planification déterministe à long terme, comme Google Maps. Ce sont les trois principales.
Je pense que si vous pouviez réellement dresser une liste de toutes les décisions que tout le monde prend n’importe où dans n’importe quel contexte, 97% de ces décisions seraient prises avec ces trois classes de politiques. Devinez quoi ? Elles ne sont pas mises en avant dans les livres. C’est là que je veux en venir. Une grande partie de cette réflexion, je vais vous l’attribuer ; vous ne trouverez pas cette discussion particulière même dans mon gros livre, donc il faudra attendre la deuxième édition.
C’est mon moment “aha” où je me suis dit, vous savez, prenons les quatre classes de politiques, divisons-les en deux : planification déterministe à long terme et planification stochastique à long terme. Maintenant, j’ai cinq politiques, et je me suis demandé lesquelles sont les plus utilisées. La catégorie un, largement utilisée, ce sont les trois premières : les approximations de fonction de politique comme les règles simples, les approximations de fonction de coût qui sont déterministes paramétrées, et la planification déterministe à long terme. Ce sont les trois principales.
Maintenant, il y a des moments où nous avons besoin d’une planification stochastique à long terme. Par exemple, je commande de Chine ; cela prend normalement cinq semaines, mais cela pourrait prendre sept semaines. Eh bien, si vous dites, eh bien, je vais prévoir sept semaines, c’est en fait une forme de planification stochastique à long terme appelée optimisation robuste en utilisant une prévision probabiliste. Parce que j’ai prévu le maximum possible plutôt que ce qui est typique.
Les approximations de fonction de valeur, le sujet de mon précédent livre, sont en bas. Je pense honnêtement que c’est un excellent outil pour de nombreux problèmes. Si vous en avez vraiment besoin, vous feriez mieux d’appeler un expert, mais pour les tâches quotidiennes, vous ne finirez tout simplement pas par l’utiliser. C’est beaucoup trop difficile à utiliser.
Maintenant, certaines personnes parleront d’apprentissage par renforcement. L’apprentissage par renforcement, au début, était simplement un autre nom pour la programmation dynamique approximative. C’étaient simplement des mots différents pour la même chose. La communauté ORL a découvert ce que j’ai découvert ; ils ont constaté, wow, cela ne fonctionne pas toujours. Si vous passez de la première édition du livre de Sutton et Barto, où vous ne verrez que de la programmation dynamique approximative, à la deuxième édition, si vous savez ce que vous cherchez, vous pouvez trouver les quatre classes de politiques dans leur deuxième édition. Mais je pense toujours que la plupart des gens, lorsqu’ils disent qu’ils utilisent l’apprentissage par renforcement, veulent dire la programmation dynamique approximative. Les informaticiens sont tellement meilleurs que nous autres pour promouvoir leurs outils.
Conor Doherty : Eh bien, merci. Je vais immédiatement vous passer la parole, Joannes. Est-ce que cela correspond à votre vision de la façon dont nous prenons des décisions ici chez Lokad ?
Joannes Vermorel : Pas tout à fait, mais pour être honnête, cette division est, je pense, très techniquement correcte dans la façon dont vous découpez le domaine. Je ne remettrai pas en question ce point. Et quand je parle du domaine, je veux dire avoir le genre de modèle intellectuel convenu où nous avons des fonctions de transition d’état et une fonction de récompense, puis nous voulons optimiser ces décisions, etc. Donc ici, si nous le prenons de ce point de vue, je dirais que oui, la façon dont vous le décrivez est correcte.
Mais la façon dont j’aborde personnellement le problème est à travers des angles relativement différents. Ma première perspective, même avant de considérer la liste des techniques, serait : qu’en est-il de l’énoncé du problème lui-même ? Le cheminement vers l’énoncé du problème est crucial. C’est un peu une critique injuste de ce livre car il fait déjà 1100 pages, et apparemment, vos éditeurs ne voulaient pas d’un livre de 3000 pages.
Chez Lokad, lorsque nous abordons cela, la première question que nous posons est de savoir dans quelle mesure nous devons approximer l’état. Les gens pourraient penser que c’est acquis, mais ce n’est pas le cas. Vous modélisez toujours le monde réel, et vous ne le modélisez pas jusqu’à la position de chaque atome, donc il y a une énorme marge de manœuvre dans ce que vous décidez d’être un état. Ensuite, vous avez la fonction de transition, qui a également une énorme marge de manœuvre pour décider comment vous pouvez passer d’un état à une autre version de cet état.
Je crois que cela fait partie de la résolution du problème. Si vous faites le mauvais choix à cette étape, si vous avez un état qui est beaucoup trop granulaire ou une fonction de transition qui est beaucoup trop complexe, votre outil se désintégrera simplement par la suite. Donc, la première chose, pour moi, est de faire le bon choix et d’avoir le bon paradigme pour le faire. Il en va de même pour la fonction de coût ou la fonction de récompense.
Nous avons un cas classique pour les clients qui ont besoin d’évaluer le coût d’une rupture de stock ou le coût d’une remise. Si vous accordez une remise une fois, vous cédez une partie de votre marge. C’est correct, vous pouvez le mesurer, c’est assez simple. Mais ensuite, vous créez également une mauvaise habitude car les gens s’attendront à ce que cette remise soit appliquée à nouveau. Vous vous créez donc un problème pour plus tard.
Il est très difficile d’évaluer exactement le comportement, combien de temps les gens se souviendront de vos remises précédentes, et ainsi de suite. C’est votre fonction de transition ; vous devez l’approximer. Ma première chose serait les approximations avant d’approximer les différents engrenages du processus algorithmique avec ce cadre.
Ma perspective commence plus tôt avec la définition même des modèles. Je ne prends pas la perspective que le modèle en général, ce que vous voulez optimiser, est donné. Pour moi, cela fait partie de la méthodologie. Ce serait la première chose. Désolé, je n’ai pas fini. La deuxième chose est, mais c’est plus mon expérience en informatique, de regarder la dimension du problème.
C’est très différent si vous attaquez un petit problème, comme quelques milliers de décisions comme un itinéraire dans une ville avec quelques centaines de livraisons, et ainsi de suite. Mille décisions, en ce qui me concerne, c’est un très petit problème. Nous avons des problèmes où nous avons jusqu’à un milliard de variables. Si nous regardons une grande chaîne d’approvisionnement, comme un hypermarché, vous pouvez avoir dans un hypermarché 100 000 SKUs. Si vous avez mille hypermarchés, cela vous donne 100 millions de SKUs. Pour chaque SKU, vous avez une demi-douzaine de décisions, et vous répétez cela quelques semaines à l’avance. Vous pouvez vous retrouver avec des problèmes qui sont soit très petits, comme l’optimisation des itinéraires, soit très grands, où ils ne rentreraient même pas en mémoire.
Donc, pour moi, ce serait le genre de chose où si je dois aborder le problème, je commencerais par essayer de capturer les caractéristiques clés du problème. La dimensionnalité en est une. Une autre, qui est très importante, sera la difficulté de naviguer vers la meilleure solution. Si je prends ces deux exemples, l’optimisation des itinéraires est quelque chose de très non linéaire, très fragile. Vous bougez simplement, échangez deux emplacements, et vous pouvez passer d’une solution très mauvaise à une solution très bonne en échangeant simplement deux points. Donc votre solution se comporte un peu comme un cristal ; elle a cette sorte de fragilité. Il est très facile de perturber la solution et de passer de quelque chose de bon à quelque chose de très terrible.
D’autre part, si je passe à ce spectre de problèmes avec mon réseau de supermarchés, si je décide de mettre une unité qui était censée être là ailleurs, le problème est très insensible. Vous pouvez y aller avec beaucoup de marge de manœuvre. Vous voulez avoir quelque chose de beaucoup plus orienté dans la bonne direction. Ce spectre va des propriétés cristallines aux propriétés boueuses. Les propriétés cristallines sont fragiles et cassantes, et elles se cassent facilement, tandis que les propriétés boueuses sont informes. Tant que vous êtes dans la bonne direction, c’est un peu correct. Cela serait la deuxième considération.
La troisième serait la caractéristique temporelle que vous recherchez. Les caractéristiques temporelles vont de la pilotage des robots dans un entrepôt, où vous voulez des réponses constantes en temps constant et en mémoire en millisecondes. Lorsque les gens disent que vous avez 10 millisecondes pour donner une réponse, si vous ne le faites pas, nous avons toutes sortes d’autres problèmes, contrairement à un autre problème comme l’achat à l’étranger, où il faudra 10 semaines pour venir de Chine. Si votre calcul prend 24 heures, ce n’est pas grave. Nous pouvons nous permettre ces 24 heures ; nous n’avons aucune contrainte quelconque.
C’est donc un peu ainsi que je découpe le domaine. Je comprends que la façon dont je découpe le domaine ne dit pas grand-chose sur les algorithmes que vous voulez utiliser, mais j’utilise cela comme un moyen d’éliminer ce que je considérerai même comme des solutions potentielles pour le genre de problèmes qui m’intéressent.
Warren Powell: J’adore que vous veniez d’un domaine d’application. Une des choses que j’ai découvertes lorsque j’ai commencé à écrire mon livre sur l’analyse de la supply chain, qui est le premier livre que j’ai jamais écrit sur une classe de problèmes, c’est que tous mes autres livres ont été fondamentalement des livres de méthodes, et c’est très amusant.
Maintenant, donnez à mon gros livre du crédit pour une chose : j’ai un chapitre entier, long de 90 pages, consacré à la modélisation, mais à la modélisation d’une manière très générique. J’apprécie absolument tout votre processus que vous décriviez. C’est une variable d’état. Dans les problèmes complexes, j’ai des tutoriels où je dis que nous avons cinq éléments du problème, en commençant par les variables d’état. Mais lorsque je fais de la modélisation, je fais la variable d’état en dernier.
De plus, c’est vraiment itératif. Vous allez avoir un processus où vous allez passer par la modélisation. La variable d’état n’est qu’une information. Vous passez par le modèle et vous dites, d’accord, j’ai besoin de cette information, de cette information, de cette information - ah, voilà ma variable d’état. Mais, par exemple, comment prenez-vous des décisions ? Cela dépend de la façon dont vous modélisez l’incertitude. Comment modélisez-vous l’incertitude ? Cela dépend de la façon dont vous prenez des décisions.
Je décris donc le processus de modélisation de l’incertitude et de prise de décision comme l’escalade de deux échelles. Ne venez pas avec une méthode incroyablement sophistiquée pour prendre des décisions en cas d’incertitude si votre modèle n’a qu’un modèle de probabilité très basique. Avec nos problèmes complexes, nous pouvons faire des modèles d’incertitude aussi compliqués que nous le souhaitons.
En général, vous ne commencerez pas avec le modèle le plus compliqué. Vous commencerez par quelque chose de plus basique. Ensuite, vous voulez avoir quelque chose qui prend des décisions. Vous n’avez pas besoin de faire quelque chose d’incroyablement compliqué car c’est juste un modèle de base. Une fois que vous avez un modèle de décision décent, vous pouvez revenir à votre modèle d’incertitudes car peut-être maintenant vous voulez obtenir d’autres mesures de risque.
Maintenant, vous voulez prendre des décisions qui reflètent le risque. Donc, vous escaladez cette échelle, et je suis sûr que tout votre processus chez Lokad a été itératif. Nous voulons toujours le modèle le plus simple qui résout le problème. La question est de savoir ce qu’il faut pour atteindre les objectifs commerciaux. Et c’est un processus d’apprentissage.
Joannes Vermorel: Absolument. Je donne crédit à votre livre. Je pense que vous énumérez, je pense quelque chose comme, j’oublie si c’est comme 15 types différents d’incertitude et c’est probablement la liste la plus longue que j’ai vue rassemblée et oui, c’est une préoccupation très réelle. Quand vous parlez d’incertitude, les gens pensent, oh, vous parlez simplement des inexactitudes de la prévision ponctuelle. Et je dirais, certainement pas, il y a tellement de sources d’incertitude. Cela peut être le prix des matières premières dont vous dépendez qui varie, cela peut être la main-d’œuvre dont vous dépendez qui fait grève ou qui n’est tout simplement pas qualifiée ou qui n’est tout simplement pas là.
Cela peut être la possibilité de rencontrer des problèmes de logement dans vos emplacements. Cela ne regarde l’incertitude que par le biais des inexactitudes de vos ventes car ce n’est qu’une chose, la demande de prévision des ventes, la prévision ponctuelle des ventes, c’est extrêmement limité. Je suis tout à fait d’accord avec vous. Être super itératif chez Lokad, c’est exactement ce que nous faisons, ce qui soulève une autre question, une grande préoccupation, qui est la productivité des ingénieurs que vous devez mettre sur le cas pour itérer plus rapidement.
Chez Lokad, la façon dont nous abordons généralement ces problèmes d’optimisation stochastique est d’identifier les paradigmes de programmation. Nous avons une collection de ces paradigmes. Ils ne sont pas unifiés, plutôt une petite bibliothèque de choses que vous pouvez utiliser. Ces paradigmes vous donnent un angle pour avancer relativement rapidement dans la mise en œuvre de votre solveur. Ici, je suis tout à fait d’accord avec le processus itératif. Le défi que nous avons d’un point de vue commercial est que mes clients sont très impatients.
Nous devons itérer très rapidement, mais nous traitons quelque chose de compliqué, impliquant une algorithmique de pointe. Ils doivent obtenir leur algorithme implémenté dans un temps fini. Une autre considération qui n’est jamais discutée est que de nombreuses méthodes que j’ai vues dans des livres fonctionnent si vous avez des professeurs d’université super intelligents avec une décennie pour implémenter l’algorithme. Dans le monde réel, si vous avez 100 heures pour le mettre en œuvre, certaines méthodes sont incroyablement difficiles à bien faire au niveau de l’implémentation. C’est pourquoi ces paradigmes de programmation aident. Ils fournissent un moyen de le coder d’une manière qui fonctionnera en production en un temps fini tout en itérant sur les choses.
Warren Powell: Vers la fin du chapitre 11, je pense dans la toute dernière section, j’ai une sous-section sur les aspects non techniques de l’évaluation des politiques. Donc, dans le livre, partout où j’écris toujours l’optimisation de la politique, c’est maximiser les politiques, l’espérance de quelque chose. Vers la fin du chapitre 11, qui peut être téléchargé depuis le site web, j’ai environ cinq qualités différentes comme la complexité méthodologique est l’une des qualités. Lorsque vous regardez une méthode, absolument ce que vous venez de dire est très important, la faisabilité computationnelle, la transparence. Nous avons tous codé des algorithmes et la réponse sort quelque chose et nous nous grattions la tête et nous, et le client ne comprend pas et vous voulez pouvoir dire, eh bien, voici pourquoi cela est sorti de cette façon parce que cela pourrait être une erreur de données, cela pourrait être un changement de règle.
Je veux dire, chez Optimal Dynamics, nous obtenons ces données auprès des entreprises de transport et nous rencontrons les mêmes problèmes que vous et lorsque les clients n’aiment pas une réponse, ils aimeraient que cela soit corrigé assez rapidement. L’un des outils les plus puissants et importants que j’ai développés dans mon laboratoire à l’université est un outil graphique appelé Pilot View où il y a deux modules. L’un est une carte où vous pouvez voir les flux et les filtrer de toutes sortes de façons sophistiquées, mais l’autre, je l’appelle mon microscope électronique, c’est là que je peux faire apparaître des conducteurs individuels et des charges individuelles et cliquer sur n’importe quoi et voir quel conducteur a été affecté à quelle charge, mais pas seulement quel conducteur a été affecté à quelle charge, mais quelles charges nous avons considérées car si j’ai mille conducteurs et mille charges, je ne peux pas considérer toutes les combinaisons possibles de mille conducteurs fois mille charges et cela n’a rien à voir avec l’algorithme, cela a tout à voir avec le générateur de réseau.
Donc, nous utilisons des choses sophistiquées mais je peux avoir un conducteur que je n’ai pas affecté à une charge, pourquoi pas ? Eh bien, peut-être parce que les pénalités étaient trop élevées, peut-être parce que le coût était trop élevé ou peut-être parce que l’une de mes règles d’élagage ne l’a tout simplement pas pris en compte et cela nous est arrivé. Et bien sûr, lorsque le client se plaint, vous avez besoin d’une réponse très rapidement car une fois que vous êtes sur le terrain, c’est fini pour les algorithmes compliqués.
Joannes Vermorel: Je me retrouve énormément dans cela. Je n’ai pas fait cette observation moi-même, je l’ai trouvée sur Internet, je ne me souviens pas exactement qui l’a dit, mais l’idée générale était que pour déboguer un algorithme, il faut être deux fois plus intelligent que pour implémenter l’algorithme.
Donc, si vous utilisez un algorithme qui est déjà, lorsque vous l’implémentez, aussi intelligent que possible, cela signifie que lorsque vous serez en production et que vous voudrez déboguer, vous devrez être deux fois plus intelligent et cela n’est même pas possible car l’implémentation de l’algorithme était déjà vous à votre meilleur. Vous avez donc besoin d’une solution qui n’est pas vous à votre meilleur pour que lorsque vous voulez la déboguer, vous puissiez le faire. De plus, je suis tout à fait d’accord avec ce que vous décrivez, à savoir cet outil de support. Le rôle de l’instrumentation est absolument fondamental et je pense que c’est aussi quelque chose, mais c’est difficile. Ce livre contient tellement de choses, je vous en donne crédit pour cela, ce n’est pas exactement un livre qui manque d’insights, le rôle de l’instrumentation est primordial.
La communauté classique de l’optimisation dans le sens déterministe, ils diraient simplement, combien de secondes CPU avez-vous besoin et quelle est la performance de la solution que vous obtenez et c’est tout. Mais lorsque vous entrez dans ce domaine de l’optimisation stochastique, vous aurez besoin d’une instrumentation de soutien approfondie pour comprendre ce qui se passe. Et je pense que c’est quelque chose où il y a aussi ce genre de fossé paradigmatique dans la façon de le regarder car cela signifie que ce n’est pas seulement l’outil qui vous permet de générer la décision, c’est aussi tous les instruments que vous pouvez ajouter par-dessus pour que vous puissiez donner un sens à votre processus de prise de décision, pas seulement une décision mais le processus de prise de décision, et sans cela, les gens soulèveraient des préoccupations et vous seriez bloqué et vous ne pouvez pas simplement dire, faites-moi confiance, c’est bon. En optimisation stochastique, cela ne fonctionne pas aussi bien que dans l’optimisation mathématique classique.
Warren Powell: Oui, c’est évidemment un beau défi de travailler avec l’industrie. J’ai eu cette expérience depuis le début de ma carrière. Ce n’est qu’à partir des années 1990, lorsque j’ai créé mon laboratoire et que j’ai embauché des programmeurs professionnels, tous titulaires d’un doctorat, mais dont le rôle était simplement de coder, que mon laboratoire a pu vraiment décoller. C’est incroyable, je ne sais pas si vous avez déjà connu cela, lorsque votre algorithme propose une solution et que vous ne l’aimez pas, que le client ne l’aime pas non plus, et que tout le monde est assis autour de la table en se grattant la tête en se demandant ce qui ne va pas. Le nombre de fois où nous avons fait cet exercice et où différentes personnes avaient toutes une théorie qui reflétait leurs compétences. Je suis là, oh mon Dieu, je pense que l’algorithme pourrait être plus sophistiqué, et ce gars s’inquiète des données et ce gars s’inquiète d’une erreur de programmation, et le nombre de fois où nous nous sommes assis pour émettre des hypothèses et où nous avions tous tort.
C’est vraiment incroyable. Bien sûr, j’aimerais m’asseoir avec vous à un moment donné et en savoir plus sur vos problèmes pour obtenir les données brutes. Dans mon secteur d’activité, le transport de charges complètes, nous ne travaillons qu’avec des transporteurs qui utilisent déjà un système TMS commercial, et cela ne signifie pas que c’est parfait, mais cela signifie que nous sommes bien plus avancés. Mais c’est un défi, c’est très amusant. Une chose que j’aimerais pouvoir faire davantage, c’est de défier la communauté universitaire avec des problèmes du monde réel, et j’ai un peu abandonné la communauté universitaire.
Ils ne sont pas là pour résoudre des problèmes, ils sont là pour prouver des théorèmes et écrire des articles. J’ai vécu dans ce monde pendant près de 40 ans, et je le comprends, mais je pense que c’est fondamentalement défectueux. Donc, une chose que j’ai eue avec mes entreprises de transport de marchandises, c’est qu’elles étaient toutes disposées à partager des données. Ce n’est pas vrai avec les expéditeurs.
Je n’ai jamais rencontré un expéditeur disposé à partager des données de la chaîne d’approvisionnement. C’est exclu, ils ne le feront pas. J’ai réalisé un grand projet de chaîne d’approvisionnement pour Pratt and Whitney, le fabricant de moteurs d’avion, et il était financé par le gouvernement et approuvé par la société qui les possédait, appelée United Technologies, mais ils n’ont même pas voulu écouter une proposition de partage de leurs données. Ils ont dit : “Oh mon Dieu, c’est beaucoup trop confidentiel.”
Et donc, ils se sont joyeusement impliqués dans le projet où nous devions écrire notre propre générateur de données sophistiqué et inventer des demandes aléatoires partout dans le monde, et ils ont dit : “Non, certains de nos fournisseurs sont vraiment secrets, vous savez, nous ne pouvons même pas laisser quelqu’un savoir qu’il y a un fournisseur qui fait cela n’importe où dans l’État du Connecticut.” Ils ont simplement dit non, ce serait trop d’informations.
Donc, il est difficile de résoudre ces problèmes du monde réel dans un environnement où vous ne pouvez pas obtenir les données. J’ai rejoint l’Université Rutgers, je suis maintenant un cadre en résidence dans leur département de gestion de la chaîne d’approvisionnement, et j’espère les convaincre de construire un simulateur avec de fausses données, et essayer de les amener à travailler au moins sur des problèmes simulés réalistes.
Joannes Vermorel: Je peux très bien comprendre la série de problèmes auxquels vous avez été confronté. Je pense que je venais de l’autre extrémité du monde de la chaîne d’approvisionnement. D’un côté du spectre, vous avez le transport routier qui est presque comme les décisions finales à relativement court terme, encore plus extrême serait la pilotage des robots, c’est une extrémité du spectre.
À l’autre extrémité du spectre, vous avez S&OP, les ventes et les opérations, un plan super macro, au niveau de l’entreprise, et ainsi de suite. Puis il y a tout ce qui se trouve entre les deux. Mon propre parcours venait de l’autre extrémité, le S&OP, très stratégique, très axé sur les prévisions. Les premières années de Lokad, les décisions n’étaient même pas impliquées, c’était juste de la prévision pure.
Revenons à votre préoccupation, mon problème était que je voyais dans le milieu universitaire, soit dit en passant, je suis un doctorant qui a abandonné, donc je n’ai pas rendu mon directeur de thèse fier, et j’ai abandonné sans honte ma thèse pour créer Lokad. Le milieu universitaire se concentre sur la précision des prévisions, en publiant 20 000 modèles pour de meilleures prévisions de ventes depuis pratiquement toujours.
Dans l’industrie, nous avons exactement la situation que vous décrivez, 10 personnes sont assises autour de la table, elles regardent le problème de leur point de vue, et quand nous parlons de prévision, qui est une étape préalable à la décision, juste avant d’agir, d’abord ils veulent faire la prévision. Les gens se battent pour orienter la prévision à la hausse ou à la baisse.
Dans le S&OP, vous avez des commerciaux qui veulent minimiser la prévision, donc ils veulent avoir une prévision de ventes très basse afin de pouvoir dépasser les attentes. Ensuite, vous avez des responsables de la fabrication qui veulent gonfler la prévision car s’ils gonflent la prévision, ils auront plus de budget pour leurs actifs de fabrication, et donc quelle que soit la commande qu’ils finissent par fabriquer, s’ils ont plus de capacité, ce sera plus facile.
Vous avez cette lutte où les ventes veulent jeter les chiffres par terre, la fabrication veut les envoyer dans les airs, et ce n’est pas super rationnel. La chose intéressante est que dans le milieu universitaire, les gens publient un article où ils trouvent une manière incroyablement sophistiquée, en exploitant une théorie russe obscure, pour éliminer 0,1% de biais.
Ensuite, vous vous retrouvez dans cette salle avec une lutte où les gens disent littéralement : “Je veux moins 50%”, et un autre dit : “Je veux plus 50%”. Cela vous donne une sorte de déconnexion. Accéder aux données a toujours été incroyablement douloureux.
Warren Powell: Une question de prévision, et j’aimerais savoir ce que vous en faites. Il y a beaucoup de mathématiques pour prendre l’historique et prévoir l’avenir, mais nous savons que beaucoup de fois, l’avenir est susceptible d’être très différent du passé, pour une multitude de raisons, et surtout, je ne sais pas si l’avenir va augmenter ou diminuer, mais je sais qu’il pourrait être assez différent de tout ce que j’ai vu dans le passé. Puis-je vous demander comment vous gérez cela?
Joannes Vermorel: Oui, absolument. Donc, la façon typique est que nous voulons introduire une sorte d’incertitude macro qui n’est pas exactement justifiée. Cela semble étrange. Vous penseriez, d’accord, nous avons la prévision de la demande, très bien, et nous allons dire, ajoutons une variable où nous avons 4% de chances chaque année d’avoir une forte baisse de 30% de la demande, de l’activité, de tout.
Ensuite, les gens disent : “Wow, une baisse de 30% en un an, c’est énorme. Pourquoi envisageriez-vous cela?” Mon point de vue est que si vous regardez le XXe siècle, il y a eu deux guerres mondiales, toute une série d’autres guerres. Plus récemment, nous avons eu des confinements mondiaux et autres. Donc, dire qu’il y a un astéroïde dans votre visage tous les 25 ans qui endommage votre industrie, je ne pense pas que ce soit si farfelu.
Mais les gens s’attendent à prévoir quelque chose qu’ils connaissent, et ici nous disons, non, vous n’avez pas vraiment besoin de savoir exactement. Vous pourriez simplement dire, nous allons supposer une grande perturbation, quoi que ce soit, et ensuite nous allons inventer des chiffres. Ces chiffres sont complètement inventés, 4% de probabilité annuelle, 30%, vous pouvez le changer, vous pouvez dire cinq, et vous pouvez dire 50%.
Cela vous oblige à toujours prendre en compte votre perturbation majeure. Nous servions, par exemple, des clients dans l’aviation. Les gens diraient : “Oh, ce n’est pas si fréquent.” Mais c’est fréquent, car lorsque vous regardez l’industrie, par exemple, le 737 Max de Boeing a été cloué au sol. Pour mon client qui servait des avions et avait des dizaines de ces avions, c’était un problème majeur.
L’essentiel est d’accepter d’intégrer des éléments incroyablement pessimistes dans vos modèles. C’est généralement très difficile à vendre car cela ne fait pas consensus. Le problème n’est pas vraiment que les mathématiques font défaut, c’est qu’elles font peur et que les gens ne veulent pas avoir peur. Mais si vous ne vous préparez pas à ces événements importants et impactants, alors vous serez mal préparé. C’est aussi simple que ça.
L’autre chose, c’est que ce serait un côté, c’est un côté très pessimiste, vous devez regarder ces grandes perturbations, être d’accord avec cela et accepter le fait que cela se produira avec une certitude de 100% si vous lui donnez suffisamment de temps. C’est un aspect.
L’autre aspect, c’est que la plupart de mes clients, lorsqu’ils envisagent l’incertitude et l’incertitude décisionnelle, ne voient que le mauvais résultat. Je pense que le problème vient de la variabilité. Les gens assimilent les mauvais résultats. Dans la fabrication, des personnes comme Deming ont popularisé l’idée selon laquelle vous devez être cohérent. C’est une vertu cardinale. Vous devez être absolument cohérent. Il est acceptable de produire des produits médiocres si vous produisez toujours des produits médiocres de la même manière. Cela va être bon marché, et les gens savent à quoi s’attendre.
Ce qui n’est pas acceptable, c’est de faire du bon et du mauvais. Non, vous devez être absolument cohérent tout le temps. Donc, les gens assimilent la variabilité de la fabrication à quelque chose de mauvais. Mais est-ce vraiment le cas? Une fois que vous sortez du monde de la fabrication, la variabilité est-elle vraiment une si mauvaise chose? Pas naturellement.
Un exemple concret serait la mode. Dans la mode, vous créez des produits qui peuvent être un succès ou un échec. Si vous pouvez augmenter la variance de vos succès et de vos échecs en raison du fait que vous avez un faible qui va être une queue grasse, cela signifie que si vous pouvez augmenter la variance, oui, vous aurez plus d’échecs, mais vous pouvez avoir des succès qui sont d’un ordre de grandeur supérieur.
La variabilité dans la fabrication est mauvaise, mais dans la supply chain en général, ce n’est pas si grave. Si vous pouvez avoir un flux d’opportunités presque parfaitement constant, super stable, mais si vous êtes perturbé, cela va vous tuer, par rapport à quelque chose de quelque peu erratique, un peu cahoteux, mais où il y a beaucoup de prise de risques constantes que vous gérez soigneusement avec des décisions optimisées en fonction de l’incertitude, de sorte que lorsque vous faites une erreur, cela ne vous tue pas.
Vous pouvez vous retrouver dans une situation où lorsque la perturbation survient, elle n’a pas autant d’impact. Par exemple, si vous êtes dans une entreprise où vous vous attendez à ce que 98% de vos produits soient reconduits d’une année à l’autre, si la loi change et que 20% de vos produits sont jugés illégaux parce que vous avez utilisé le mauvais produit, le mauvais processus, le mauvais quelque chose, cela va être un énorme coup dur.
Vous étiez dans une entreprise où vous aviez deux pour cent de vos produits qui changeaient chaque année, et maintenant vous avez 20% qui sont éliminés en raison de la réglementation. Mais si vous êtes dans une entreprise où chaque année vous renouvelez, disons, 15% de vos produits, eh bien, d’accord, il y a une année où vous avez 20%, mais vous serez en mesure de vous rétablir beaucoup plus rapidement parce que vous avez cette sorte d’appétit pour les nouveautés que vous gardez autour de vous.
Toutes les incertitudes ne sont pas mauvaises. Parfois, en rechercher un peu est une bonne chose. Par exemple, la plupart des praticiens de la prévision détestent prévoir les nouveaux produits parce qu’ils n’ont pas d’historique pour les séries temporelles. Si vous regardez la littérature sur la prévision des séries temporelles, 99% du temps, les gens excluent les produits qui n’ont pas d’historique. De mon point de vue, prévoir les produits qui n’ont pas d’historique est la chose la plus intéressante.
C’est là que se déroulent les véritables batailles de la supply chain. Ce sont ces produits qui sont nouveaux, qui pourraient être des succès et qui pourraient changer le cours de l’entreprise. Donc, c’est une longue réponse à votre question.
Warren Powell: Je vais faire un dernier commentaire. L’une des choses que j’apprécie le plus dans mon cadre avec mes quatre classes de politiques, c’est que cela me permet de dire, ne vous inquiétez pas de la décision. Nous choisirons l’une des quatre classes, nous choisirons quelque chose de sensé, ne vous en faites pas. Ce n’est pas le gros problème. Le gros problème, c’est la modélisation de l’incertitude. Si je peux amener les gens à se détacher des complexités de la prise de décision en situation d’incertitude et à se concentrer davantage sur la modélisation des incertitudes, c’est là que réside la grande victoire.
Joannes Vermorel: Je suis tout à fait d’accord avec vous. Les grandes entreprises, lorsqu’elles sont confrontées à l’incertitude, l’une des pires choses qu’elles puissent faire est d’inventer des règles pour réduire l’incertitude. Vous inventeriez des règles simplement pour simplifier votre problème. Par exemple, ils ont lu que UPS ne fait que des virages à gauche dans leurs circuits, et ensuite ils disent, d’accord, nous-mêmes ne ferons que des virages à gauche car cela simplifie quelque chose.
Vous voyez que lorsque vous avez autant de potentiel et d’options, autant d’incertitude à gérer, et je pense que l’une des façons les plus néfastes d’aborder le problème est d’inventer toute une série de contraintes qui sont des contraintes totalement inventées afin que vous ayez un problème qui devient plus gérable. Pour en venir à vos cadres, je dirais que c’est la mauvaise façon de faire car il existe des options pour résoudre les vrais problèmes.
Donc, ne commencez pas à inventer des contraintes juste pour le plaisir, simplement parce que vous avez peur qu’il n’y ait jamais de solution pour prendre en compte votre problème. Il y a plein de solutions, donc vous devez retarder l’invention de règles et de contraintes juste pour simplifier la résolution du processus de prise de décision.
Conor Doherty: Eh bien, je suis toujours là, et c’est bien. J’ai pris trois ou quatre pages de notes séparées, mais l’une des choses, et cela fait suite à ce que vous avez dit, vous utilisez le terme de gestion du risque financier, et j’ai écrit des compromis, des préoccupations commerciales, l’évaluation des performances et la gestion du risque financier.
Donc, Warren, comme une sorte d’occasion de résumer votre cadre et votre approche de l’optimisation stochastique, je sais que votre perspective est celle de la gestion des préoccupations commerciales et de la gestion des compromis inhérents à la prise de décision. Alors, prenez tout le temps que vous voulez, mais comment exactement, que ce soit vos cours en ligne, que je regarde et qui sont formidables, ou le livre de 1100 pages, comment exactement votre cadre gère-t-il le risque financier associé à l’optimisation des itinéraires ou à la gestion des stocks ou à la prévision et à la gestion des stocks pour des produits pour lesquels nous n’avons pas d’historique ?
Warren Powell: Bien sûr. Tout d’abord, je pense que l’un des sous-produits que Johannes et moi avons, c’est que nous travaillons tous les deux sur des problèmes réels. Et une fois que vous travaillez sur des problèmes réels, vous allez en retirer certaines choses sur lesquelles nous sommes tous d’accord, dont l’une est de modéliser d’abord, puis de résoudre. Vous devez comprendre le problème. Vous utilisez le mot risque, et cela met en évidence que vous devez parler d’incertitude, et cela est bien plus compliqué qu’une distribution normale.
Les statisticiens aiment, chaque fois que vous traitez de l’incertitude, la première chose qu’ils vont faire est d’introduire un étudiant dans la distribution normale. Ils diront, d’accord, nous avons une moyenne et une variance. Il y a de l’aléatoire autour de la moyenne, et ils ne semblent pas reconnaître que la plus grande source d’incertitude est la moyenne. Nous ne savons pas quelle sera la moyenne. La moyenne bouge. Maintenant, il y a du bruit autour de la moyenne, mais c’est le mouvement de la moyenne qui est le pire.
Et puis ces événements qui n’appartiennent pas vraiment à une distribution de probabilité, ce sont des contingences. C’est comme si on disait, je ne connais pas la probabilité, mais voici quelque chose qui pourrait se produire. Que ferais-je dans ce cas de figure ? Et je me fiche de la probabilité de cela. Il y a des choses qui, je pense, peuvent se produire, et je dois savoir ce qui se passe si ce navire arrive avec un mois de retard. Et si ce port ferme ? Et s’il y a un tremblement de terre au Japon ? Il y a ces grands événements. Je n’ai pas nécessairement besoin de savoir exactement quel événement, mais je dois planifier pour les contingences.
Toute la question de la prise de décision dans l’incertitude, l’une des premières choses que j’aime dire, c’est que, bon, il y a beaucoup de mathématiques compliquées, mais vous rendez-vous compte que nous, les humains, prenons des décisions dans l’incertitude tout le temps ? Et au début de ma carrière, quand je luttais vraiment avec mes problèmes de camion, je me disais, mais les dispatcheurs de camions font déjà ça. Nous devons nous rappeler que l’une des choses que le cerveau humain fait étonnamment bien, c’est de prendre des décisions dans l’incertitude.
Beaucoup de ces problèmes, les gens diront, oh, je n’aime pas le stochastique. Et pourtant, cette même personne planifiera des événements aléatoires, des incertitudes et des contingences. C’est simplement quelque chose qui est intégré dans le cerveau humain parce que je suppose que nous, les animaux, avons dû faire face à cela pendant toute notre évolution. Le plus grand défi n’est pas de prendre des décisions dans l’incertitude. Le plus grand défi est d’apprendre aux ordinateurs à prendre des décisions dans l’incertitude.
Et donc, je ne pense pas qu’il y aura jamais une fin à cette conversation. Nous devons quantifier, nous devons utiliser des ordinateurs parce que l’idée de salles remplies de personnes prenant des décisions devient un peu dépassée. Dans les entreprises de transport routier, nous avons toute une gamme de modèles chez Optimal Dynamics, du stratégique en temps réel. Mais le produit qui est absolument la base de ce que nous vendons, c’est celui qui fait la planification en temps réel parce qu’il n’y a pas un seul dirigeant de transport routier aux États-Unis qui ne pense pas que le principal problème de son entreprise soit le planning, que cela soit vrai ou non, c’est ce qu’ils croient.
J’ai appris que l’idée de trouver le bon conducteur pour transporter une charge n’est pas vraiment la chose la plus importante. Ce qui est le plus important, c’est de choisir la bonne charge et c’est comme la gestion des revenus pour les compagnies aériennes. Vous devez le planifier un peu à l’avance, mais il est si difficile de trouver le bon conducteur qui rentrera chez lui et satisfera les heures de service du DOT et tout le monde se concentre tellement sur le problème de la planification des conducteurs.
Mais c’est vraiment trouver la bonne charge parce que ce qui est difficile dans la recherche de la bonne charge, c’est que je peux devoir m’engager plusieurs jours à l’avance ou une semaine et je ne sais pas où se trouveront mes conducteurs et je ne sais pas ce que je peux gérer. Donc, vous devez être capable de planifier dans l’incertitude. Les dispatcheurs le savent et peut-être qu’ils n’ont pas d’outils sophistiqués, mais ils ont ce sentiment instinctif de dire : “Eh bien, c’est un bon endroit. J’aurai probablement un conducteur là-bas.”
J’ai vu des gens dire carrément que nous ne traitons aucune incertitude parce que les PDG ne comprennent pas le terme “stochastique”. Non, ils ne comprennent peut-être pas le mot “stochastique”, mais ils comprennent tous l’incertitude. Maintenant, soit dit en passant, nous devons dépasser leur insistance à respecter les prévisions.
Je pense que l’un des plus grands problèmes des professionnels du transport, je parle du côté de la chaîne d’approvisionnement, c’est qu’ils ont tous un budget pour leur budget de transport, en particulier le transport routier, et aucun d’entre eux ne respecte le budget. C’est toujours une estimation optimiste de leurs dépenses de transport et ils finissent toujours par dépenser plus, et c’est quelque chose qui accompagne le fait d’être un gars de la chaîne d’approvisionnement qui doit planifier les actifs de transport.
Donc, beaucoup de problèmes amusants. Je ne pense pas que nous manquerons jamais de choses à dire.
Joannes Vermorel: Oui, et franchement, pour rebondir sur votre cas de l’esprit humain qui traite naturellement des décisions dans l’incertitude, je suis tout à fait d’accord. Et je constate cette situation très particulière où en réalité, les discussions les plus difficiles ne sont pas avec des personnes qui sont incultes en mathématiques ou à l’autre extrémité du spectre, qui sont très instruites en mathématiques. Ce sont les points de convergence, les complètement incultes et les super instruits.
La situation difficile pour moi concerne les personnes légèrement instruites, car la chose amusante, c’est qu’il est en réalité assez difficile de faire en sorte qu’un ordinateur traite l’incertitude. Je suis tout à fait d’accord et qu’est-ce que cela signifie pour une personne qui est légèrement instruite dans cet art ? Cela signifie Excel, Microsoft Excel.
Et donc le problème est, et j’ai vu cela très fréquemment, c’est qu’ils en savent un peu donc ils connaissent Excel et maintenant il y a ce problème de regarder l’univers à travers la seule solution à laquelle vous pouvez penser. Donc vous vous retrouvez avec le profane qui ne sait rien d’Excel donc il joue simplement au poker, il est devenu bon par habitude. Il n’a pas les théories mais il a réussi à jouer une partie de poker et à bien se débrouiller.
Et c’est la même chose avec le choix de la bonne charge. Je suis sûr que vous trouverez beaucoup de personnes qui n’ont aucune notion de probabilités mais qui, grâce à l’expérience, sont devenues de très bons joueurs. Ils ont cette intuition même s’ils n’ont pas le formalisme.
Et entre les deux, vous vous retrouvez avec des personnes qui connaissent Excel et qui disent : “D’accord, je dois implémenter cela dans Excel.” Et Excel est un outil terrible pour cela car Excel ne traite pas les probabilités. Excel n’est pas conçu pour faire quoi que ce soit comme Monte Carlo et Excel est le pire outil pour cela. Excel est excellent pour faire votre comptabilité mais absolument terrible pour traiter tout type d’incertitude.
Et donc ma situation la plus difficile est avec des personnes qui sont attachées à la solution Excel. Si cela sort d’Excel et cela peut sortir soit parce que c’est juste un sentiment instinctif qui est plus correct que le calcul Excel, soit parce que c’est trop sophistiqué et ne rentre plus dans le calcul Excel, il y a ce rejet fort.
Donc c’est très intéressant et je me retrouve beaucoup dans cette situation intermédiaire de personnes qui se sont engagées dans des feuilles de calcul Microsoft Excel et c’est là que c’est très difficile.
Et je pense que la plupart du temps, quand ils disent que le PDG n’aime pas ça, j’ai souvent constaté que c’est une projection de leur propre perception du problème. Les PDG sont presque toujours, je veux dire au-delà d’une certaine taille d’entreprise, des personnes excellentes pour gérer une énorme quantité de désordre.
Je pense qu’il est très difficile pour quiconque d’atteindre le poste de PDG d’une entreprise, disons de quelques centaines de personnes et plus, et de ne pas être complètement déconcerté par le fait que le monde est super chaotique. Je veux dire, c’est votre vie quotidienne, gérer des absurdités qui vous sont constamment jetées.
Donc, mon point de vue est que j’ai souvent constaté que lorsque les gens me disent : “Oh, c’est trop compliqué. Le PDG ne comprendrait pas ou quoi que ce soit”, non, c’est leur propre peur projetée sur le fait que le PDG n’a de toute façon presque pas le temps de comprendre quoi que ce soit sur cette entreprise. Donc, ce ne sera qu’une chose parmi mille choses que cette personne ne comprend pas de son propre entreprise et ce ne sera certainement pas la dernière. Donc, c’est, je veux dire, c’est mon point de vue. Qu’en pensez-vous ?
Warren Powell : Ouais, eh bien, souvent les PDG viennent d’un tout autre niveau. Ils se concentrent sur la vision d’ensemble de la finance, surtout dans les grandes entreprises. Les détails précis de ce qui se passe sur le terrain des opérations étaient probablement quelque chose qu’ils ont contourné dans leur carrière.
Je veux dire, à l’époque, d’ailleurs, quand j’allais à l’école, beaucoup de gens, même des étudiants de premier cycle de Princeton, pouvaient aller travailler pour Proctor and Gamble et ils passaient six mois sur le terrain de l’usine avant de gravir les échelons de la direction. Et donc ils étaient sur une voie rapide mais on leur disait de commencer par la base. Cela a disparu dans les années 1980.
Dans les années 1980, lorsque j’ai commencé à enseigner à Princeton, aucun des étudiants de premier cycle de Princeton n’allait travailler pour une entreprise. La tendance était de travailler pour des cabinets de conseil en gestion. Et donc ils acquéraient leur expérience sur le terrain en travaillant pour un cabinet de conseil en gestion, retournaient pour un MBA, revenaient, travaillaient encore quelques années, puis partaient généralement pour un poste de cadre supérieur dans l’une des entreprises. Donc, ils contournent tous ces détails.
En ce qui concerne votre remarque sur Excel, lorsque j’ai travaillé dans l’industrie du transport routier, les seules personnes que j’ai jamais rencontrées étaient des chauffeurs routiers, je veux dire, désolé, des planificateurs et des gestionnaires de bas niveau. Il y avait très peu de personnes capables de faire même un travail de base sur une feuille de calcul Excel. Alors que dans la supply chain, il y en a des millions qui font des tâches très basiques.
Maintenant, regardez les livres. Alors que je m’implique dans un véritable programme de supply chain à Rutgers, j’ai parcouru tous ces livres et soit ce sont des jeux mathématiques, soit ils simplifient vraiment les choses. Donc non seulement vous avez ces personnes qui pensent pouvoir tout faire dans une feuille de calcul Excel, mais les livres ne leur enseignent que des choses qui peuvent être faites dans une feuille de calcul Excel.
Et donc je pense que nous avons plus qu’un simple problème de feuille de calcul Excel. Nous devons réfléchir à qui va résoudre ces problèmes et les utiliser. Je suis tout à fait d’accord avec vous, nous avons besoin d’outils performants où les outils peuvent être très sophistiqués en interne, mais ils doivent être faciles à utiliser.
Chez Optimal Dynamics, nous nous concentrons vraiment sur le fait de rendre nos outils faciles à utiliser. Mais en interne, tant que ça fonctionne, les gens veulent vraiment la meilleure solution possible. Dans la supply chain, j’ai l’impression, vous savez, en commençant à jeter un coup d’œil et à regarder par-dessus l’épaule des gens, que “Il y a ce monde intéressant de la supply chain, mais ce qui se passe, c’est que vous avez”, je sais que j’ai vu une statistique, “93% des gens planifient dans une feuille de calcul.”
Eh bien, vous êtes limité à ce que vous pouvez faire dans une feuille de calcul. Et donc lorsque vous commencez à parler, vous savez, même de simples simulations, mais je veux dire, je peux faire une simulation de stock simple dans une feuille de calcul, mais parlons maintenant d’introduire de longs délais d’approvisionnement chez plusieurs fournisseurs et, eh bien, vous savez, cela dépasse rapidement les capacités d’une feuille de calcul. Cela dépasse également les capacités des personnes qui codent cette feuille de calcul et qui pensent pouvoir le faire seules.
J’ai une ancienne étudiante en doctorat, elle est maintenant notre directrice analytique en chef, très brillante, mais elle a passé huit ans à faire de la planification des opérations chez Kimberly Clark au Brésil. Longue histoire derrière cela et à un moment donné, elle a eu du mal avec, vous savez, les problèmes habituels de planification des stocks. Alors elle a fait appel, elle a travaillé brièvement chez McKenzie, alors elle a fait appel à ses anciens amis de chez McKenzie et devinez quoi, McKenzie ne savait que ce qui était dans les manuels et elle a tout de suite su qu’ils n’avaient aucune idée de ce dont ils parlaient et les a virés immédiatement. On n’apprend même pas aux meilleurs et aux plus brillants comment résoudre les problèmes. Je ne parle pas de faire des maths bizarres, je parle de faire des choses pratiques, le genre de modélisation qui devrait absolument être faite pour résoudre le problème. Ça n’est enseigné nulle part.
Conor Doherty: Si je peux me permettre, ça s’enseigne quelque part. Auto-promotion sans vergogne.
Joannes Vermorel: Auto-promotion sans vergogne. Chez Lokad, nous avons commencé à enseigner cela dans une demi-douzaine d’universités principalement autour de Paris. Nous avons également lancé une série d’ateliers publics pour les situations de résolution de problèmes dans la supply chain et l’un des plus grands efforts que nous devons faire est de créer des ensembles de données.
Nous créons et publions les ensembles de données pertinents et en effet, mon opinion personnelle était que créer un ensemble de données entièrement synthétique est tout simplement trop difficile, nous devons donc anonymiser complètement les données existantes des clients avec leur accord. Nous prenons de vraies données, les rendons complètement anonymes, préservons les motifs étranges et les regroupons dans des ensembles de données relativement petits et bien organisés afin que les étudiants puissent aborder le problème sans passer trois mois à traiter des angles morts sur les données. Je suis tout à fait d’accord, et d’ailleurs, mes deux parents ont commencé chez Procter & Gamble, donc je peux tout à fait comprendre ce sentiment.
Warren Powell: Donc, vous enseignez à quel type d’étudiant dans les écoles autour de Paris ?
Joannes Vermorel: Oh, c’est très classique. Le système français comprend deux années de classes préparatoires, c’est essentiellement un examen national. Vous faites deux ans, des examens nationaux, tout le monde obtient des classements et vos notes sont publiées dans le journal, donc si vous avez de mauvaises notes, c’est dans le journal, pas de pression. Ensuite, il y a ce que nous appelons les Grandes Écoles, mais vous pouvez les considérer comme la mini Ivy League française. Les gens entrent dans ces écoles d’ingénieurs. Je parle seulement de trois segments : les écoles d’ingénieurs, les écoles de commerce et les écoles administratives. Ici, je parle seulement des écoles d’ingénieurs.
Warren Powell: Ingénierie, d’accord. Donc, à Princeton, j’ai enseigné aux ingénieurs. Maintenant que je m’implique avec Rutgers, ce sera la première fois dans une école de commerce et on m’a déjà gentiment prévenu que, parmi toutes les catégories d’étudiants de l’école de commerce, ceux qui choisissent la gestion de la supply chain ont tendance à être en bas de la liste en termes de compétences techniques. Ceux qui sont plus haut vont dans la finance et il y a un effet de ruissellement. Je n’ai pas encore commencé, je ne vais pas enseigner un cours, je vais enseigner aux enseignants, mais je vais dépendre d’eux pour dire : “Regarde, Warren, nous ne pourrons tout simplement pas nous en sortir avec ça”.
Une chose sur laquelle je me concentre, c’est que je dis : “Regarde, il y a une partie très importante de mon cadre qui n’implique pas de mathématiques. Elle implique les trois questions suivantes et vous ne pouvez pas répondre à ces questions, vous ne pouvez pas construire de modèle”. Même si vous n’allez pas construire de modèle, vous devriez quand même, si vous voulez résoudre un problème, répondre aux trois questions suivantes : quels sont vos indicateurs, quels types de décisions prenez-vous, quels sont les types d’incertitudes ?
En termes simples, c’est ainsi que nous le formulons ici, et donc je dis pas de mathématiques, mais ce sont les questions auxquelles je dois avoir les réponses si je veux construire un modèle mathématique. J’ai donc décidé, vous allez dans la communauté des affaires et vous demandez des indicateurs, ils connaissent tous les indicateurs, ils ont des listes et des listes d’indicateurs. Ensuite, vous abordez les décisions et vous demandez : “Avez-vous un petit livre rouge avec une liste des décisions que vous prenez ?” et ils vous regardent avec des yeux vides.
Après cette discussion, Joannes, je commence à générer une série de réflexions et de notes que je vais partager avec les autres membres du corps professoral de Rutgers. Il s’agit d’un document Google Docs qui peut être édité publiquement et vous me verrez développer différentes catégories. Je viens de commencer la section sur les décisions et je vais vous l’envoyer aussi car je pense que cela vous amusera. Ce n’est pas pour un livre ou quoi que ce soit, c’est juste une discussion, c’est ma façon d’enseigner aux enseignants car je ne peux pas leur dire quoi faire, les professeurs doivent dire : “Oh, c’est une bonne idée, je pense que je vais l’utiliser”. S’ils ne font pas ça, alors l’idée ne rentre pas dans la classe, mais je dois faire confiance à leur connaissance de ce que les étudiants font. Il y a ce cours sur l’analyse des opérations, et c’est le cours où ils traitent des problèmes d’inventaire. Je pense que vous pouvez imaginer ce qui y est enseigné, c’est une présentation très basique et je suis comme “Désolé, ne devrions-nous pas au moins leur dire comment, même dans un tableur, ils peuvent simuler un problème d’inventaire très basique”.
Je vais donc vous envoyer le lien vers le document Google. Une des choses que j’aimerais compiler, et je ne l’ai pas encore fait, je commence juste à y réfléchir, mais je n’ai pas fait de gestion de la chaîne d’approvisionnement toute ma carrière, j’ai travaillé sur un ensemble beaucoup plus large de problèmes. Je veux dresser une liste de décisions. Ce ne sera pas une petite chose ; les décisions se déclinent en de nombreuses variantes et catégories, ce n’est pas seulement l’inventaire. Il y a la finance, il y a les décisions d’information, et donc cela va finir, j’aimerais le mettre dans un tableur et ensuite j’aimerais l’envoyer et simplement inviter les gens, “Eh bien, quelle est une de vos catégories ou quels sont des exemples de décisions ?” parce que j’ai cette phrase d’accroche qui dit : “Si vous voulez gérer quelque chose de mieux, appelez cela une chaîne d’approvisionnement, vous devez prendre de meilleures décisions”. Je n’ai jamais entendu personne être en désaccord avec ça, tout le monde dit : “Oui, c’est vrai”. Eh bien, si vous voulez prendre de meilleures décisions, quelles sont vos listes de décisions ? Et puis j’ai ces regards vides.
Je vais donc commencer par une approche très non quantitative, cela fait appel à votre sens de la modélisation en premier et je pense qu’un MBA non quantitatif, c’est un bon défi pour eux car répondre et bien sûr les incertitudes, des carrières entières sont construites sur l’identification des sources d’incertitude pour les chaînes d’approvisionnement, mais j’aime vraiment celle sur les décisions. Ne devrions-nous pas tous savoir quelles décisions nous prenons ? Je comprends pourquoi en affaires ils ne le font pas car c’est comme “Eh bien, c’est le problème de quelqu’un d’autre, je vais juste évaluer comment il se débrouille”. Donc en affaires, c’est entièrement le langage des indicateurs, mais ne devrait-il pas y avoir un petit livre rouge quelque part qui contient les décisions ?
Joannes Vermorel: Oui, je suis tout à fait d’accord et les décisions sont très difficiles car les grandes entreprises ont tendance à enterrer les décisions et les processus de prise de décision sous des flux de travail et des processus. En fait, ils ne voient même pas une décision car il y a une règle qui est appliquée et qui est en réalité un processus de prise de décision. Et c’est déjà tellement ambiant qu’ils ne le voient plus, cela dirige simplement l’entreprise. Cela peut être une mauvaise politique, elle existe, elle dirige l’entreprise, elle prend potentiellement des milliers de décisions par jour et personne ne le voit même. Une fois qu’elle est en place depuis un certain temps, cette chose n’a même pas de commandement. Il n’y a personne en charge de cela simplement parce que c’est comme avoir de l’air frais dans le bâtiment, cela se produit simplement, les gens ne savent même pas exactement pourquoi c’est le cas, cela l’est simplement.
Je suis tout à fait d’accord avec votre idée de décision. C’est difficile car les gens ont une mauvaise notion des décisions. Ils pensent qu’une décision est quelque chose où il y a une réunion, il y a de la tension et il y a un patron, des arguments seront présentés et le patron décidera. C’est un type de décision, mais il y a des décisions beaucoup plus banales qui sont beaucoup plus importantes. Quand elles sont si banales que vous ne les voyez même plus, c’est très intrigant.
Warren Powell: Parce que, comme vous l’avez dit, ils ont déjà choisi la politique, donc une fois que vous fixez la politique, cela cesse d’être une décision. Et en réalité, la décision n’est pas la décision, la décision est quelle politique.
Permettez-moi maintenant de vous offrir une autre idée. Vous savez, je parle des politiques compliquées et des politiques simples. Une phrase que j’utilise assez souvent dans mon gros livre est que le prix de la simplicité est les paramètres réglables. Pratiquement n’importe quelle politique simple comme les politiques SS a des paramètres réglables, et l’ajustement est difficile. L’ajustement est l’un de ces types universels de décisions. C’est un problème d’apprentissage actif.
Je donne une conférence lors d’un atelier sur l’analyse de la chaîne d’approvisionnement à Rutgers en juin, et l’une des choses sur lesquelles j’ai une section entière est qu’il y a quelque chose que tout le monde, quel que soit le domaine dans lequel vous vous trouvez, doit comprendre. Il y a une classe de problèmes de décision séquentielle appelée l’apprentissage.
Cela porte de nombreux noms. Cela peut être l’essai et l’erreur intelligents, la recherche stochastique ou le bandit à plusieurs bras, mais ce sont des problèmes d’apprentissage. Il n’y a rien de physique. Lorsque vous avez quelque chose de physique, les choses deviennent plus compliquées, mais il y a beaucoup de problèmes où ce n’est pas physique, c’est juste de l’apprentissage.
Vous essayez cela, cela a fonctionné ou cela n’a pas fonctionné, j’essaierai autre chose. C’est une décision séquentielle, mais la seule chose que vous emportez d’un moment à l’autre est ce que vous avez appris et votre croyance sur ce qui fonctionne le mieux.
L’apprentissage séquentiel devrait être enseigné au niveau de premier cycle, pas dans un seul cours, mais tout au long du programme comme les statistiques sont enseignées de différentes manières. L’apprentissage actif devrait être enseigné à toute personne en dehors des étudiants en anglais.
À moins que vous ne soyez un étudiant en sciences humaines, citez un domaine où vous n’avez pas à faire une forme d’essai et d’erreur intelligent. C’est un processus fondamentalement humain, et il existe des outils simples pour cela, afin que vous puissiez faire avancer les choses.
Il existe des politiques de base appelées politiques UCB que vous pouvez enseigner aux gens en une minute. Vous dites simplement, regardez, vous avez des choix discrets, voici à quel point je pense que chacun est bon, mais voici mon incertitude.
Il y a un exercice simple qui dit que si tout ce que vous faites est de le baser sur à quel point vous pensez que c’est bon, cela peut être sérieusement sous-optimal. Vous voulez viser un peu plus haut, vous voulez viser à quel point quelque chose pourrait être bon. C’est une idée que vous pouvez enseigner en une minute, et pourtant il y a des subtilités qui la rendent beaucoup plus riche et cela doit vraiment être enseigné.
Joannes Vermorel: Je suis tout à fait d’accord. C’est très drôle parce que, venant d’un domaine d’apprentissage automatique, Lokad était principalement axé sur l’apprentissage automatique de prévision.
La situation typique était que ces politiques simplistes avec des paramètres réglables n’étaient jamais réglées en pratique. Lorsque vous obtenez enfin les données d’une entreprise, c’est compliqué, mais chez Lokad, nous obtenons enfin les données.
Vous appliquez vos algorithmes d’apprentissage et vous réalisez qu’il y a très peu à apprendre car l’entreprise fonctionne avec un pilote automatique incroyablement rigide depuis si longtemps que vous pouvez avoir des milliards de dollars ou d’euros d’historique et pourtant si peu à apprendre car vous avez fait toujours la même chose encore et encore sans aucune variation.
L’un des défis auxquels nous sommes confrontés est que souvent, lorsque nous voulons apprendre, nous devons commencer à explorer et ajouter un peu de bruit. Ce bruit est juste pour le plaisir de l’apprentissage.
Vous devez vous assurer que ce n’est pas trop cher, mais l’idée de s’écarter de ce qui est considéré comme optimal, ils n’ont aucune idée de savoir si c’est optimal, mais c’est certainement la norme, le statu quo, la pratique.
S’écarter de la pratique pour explorer au hasard quelque chose d’aussi abstrait que collecter des informations sur l’apparence du paysage lorsque vous vous écartez de ce que vous faites habituellement, est très déconcertant.
Il y a très peu de personnes qui ont suivi des MBA et autres qui peuvent comprendre cette idée de gouttelettes minuscules. Si vous êtes une grande entreprise, même une petite dose d’exploration, si vous opérez à grande échelle, vous donnera beaucoup d’informations au fil du temps.
Dans la fabrication, la déviation est mauvaise. Vous voulez être aussi rigide et cohérent que possible. Mais dans l’apprentissage actif, si vous faites cela dans le monde de la supply chain et que vous êtes si rigide et que cette politique reste immuable, vous apprenez à peine quelque chose.
C’est un concept très étrange. Être introduit à l’idée d’apprentissage actif, que vous pouvez choisir vos déviations pour vous informer au maximum, donc ce n’est pas seulement faire quelque chose au hasard mais avec l’intention d’apprendre quelque chose, est crucial.
Warren Powell: Les idées que vous venez d’exprimer sont tellement fondamentales qu’elles devraient être enseignées partout dans tous les domaines, pas seulement dans les domaines analytiques.
Vous pouvez l’enseigner à un niveau analytique avancé et à un niveau de base, en fonction des étudiants. Je ne sais pas pourquoi cela n’est pas enseigné.
Je rédige un article pour Princeton pour dire, hé regardez, 40 ans de Princeton, devinez quel cours nous n’enseignons pas. Environ la moitié de l’université est impliquée dans des départements où il y a une opportunité de réfléchir à l’essai et à l’erreur sous une forme quelconque.
Nous pouvons continuer pendant plusieurs heures encore.
Conor Doherty: Je vais revenir et conclure une boucle. L’une des publicités sans vergogne, juste pour clarifier, lorsque vous parlez des étudiants en supply chain qui apprennent, les ateliers dont vous avez parlé sont en fait disponibles publiquement sur notre site web.
En ce qui concerne l’apprentissage de la programmation pour les problèmes de supply chain, nous avons des ressources disponibles publiquement et totalement gratuites sur notre site web, docs.lokad.com. Il s’agit d’exercices guidés conçus par nos Supply Chain Scientists pour imiter le type d’arbres de décision dont vous parlez.
Si vous souhaitez évaluer les performances, l’analyse des fournisseurs, nous avons un tutoriel guidé gratuit où vous pouvez voir tous les extraits de code conçus spécifiquement pour ce type de problèmes, par opposition à une approximation grossière dans un tableur Excel.
Warren Powell: Je sais que chez Lokad, vous avez votre propre langage de programmation. J’ai trouvé cela très intéressant. J’apprécie les ressources que vous rendez disponibles. Nous essayons de faire quelque chose de similaire pour le transport routier, mais le transport routier est une activité très différente.
Nous essayons de fournir des informations très éducatives. Nous n’essaierions jamais de faire quelque chose comme ça. Tout d’abord, nous n’avons pas ce code simple et il n’y a personne dans l’industrie du transport routier.
Une chose intéressante à propos du transport routier est que nous n’avons pas beaucoup de concurrence. Ce n’est pas l’envergure de l’activité de transport routier qui, aux États-Unis, représente environ 800 milliards de dollars par an. Je veux dire, c’est un grand marché, mais c’est une petite fraction des supply chains.
La supply chain est un véritable océan, tandis que le transport routier est une mer ou quelque chose comme ça. Mais je vais attirer l’attention de votre département sur les ressources que vous proposez à Rutgers, car je pense que cela pourrait être très intéressant.
Je dois faire face au fait que ce sont des étudiants en commerce que je dois amener à apprendre leurs étudiants. Ils ont également un département de génie industriel et j’ai l’impression que cela va être plus au niveau de l’ingénierie.
Je pense en fait que les deux départements devraient travailler ensemble car cette première étape de ces trois questions est vraiment difficile. Il faut vraiment savoir de quoi on parle. Donc, vous avez besoin d’une réflexion de type conseil en gestion intelligente pour répondre à ces questions.
Une fois que vous y avez répondu, vous avez maintenant besoin d’un ensemble de compétences différent pour les transformer en analyses et utiliser un ordinateur pour vous aider. J’espère qu’à Rutgers, je connais assez bien les gens du génie industriel. Le groupe que je connais moins bien est le département de gestion de la supply chain. Ils semblent aimer ce que je dis et je vais essayer de les réunir.
Conor Doherty: Je pense que cela fait un moment maintenant et j’ai épuisé toutes mes questions. Mais chez Lokad, il est de coutume d’offrir le dernier mot à l’invité. Donc Warren, je vous laisse conclure avec un appel à l’action ou des publicités sans vergogne. Nous n’en avons pas ici.
Joannes Vermorel: Il y a un appel à l’action clair, qui est d’acheter le livre. C’est un très bon livre solide.
Warren Powell: Je recommande aux gens de ne pas commencer avec le gros livre, mais de commencer avec un livre qu’ils peuvent télécharger gratuitement.
Tinyurl.com/SDAmodeling, c’est le livre que j’ai écrit pour le cours de premier cycle. Il s’appelle Sequential Decision Analytics and Modeling. Je travaille avec un éditeur, ils ne me paient rien, mais ils me permettent d’offrir le PDF gratuitement, la version publiée.
Voici le livre. Il utilise un style d’enseignement par l’exemple. Donc, à part le chapitre un, qui dit voici le cadre universel et il y a des exemples d’inventaire là-dedans, chaque chapitre, sauf le chapitre 7, est juste des exemples différents, tous écrits dans le même style avec une emphase sur la modélisation.
Donc, j’ai mes cinq éléments : État, décision, information, transition, objectif. Je commence toujours par un récit, un récit en anglais simple, puis j’ai les cinq éléments. Ensuite, je dis quelques mots sur la modélisation de l’incertitude, pas beaucoup. Ensuite, je dis quelque chose sur la façon dont nous pourrions prendre des décisions.
Au moment où j’en suis arrivé au chapitre 7, j’ai donné des exemples des quatre classes de politiques. Donc, le chapitre 7 dit, faisons une pause, regardons ce que nous venons de faire. Les chapitres restants, 8 à 14, sont simplement des exemples plus avancés, y compris le jeu de la bière.
Le jeu de la bière est mon opportunité de résoudre un problème multi-agent. Un de mes chapitres préférés dans mon gros livre est le dernier chapitre sur le multi-agent. J’ai écrit ce chapitre et j’ai dit, si je recommençais ma carrière aujourd’hui, le multi-agent serait tellement amusant.
Et bien sûr, dans le monde de la supply chain, tout est multi-agent. Cela définit presque le problème que vous n’en avez pas un. Comme dans mon travail de camionnage, même s’il y a différents gestionnaires, nous agissons approximativement comme si l’entreprise de camionnage était un seul agent.
La supply chain, vous ne pouvez pas. Ça ne marche tout simplement pas. Vous devez modéliser le fait que vous avez tous ces composants qui interagissent, ce qui ouvre la porte à la modélisation de qui sait quoi. Donc maintenant, vous modélisez l’organisation de l’information, pas seulement la commande de stocks.
C’est un domaine tellement riche. Je regarde 70 ans d’écriture de manuels et je réalise que nos livres semblent être tellement en retard par rapport à ce qui est nécessaire pour vraiment résoudre le problème. Je suis un peu surpris par cela. C’est une belle opportunité. J’aimerais être quelques décennies plus jeune.
Donc, c’est génial que vous fassiez cette série télévisée. Je vais certainement la promouvoir. Je vais certainement envoyer ce lien, mais je vais aussi diriger les gens vers votre site web car j’adore votre style académique.
Optimal Dynamics est une excellente entreprise. Je ne peux pas faire beaucoup de publicité éhontée car elle est vraiment axée sur les transporteurs de lots complets, mais je vais faire de la publicité éhontée pour Lokad. J’aime votre style. Je parle de vous car cela montre que vous avez un point de vue très académique.
J’adore votre envie de partager. Les universitaires aiment partager. Oui, nous aimerions gagner de l’argent, mais nous ne pouvons toujours pas nous empêcher de partager nos idées et d’en être très fiers, comme vous devriez l’être. J’apprécie cela car j’ai parcouru votre site web avec attention et cela m’aide à apprendre des choses et à m’inspirer de votre style.
Conor Doherty: Merci beaucoup. Je n’ai pas d’autres questions. Joannes, je vous remercie beaucoup pour votre temps, Warren. Merci beaucoup pour le vôtre. Et merci à tous de nous avoir regardés. À la prochaine.