00:00:07 Introduction à Kaggle et l’invité Rafael de Rezende.
00:00:39 Le rôle de Rafael et son parcours chez Lokad.
00:01:29 Kaggle et ses compétitions d’apprentissage automatique.
00:04:22 La nature compétitive et collaborative de Kaggle.
00:06:55 Impact de la collaboration sur la créativité dans les compétitions Kaggle.
00:08:02 La compétition M5 et son envergure (prévision des ventes pour 30 000 SKUs dans les magasins Walmart).
00:08:39 La fonction de perte Pinball comme métrique de score.
00:10:26 Les membres de l’équipe et leurs rôles spécifiques dans la compétition.
00:12:05 La différence entre les méthodologies de compétition et les applications réelles.
00:14:25 Analyse des 10 meilleures solutions et de leur proximité en termes de performances.
00:16:00 Discussion sur les coûts opérationnels et la maintenabilité des modèles.
00:17:47 Importance de la stabilité numérique dans les scénarios du monde réel.
00:19:21 Extensibilité et contraintes du monde réel dans les modèles de compétition.
00:20:35 Améliorations possibles et focus futur après la compétition.
00:22:14 Importance de l’expertise sectorielle et comparaison des performances avec l’état de l’art.

Résumé

Lors d’une interview avec Kieran Chandler, Joannes Vermorel et Rafael de Rezende de Lokad discutent de leur participation à une compétition Kaggle portant sur la prévision des ventes de Walmart. Ils soulignent l’importance de modèles numériquement stables, maintenables et extensibles. Malgré les contraintes, leur approche a permis d’obtenir des résultats proches de l’état de l’art, validant leur focus sur des méthodes pratiques, rentables et maintenables d’optimisation de la supply chain. L’expérience a démontré les avantages d’être à la fois des experts en supply chain et en data science. L’équipe prévoit maintenant de mettre en œuvre les enseignements tirés pour améliorer les solutions pour leurs clients.

Résumé étendu

Dans cette interview, l’animateur Kieran Chandler s’entretient avec Joannes Vermorel, fondateur de Lokad, et Rafael de Rezende, responsable du développement de produits chez Lokad. Les deux invités ont une expérience en optimisation de la supply chain et apportent leur expertise à la discussion d’une récente compétition Kaggle portant sur la distribution d’incertitude des ventes de Walmart.

Rafael de Rezende se présente comme un ingénieur industriel spécialisé dans la supply chain. Il travaille chez Lokad depuis trois ans et son rôle a évolué au fil du temps. Actuellement, il est responsable du développement de produits, dirigeant une équipe qui s’attaque aux sujets “geeky” chez Lokad. Ils travaillent principalement sur la prévision des séries temporelles, ainsi que sur la résolution d’images à plusieurs échelles et le système de quantité minimale de commande (MOQ), qui a déjà été discuté dans l’émission.

Joannes Vermorel donne un aperçu de la compétition Kaggle en question et de Kaggle lui-même, la décrivant comme une “sous-culture très spécifique”. Kaggle, désormais propriété de Google, est une organisation qui organise des compétitions de machine learning dans lesquelles les participants doivent prédire ou prévoir certains résultats. Les entreprises fournissent généralement un ensemble de données et offrent de gros prix en argent pour inciter à la participation. Dans le cas de la compétition des ventes de Walmart, il y avait 100 000 dollars en jeu.

L’environnement de ces compétitions est très compétitif, attirant des centaines de professionnels qui maîtrisent les derniers algorithmes et publications. Malgré sa nature de niche, Kaggle a une présence mondiale significative, revendiquant plus d’un million de participants inscrits. Les concurrents ne sont pas nécessairement eux-mêmes des chercheurs, mais ils sont doués pour identifier les algorithmes de pointe pour un problème donné. Ils trouvent ensuite des améliorations mineures pour prendre un léger avantage sur les autres et remporter finalement la compétition.

Selon Vermorel, les gagnants de Kaggle sont généralement originaires d’Amérique du Nord ou d’Asie, mais ils bénéficient d’une communauté mondiale de participants. L’acquisition de la plateforme par Google souligne encore davantage sa popularité croissante et son importance dans le domaine de l’apprentissage automatique et de la science des données.

Vermorel et Rezende apprécient tous deux l’analogie sportive lorsqu’il s’agit de la compétition. Ils mettent en avant l’approche collaborative de l’événement, les participants s’aidant mutuellement à améliorer leurs compétences. Dans le même temps, ils reconnaissent la concurrence féroce qui résulte des incitations financières et de la participation de grandes organisations.

L’équipe de Lokad était nouvelle dans cette compétition, mais elle avait déjà une expérience des compétitions intenses en gestion de la supply chain. Rezende reconnaît que le niveau de compétition lors de cet événement était beaucoup plus élevé que lors des défis précédents auxquels ils avaient été confrontés.

Certains critiques soutiennent que la nature collaborative de la compétition peut entraver la créativité, car les participants peuvent abandonner leurs propres idées et suivre les solutions à haut score. Cet effet de troupeau pourrait limiter la pensée innovante.

Du point de vue de l’entreprise, Vermorel est heureux que l’équipe ait participé à la compétition, même si la victoire ne faisait pas partie de la feuille de route stratégique de Lokad. Il estime que de telles compétitions permettent de clarifier l’état de l’art dans le domaine sans le changer fondamentalement. Dans cette compétition spécifique, l’équipe, dirigée par Rezende, s’est classée sixième sur 909 équipes dans un défi de prévision des ventes portant sur 30 000 unités de gestion des stocks (SKU) dans les magasins Walmart sur 28 jours.

Vermorel trouve intéressant que cette compétition ait utilisé une fonction de perte “pinball” comme métrique de score pour la première fois, quelque chose que Lokad avait proposé il y a des années. Il explique que les prévisions quantiles sont accompagnées d’un biais délibéré pour garantir la disponibilité des produits en magasin, visant un taux de service élevé. Cette compétition a explicitement indiqué l’utilisation d’une prévision quantile, ce qui était une première dans le domaine.

L’équipe de Rezende était composée de quatre personnes, chacune ayant un rôle spécifique. Ils ont travaillé sur le modèle central, analysé les données et construit l’infrastructure pour la compétition. En tant que chef d’équipe, Rezende s’est concentré sur le maintien de la motivation de tous et sur le travail en équipe.

L’interview se termine par une comparaison de l’approche de Rezende à une analogie sportive, ce qui laisse entendre qu’ils ont peut-être adopté une approche unique ou stratégique pour la compétition.

La conversation portait sur les différences entre les modèles de compétition et les applications du monde réel dans l’optimisation de la supply chain.

Les participants ont comparé les modèles de compétition aux voitures de Formule 1, qui sont réglées avec précision pour des pistes spécifiques mais pas pratiques pour une utilisation quotidienne. Ils ont noté que les méthodes utilisées dans les compétitions sont coûteuses en termes de calcul et ne conviennent pas toujours aux scénarios du monde réel. Par exemple, les dix premiers gagnants d’une compétition récente ont mis environ 10 heures pour traiter un petit sous-ensemble des données de Walmart, ce qui serait impraticable pour les opérations du monde réel.

Vermorel et de Rezende ont expliqué que Lokad avait adopté une approche différente en utilisant un cadre théorique similaire à leurs opérations quotidiennes, en ne faisant que de légères adaptations à des fins de compétition. Ils ont souligné l’importance d’être d’abord des professionnels de la supply chain, en utilisant leur expérience et leur intuition pour éclairer leurs décisions.

Les interviewés ont également souligné que les 10 meilleures solutions de la compétition étaient numériquement très proches, avec de petites différences de performance. Ils ont identifié trois préoccupations clés qui différencient les modèles de compétition des solutions de supply chain du monde réel : le coût opérationnel, la maintenabilité et l’adaptabilité aux conditions imparfaites. L’approche de Lokad, en revanche, visait à minimiser le coût de calcul et à garantir la maintenabilité, tout en tenant compte des obstacles et des imperfections du monde réel.

Dans l’ensemble, la discussion a souligné la nécessité de méthodes d’optimisation de la supply chain pratiques, rentables et maintenables qui peuvent être appliquées dans des scénarios du monde réel, plutôt que des approches purement théoriques ou axées sur la compétition.

Ils parlent de l’importance d’avoir des modèles numériquement stables, maintenables et extensibles. La stabilité numérique garantit que les modèles peuvent gérer des données imparfaites et ne produire pas de résultats très inexactes. La maintenabilité signifie que le modèle peut bien fonctionner même dans des conditions moins qu’idéales. L’extensibilité permet d’intégrer des facteurs supplémentaires, tels que les niveaux de stock et les futures promotions, dans le modèle.

L’équipe a participé à une compétition de prévision qui a souligné l’importance des connaissances spécifiques à la supply chain dans l’optimisation. Malgré des contraintes sans rapport avec l’exactitude des prévisions, ils ont réussi à obtenir des résultats proches de l’état de l’art. Le défi a validé leur approche, prouvant que leurs modèles sont effectivement compétitifs tout en étant agiles, maintenables et extensibles.

Après la compétition, l’objectif est maintenant de partager les connaissances et les améliorations acquises avec toute l’équipe de Lokad, en veillant à ce qu’elles puissent être mises en œuvre rapidement pour leurs clients. L’expérience a également souligné les avantages d’être à la fois des experts en supply chain et en data science dans la compétition, plutôt que de n’être que des experts en data science.

Transcription complète

Kieran Chandler: Aujourd’hui, nous sommes ravis d’accueillir l’un de nos collègues, Rafael de Rezende. Il va nous parler d’une récente compétition M5 qui a examiné la distribution d’incertitude des ventes de Walmart. Donc, Rafael, merci beaucoup d’avoir fait le déplacement jusqu’ici.

Rafael de Rezende: C’est génial d’être ici. Peut-être que je peux simplement vous en dire un peu plus sur moi et mon parcours. Je travaille ici chez Lokad depuis trois ans. J’ai une formation en supply chain, je suis ingénieur industriel, et au cours de mon séjour ici chez Lokad, mon rôle a beaucoup évolué. En ce moment, je suis responsable du développement de produits chez Lokad, et mon équipe et moi nous occupons des sujets très pointus de Lokad. Nous travaillons sur la prévision des séries temporelles, la résolution d’images et les MOQ, dont je crois qu’ils ont déjà été abordés ici dans l’émission.

Kieran Chandler: Super, et Joannes, aujourd’hui nous allons parler d’une récente compétition Kaggle qui portait sur l’examen de la distribution d’incertitude des ventes de Walmart. Peut-être pourriez-vous nous donner un aperçu du défi lui-même et de Kaggle en général ?

Joannes Vermorel: Oui, et peut-être de Kaggle en général. C’est une sous-culture très spécifique. Kaggle est une organisation assez importante qui a été rachetée par Google. Ce que Kaggle organise, ce sont des compétitions d’apprentissage automatique où vous devez prédire ou prévoir quelque chose. Pour mettre en place une compétition, vous avez besoin d’un ensemble de données pour prévoir ou prédire quelque chose, et vous avez besoin de gros prix. Pour la compétition dont nous parlons, il y avait 100 000 dollars de prix. C’est un environnement très compétitif, avec des centaines de personnes qui sont des professionnels complets. C’est un peu comme un sport de haut niveau, d’une certaine manière.

La communauté qui remporte les compétitions Kaggle n’est généralement pas composée de chercheurs, mais de personnes très douées pour comprendre ce qui se fait de mieux. Ils examinent toutes les choses qui sont publiées tout le temps et identifient celle qui sera la meilleure. Ensuite, ils doivent faire quelque chose de magique en plus pour obtenir un petit pourcentage de précision supplémentaire qui leur permet de gagner. Ils doivent trouver une petite chose qui leur donne un léger avantage, et ils seront en avance sur les autres. C’est une sous-culture très spécifique et c’est énorme. Kaggle compte plus d’un million de participants inscrits du monde entier, même si les gagnants sont généralement d’Amérique du Nord ou d’Asie.

Kieran Chandler: Je veux dire, il a été racheté par Google, donc il est certainement en plein essor. Joannes a mentionné l’analogie avec un événement sportif, où des data scientists se font concurrence mais collaborent également, ce qui est une très belle analogie. Parlons donc un peu plus du défi lui-même. Quels ont été les principaux défis auxquels vous avez été confrontés et contre qui vous êtes-vous battus ?

Joannes Vermorel: Je pense que l’analogie sportive est vraiment bonne. Je veux dire, Kaggle ressemble vraiment à un sport. Ce qui est bien dans Kaggle, c’est l’approche très collaborative où les gens s’entraident et passent beaucoup de temps à aider les autres à s’améliorer. Cela se produit en même temps que la compétition brutale car il y a de l’argent en jeu et de grandes organisations qui parrainent ou surveillent de près ce que vous faites. Nous étions des débutants sur Kaggle, mais notre équipe avait déjà participé à une sorte de compétition auparavant, avec des clients remettant en question notre solution dans les chaînes d’approvisionnement. Cependant, ce n’était pas du même niveau que Kaggle. Sur Kaggle, nous avions 900 équipes, alors qu’auparavant, nous pouvions avoir une compétition contre deux ou trois autres équipes. Tout le monde essayait vraiment de s’entraider encore plus que sur Kaggle.

Rafael de Rezende: Une chose intéressante à propos de la collaboration de Kaggle est que beaucoup de gens la critiquent car elle peut entraver la créativité. Ce qui se passe souvent, c’est que certaines personnes publient une solution qui fonctionne bien au début, et soudainement beaucoup d’autres équipes commencent à la suivre, abandonnant ce qu’elles faisaient auparavant. Il y a donc cet effet de troupeau, et tout le monde va du même côté du coin. La notion de collaboration est bénéfique, mais je dois être d’accord avec ceux qui disent qu’elle entrave parfois la créativité.

Kieran Chandler: Et du point de vue de l’entreprise ? Vous avez ces gars qui travaillent sur leur temps libre. Qu’en pensez-vous ?

Joannes Vermorel: Je suis très content qu’ils l’aient fait. Ce n’a jamais été la stratégie de Lokad de chercher à remporter ces compétitions. J’en ai fait quelques-unes avec beaucoup moins de succès au cours des premières années de Lokad, mais j’ai réalisé que ces compétitions ne modifient pas nécessairement fondamentalement l’état de l’art. Elles clarifient ce qu’est l’état de l’art, ce qui est très bien. Par exemple, cette compétition où l’équipe de Rafael s’est classée sixième sur 909 équipes était censée être une compétition de prévision de la demande, mais elle s’est avérée être une compétition de prévision des ventes en raison de la non-prise en compte correcte des ruptures de stock. Ils prévoyaient donc les ventes, pas la demande. C’était une compétition de prévision de la demande pour 30 000 SKU dans les magasins Walmart sur 28 jours. Ces compétitions révèlent l’état de l’art mais ne le modifient pas fondamentalement.

Kieran Chandler: C’est très intéressant que dans cette compétition, c’était la première fois, à ma connaissance, qu’ils utilisaient une fonction de perte en forme de boule de flipper comme métrique pour déterminer qui était en tête. C’est très obscur, vous savez ? C’est littéralement la métrique utilisée pour mesurer l’exactitude.

Joannes Vermorel: Je crois que Lokad a été le premier à proposer, dès 2012, que les prévisions de la chaîne d’approvisionnement devaient passer aux prévisions quantiles. En fait, plus tard, nous avons dit que nous devions passer aux prévisions probabilistes et faire encore plus de choses. Il y a huit ans, nous avons déclaré que nous devions faire cette transition. Au fait, ces prévisions sont très particulières car elles sont délibérément biaisées. Pour le public qui pourrait être un peu confus, pourquoi voudriez-vous même un biais délibéré pour une prévision de la demande ? La réponse est que dans les magasins, ce que vous voulez, c’est assurer la disponibilité des marchandises. Vous ne voulez pas d’une prévision où, en moyenne, les gens trouvent ce qu’ils cherchent la moitié du temps. Ce n’est pas le but. Vous voulez que les gens aient, disons, un taux de service de 98 % ou quelque chose du genre, où ce qu’ils cherchent est généralement présent dans le magasin. Ainsi, vous voulez avoir une prévision avec un biais, et cette technique est connue sous le nom de prévision quantile. Cette compétition était très intéressante car c’était la première fois qu’il y avait une compétition publique où il était explicitement indiqué qu’il s’agissait d’une prévision quantile.

Rafael de Rezende: Ensuite, vous devez construire la technologie et les outils pour résoudre ce problème. Je suis très content et fier que mon équipe ait réussi à se classer sixième dans une compétition aussi brutale.

Kieran Chandler: Parlons un peu plus de votre équipe. Vous avez mentionné que vous travailliez avec une équipe. Combien étiez-vous dans cette équipe et qui étaient les autres personnes avec lesquelles vous travailliez ?

Rafael de Rezende: Nous étions une équipe de quatre personnes. C’était moi et trois designers de Lokad. L’un d’entre eux ne travaille plus ici, mais il est quand même venu d’ici. Chacun avait un rôle très spécifique au sein de l’équipe. Huggy travaillait avec moi sur le modèle principal, en se concentrant sur les petits détails mathématiques sur la façon dont nous allions aborder le problème. Catarina apportait sa vision commerciale, en analysant les données et en identifiant les principaux points que nous devions prendre en compte pour nous assurer que nous modélisions correctement les choses. Enfin, il y avait Marine, qui a fait environ 80 % du vrai travail difficile. Elle travaillait en tant qu’ingénieure de données cette fois-ci et a construit notre propre infrastructure pour la compétition. Mon rôle était de faire travailler tout le monde ensemble et de maintenir la motivation des gens.

Kieran Chandler: Pouvez-vous expliquer un peu plus l’approche que vous avez adoptée ? En quoi était-elle différente des autres méthodologies existantes ? Qu’est-ce qui la distinguait ?

Rafael de Rezende: Je pense qu’une bonne analogie est de la comparer à la Formule 1. Si vous prenez une voiture de Formule 1 par rapport à une voiture ordinaire, vous verrez que ce n’est pas exactement la même voiture que celle que vous achetez en magasin. Ce sont toutes les deux des voitures, mais elles ne sont pas identiques. En ce qui concerne ce type de compétition, les gens ont tendance à travailler plus ou moins de la même manière. Ils construisent des méthodes qui sont extrêmement coûteuses en termes de calcul, ce qui est excellent pour la compétition, mais ce n’est toujours pas exactement ce que vous obtiendrez si vous achetez réellement le produit à la fin. Il peut y avoir des changements à apporter. Par exemple, la plupart des dix premiers gagnants utilisaient des méthodes qui prenaient beaucoup de temps à s’exécuter, même pour un sous-ensemble assez petit de données provenant de Walmart. C’était complètement absurde, comme dix heures pour un très petit sous-ensemble. Donc,

Kieran Chandler: Nous avons pris une direction différente, ce que nous avons fait et je pense que cette idée était vraiment présente dès le début. Nous voulions appliquer le même cadre théorique que nous utilisons ici au quotidien et le mettre en pratique. Donc, ce que nous avons fait, c’est que la plupart des choses que nous utilisons ne sont pas très éloignées de ce que nous faisons au quotidien. Bien sûr, je veux dire que nous avons peut-être changé la voiture pour mettre en place une configuration de course plus petite, nous avons apporté quelques modifications, enlevé la banquette arrière, etc., pour la rendre plus axée sur les performances. Mais si vous regardez vraiment ce que nous avons fait et ce que les gens font ici, vous devriez être un expert pour identifier réellement quelle est la différence.

Rafael de Rezende: D’accord, donc ce que vous dites, c’est que du point de vue du calcul, parce qu’il n’y avait qu’environ 30 000 SKUs, certaines de ces autres approches ont fonctionné, mais si elles étaient à plus grande échelle, cela serait beaucoup plus difficile pour elles de fonctionner dans le monde réel. Je pense que oui. Je ne dis pas qu’elles ne fonctionneraient pas dans le monde réel ; je pense que cela serait compliqué. Je veux dire, il y a beaucoup de maintenance. Nous avons utilisé des méthodes de faible dimensionalité qui sont connues depuis longtemps, mais la façon dont nous avons résolu le problème ne venait pas de la perspective de la science des données. Nous étions vraiment des professionnels de la supply chain avant tout. Nous avons utilisé tout ce que nous savons sur les supply chains et notre intuition sur le problème, car nous avons déjà participé à de nombreuses autres compétitions internes, donc nous savons comment les choses se comportent, et c’est vraiment ce que nous avons mis en avant.

Kieran Chandler: Qu’en avez-vous pensé de cette approche, et peut-être pourriez-vous donner un aperçu basique de la façon dont vous l’avez perçue de votre point de vue ?

Joannes Vermorel: C’est très intéressant car dans le top 10, donc en gros il y avait 909 équipes qui ont participé. Je n’ai pas regardé toutes les solutions qui ont été proposées, j’ai regardé le top 10. Donc, il y avait des gens qui étaient meilleurs que Lokad, d’autres qui étaient moins bons que Lokad. Ce qui était très intéressant, c’est que si vous regardez les 10 meilleures solutions, elles sont toutes numériquement incroyablement proches. Donc en gros, vous savez, du numéro un au numéro dix, c’est presque rien. Je pense que nous étions quelque chose comme 0,01% après le gars qui était classé numéro cinq, et la personne qui était numéro sept était à environ 0,01% derrière. L’équipe qui était classée numéro un était quelques pourcents en avance, mais c’était quand même très proche dans l’ensemble.

Maintenant, je pense qu’il y a au moins trois aspects dans lesquels ces compétitions ne reflètent pas ce dont vous avez besoin dans le monde réel de la supply chain. Et je pense que la différence entre avoir une Formule 1 et une voiture que vous avez simplement réglée pour la course est très précise à cet égard. Il y avait en fait trois préoccupations majeures.

La première était le coût opérationnel juste pour obtenir des résultats. Les méthodes du top dix, Lokad était le seul à ne pas avoir des coûts de calcul insensés. Et encore une fois, imaginez une voiture qui consomme quelque chose comme 50 litres pour 100 kilomètres. Ce serait quelque chose dix fois plus cher que n’importe quelle voiture qui consomme autant de carburant qu’un camion. Je veux dire, si vous pouvez faire des arrêts aux stands toutes les 20 minutes, c’est génial, mais sinon, non. Et d’ailleurs, avec le cloud computing, ces coûts sont bien réels. Si vous avez besoin de louer mille serveurs, cela coûte beaucoup d’argent.

La deuxième chose est la maintenabilité. Les réglages sont juste, par exemple, si vous regardez cette analogie de la Formule 1, que je trouve excellente, une Formule 1 est superbe car elle fonctionne sur des circuits où la route est parfaite.

Kieran Chandler: C’est comme si vous essayiez de faire rouler une voiture de Formule 1 à Paris. Par exemple, même juste l’humidité sur les trottoirs endommagerait la voiture. La voiture ne peut pas supporter plus qu’un obstacle qui est même, vous savez, plus de quelques centimètres car la Formule 1 est si proche de la route. Elle est littéralement à un centimètre du sol. Donc, si vous avez un obstacle, cela casserait la voiture. Évidemment, si vous décidez d’avoir une voiture normale, vous avez un peu plus de marge de manœuvre et vous n’êtes pas complètement collé au sol. Vous ne conduisez pas aussi vite, mais devinez quoi ? Si votre route est un peu plus cahoteuse, vous survivrez aux obstacles.

Joannes Vermorel: Donc, ces modèles dont je parle, eh bien, en termes de stabilité numérique, vous avez besoin de quelque chose où si vos données ne sont pas parfaites, si vous avez des choses qui sont, vous savez, un peu corrompues ici et là, votre modèle ne devient pas fou et vous ne vous retrouvez pas avec des résultats complètement insensés, ce serait comme si votre voiture de Formule 1 sortait complètement de la piste. La maintenabilité signifie que si vous avez des conditions qui ne sont pas idéales, c’est quand même relativement sain et conservateur, ce qui se traduit encore une fois par le fait que cela fonctionnera.

Dans cette compétition, vous pouvez avoir des gens qui vont passer littéralement des centaines d’heures à s’assurer que tout est parfait, tout comme un circuit de course. Mais dans le monde réel, il se passe des choses tout le temps, et c’est désordonné, et les routes ne sont pas parfaites. Cela se traduit par le fait que la stabilité numérique est très importante pour avoir des modèles qui sont numériquement stables, peut-être un peu moins précis, de sorte que lorsque vous avez un peu de déchets, vous savez, il y a un dicton en data mining : “garbage in, garbage out”. Mais la réalité est que vous avez toujours un peu de déchets, donc vous avez besoin de quelque chose qui ne devient pas fou quand il y a un peu de déchets.

La dernière chose, qui est également complètement absente de cette compétition, est l’extensibilité. La réalité est que, par exemple, dans cette compétition, les niveaux de stock étaient absents, les promotions futures étaient absentes. L’équipe devait prévoir 28 jours à l’avance. Ils avaient l’historique des prix mais ils n’avaient pas les prix futurs pour la durée à prévoir, qui était de 28 jours. Donc, fondamentalement, ils ne connaissaient pas les promotions futures. Si nous voulions avoir une configuration du monde réel, nous devrions intégrer les niveaux de stock, les promotions futures et probablement, nous aurions aimé avoir des contraintes d’étagère sur la quantité de stock que vous pouvez avoir sur les étagères, pour de vrai. Ce sont des contraintes qui, et ensuite vous auriez, disons, la perte qui a été utilisée pour évaluer la précision était une perte de pinball, mais la réalité est que vous pouvez avoir toutes sortes de non-linéarités qui se produisent.

Kieran Chandler: Et quelles sont vos réflexions maintenant que la compétition est terminée ? Joannes a mentionné qu’il y a des différences très fines de 0,1 %. Entrer dans le top cinq doit être un peu frustrant. Avez-vous des idées sur la façon dont vous auriez pu vous améliorer ?

Joannes Vermorel: Nous avons beaucoup de choses que nous n’avons pas essayées pendant la compétition. À un moment donné, vous atteignez la date limite et vous devez dire : “D’accord, c’est tout. Allons-y.” Bien sûr, il y a beaucoup d’idées là-bas que nous aurions pu améliorer. Je ne pense pas que ce sera la prochaine priorité pour le moment. La principale priorité serait de prendre les quelques améliorations que nous avons apportées et essayer de les transmettre à toute l’équipe, à tous les autres scientifiques, et nous assurer que ces idées soient reproduites rapidement pour tous nos clients.

Rafael de Rezende: Ce que Walmart n’est pas, d’ailleurs. Nous allons donc prendre tout ce que nous avons appris et essayer de les mettre en pratique le plus rapidement possible, en partageant notamment les connaissances avec les autres afin de pouvoir aider plus de clients.

Kieran Chandler: Bien. Et vous, Joannes ? Y a-t-il quelque chose que vous avez remarqué que l’équipe a fait et que vous pensez être particulièrement utile pour l’avenir ?

Joannes Vermorel: Franchement, c’était génial. Cela a validé une grande partie de notre approche. Quand je dis que nous devons avoir un modèle qui est super léger, maintenable et extensible, nous avons beaucoup de contraintes qui n’ont rien à voir avec la précision des prévisions. La question est, lorsque vous prenez en compte ces contraintes, à quelle distance êtes-vous de l’état de l’art ? Peut-être que la conclusion aurait été que nos modèles ont de bonnes propriétés, sont maintenables et extensibles, mais qu’ils sont à des années-lumière de ce que vous pourriez obtenir avec l’état de l’art. La conclusion est exactement l’inverse : nous sommes en réalité à seulement un cheveu de ce qui se fait de mieux.

Rafael de Rezende: J’aimerais ajouter que c’était une compétition de supply chain. C’est bien de savoir que vos connaissances dans le domaine sont réellement utiles. Nous étions en compétition principalement contre des personnes qui n’étaient pas des experts en supply chain mais des experts en data science. Nous étions le fournisseur de la supply chain, qui se trouve également être des experts en data science jouant sur le terrain, ce qui nous a peut-être différenciés dans la compétition.

Kieran Chandler: Super. Et toi, Rafael, qu’est-ce qui t’attend ? As-tu d’autres compétitions à l’horizon ?

Rafael de Rezende: Non, je pense que nous avons eu beaucoup de stress cette année, donc nous allons laisser ça pour l’année prochaine, prendre un peu de temps pour nous ressourcer, et peut-être l’année prochaine.

Kieran Chandler: Je pense que vous méritez probablement une pause. C’est tout pour l’émission, et laissons-en là. Merci pour votre temps. C’est tout pour cette semaine. Merci beaucoup de nous avoir suivi, et nous vous retrouverons dans le prochain épisode. Au revoir pour le moment !