00:00:07 Introduction à Kaggle et à l’invité Rafael de Rezende.
00:00:39 Le rôle et le parcours de Rafael chez Lokad.
00:01:29 Kaggle et ses compétitions de machine learning.
00:04:22 La nature compétitive et collaborative de Kaggle.
00:06:55 Impact de la collaboration sur la créativité dans les compétitions de Kaggle.
00:08:02 La compétition M5 et sa portée (prévision des ventes pour 30 000 SKUs dans les magasins Walmart).
00:08:39 Fonction de perte pinball comme métrique de score.
00:10:26 Les membres de l’équipe et leurs rôles spécifiques dans la compétition.
00:12:05 La différence entre les méthodologies de compétition et les applications réelles.
00:14:25 Analyse des 10 meilleures solutions et de leur proximité en termes de performance.
00:16:00 Discussion sur les coûts opérationnels et la maintenabilité des modèles.
00:17:47 Importance de la stabilité numérique dans des scénarios réels.
00:19:21 Extensibilité et contraintes réelles dans les modèles de compétition.
00:20:35 Améliorations possibles et orientation future après la compétition.
00:22:14 Importance de l’expertise métier et comparaison des performances avec l’état de l’art.

Résumé

Dans une interview avec Kieran Chandler, Joannes Vermorel et Rafael de Rezende de Lokad discutent de leur participation à une compétition Kaggle impliquant la prévision des ventes de Walmart. Ils soulignent l’importance de disposer de modèles numériquement stables, maintenables et extensibles. Malgré les contraintes, leur approche a mené à des résultats proches de l’état de l’art, validant leur souci de méthodes pratiques, économiques et maintenables, telle que l’optimization de la supply chain et en étant experts en data science. L’équipe prévoit désormais de mettre en œuvre les enseignements tirés pour améliorer les solutions pour leurs clients.

Résumé étendu

Dans cette interview, l’animateur Kieran Chandler s’entretient avec Joannes Vermorel, fondateur de Lokad, et Rafael de Rezende, Head of Product Development chez Lokad. Les deux invités ont des antécédents en optimisation de la supply chain et apportent leur expertise à la discussion d’une récente compétition Kaggle impliquant la distribution de l’uncertainty des ventes de Walmart.

Rafael de Rezende se présente comme un ingénieur industriel avec une expérience en supply chain. Il travaille chez Lokad depuis trois ans, et son rôle a évolué durant cette période. Actuellement, il occupe le poste de Head of Product Development, dirigeant une équipe qui s’attaque aux sujets « geek » chez Lokad. Ils travaillent principalement sur la prévision des séries temporelles ainsi que sur la résolution d’images à échelle multiple et sur le système MOQ, déjà évoqué précédemment dans l’émission.

Joannes Vermorel présente un aperçu de la compétition Kaggle en question et de Kaggle lui-même, la décrivant comme une « sous-culture » très spécifique. Kaggle, désormais détenu par Google, est une organisation qui organise des compétitions de machine learning dans lesquelles les participants doivent prédire ou prévoir certains résultats. Les entreprises fournissent généralement un jeu de données et offrent des prix en argent importants pour inciter à la participation. Dans le cas de la compétition sur les ventes de Walmart, la mise en jeu était de 100 000 $.

Le cadre de ces compétitions est très compétitif, attirant des centaines de professionnels maîtrisant les derniers algorithmes et publications. Malgré sa nature de niche, Kaggle possède une présence mondiale significative, avec plus d’un million de participants inscrits. Les concurrents ne sont pas nécessairement des chercheurs, mais ils sont habiles à identifier les algorithmes de pointe pour un problème donné. Ils trouvent ensuite de légères améliorations pour obtenir un léger avantage sur les autres et, en fin de compte, remporter la compétition.

Selon Vermorel, les gagnants de Kaggle proviennent généralement d’Amérique du Nord ou d’Asie, mais la communauté de participants est mondiale. L’acquisition de la plateforme par Google souligne encore davantage sa popularité croissante et son importance dans le domaine du machine learning et de la data science.

Vermorel et Rezende apprécient tous deux l’analogie sportive en ce qui concerne la compétition. Ils soulignent l’approche collaborative de l’événement, où les participants s’entraident pour améliorer leurs compétences. En même temps, ils reconnaissent la concurrence féroce qui se crée en raison des incitations financières et de l’implication de grandes organisations.

L’équipe de Lokad était novice dans cette compétition, mais elle avait une expérience préalable des compétitions intenses en gestion de la supply chain. Rezende reconnaît que le niveau de compétition dans cet événement était bien supérieur à celui des défis antérieurs auxquels ils avaient fait face.

Certains critiques soutiennent que la nature collaborative de la compétition pourrait freiner la créativité, les participants pouvant abandonner leurs propres idées pour suivre la trajectoire de solutions à haut score. Cet effet de troupe pourrait limiter l’innovation.

D’un point de vue entreprise, Vermorel est heureux que l’équipe ait participé à la compétition, même si la victoire ne faisait pas partie de la feuille de route stratégique de Lokad. Il estime que de telles compétitions clarifient l’état de l’art dans le domaine sans nécessairement le modifier fondamentalement. Dans cette compétition spécifique, l’équipe, dirigée par Rezende, s’est classée sixième sur 909 équipes dans un défi de prévision des ventes impliquant 30 000 SKUs dans les magasins Walmart sur 28 jours.

Vermorel trouve intéressant que cette compétition ait utilisé pour la première fois une pinball loss function comme métrique de score, une approche que Lokad avait proposée des années auparavant. Il explique que les quantile forecasts sont accompagnées d’un biais intentionnel pour garantir la disponibilité des marchandises en magasin, visant un taux de service élevé. Cette compétition a explicitement stipulé l’utilisation d’une prévision par quantiles, une première dans le domaine.

L’équipe de Rezende était composée de quatre personnes, chacune avec un rôle spécifique. Elles ont travaillé sur le modèle central, analysé les données et construit l’infrastructure pour la compétition. En tant que chef d’équipe, Rezende s’est concentré sur le maintien de la motivation et la coopération de tous.

L’interview se conclut par une comparaison de leur approche à une analogie sportive par Rezende, suggérant qu’ils ont peut-être adopté une approche unique ou stratégique pour la compétition.

La conversation portait sur les différences entre les modèles de compétition et les applications réelles dans l’optimization de la supply chain.

Les participants ont comparé les modèles de compétition à des voitures de Formule 1, qui sont réglées pour des circuits spécifiques mais pas pratiques pour un usage quotidien. Ils ont constaté que les méthodes utilisées dans les compétitions sont coûteuses en calcul et ne conviennent pas toujours aux scénarios réels. Par exemple, les dix premiers gagnants d’une compétition récente ont mis environ 10 heures pour traiter un petit sous-ensemble des données de Walmart, ce qui serait impraticable pour des opérations réelles.

Vermorel et de Rezende ont expliqué que Lokad avait adopté une approche différente en utilisant un cadre théorique similaire à leurs opérations quotidiennes, ne faisant que des ajustements mineurs pour les besoins de la compétition. Ils ont souligné l’importance d’être avant tout des professionnels de la supply chain, en s’appuyant sur leur expérience et leur intuition pour guider leurs décisions.

Les interviewés ont également souligné que les 10 meilleures solutions de la compétition étaient numériquement très proches, avec seulement de petites différences de performance. Ils ont identifié trois préoccupations clés qui distinguent les modèles de compétition des solutions de supply chain réelles : le coût opérationnel, la maintenabilité et l’adaptabilité aux conditions imparfaites. L’approche de Lokad, en revanche, se concentrait sur la minimisation du coût de calcul et l’assurance de la maintenabilité, tout en tenant compte des obstacles et imperfections du monde réel.

Globalement, la discussion a mis en lumière la nécessité de méthodes d’optimization de la supply chain pratiques, économiques et maintenables, pouvant être appliquées dans des scénarios réels, plutôt que des approches purement théoriques ou axées sur la compétition.

Ils évoquent l’importance de disposer de modèles numériquement stables, maintenables et extensibles. La stabilité numérique garantit que les modèles peuvent gérer des données imparfaites sans produire des résultats d’une précision aberrante. La maintenabilité signifie que le modèle peut bien fonctionner même dans des conditions moins qu’idéales. L’extensibilité permet d’incorporer des facteurs supplémentaires, tels que les niveaux de stocks et les futures promotions, dans le modèle.

L’équipe a participé à une compétition de prévision qui soulignait l’importance de la connaissance du domaine dans l’optimization de la supply chain. Malgré des contraintes sans lien avec la précision des prévisions, ils ont pu obtenir des résultats proches de l’état de l’art. Le défi a validé leur approche, prouvant que leurs modèles sont effectivement compétitifs tout en étant légers, maintenables et extensibles.

Après la compétition, l’objectif est désormais de diffuser les enseignements et améliorations obtenus à l’ensemble de l’équipe de Lokad, afin de garantir une mise en œuvre rapide pour leurs clients. L’expérience a également mis en exergue les avantages d’être à la fois experts en supply chain et en data science dans la compétition, par opposition à être uniquement des experts en data science.

Transcription complète

Kieran Chandler: Aujourd’hui, nous sommes ravis d’être rejoints par un de nos collègues, Rafael de Rezende. Il va nous parler d’une récente compétition M5 qui s’est penchée sur la distribution de l’incertitude des ventes de Walmart. Alors, Rafael, merci beaucoup d’avoir fait le déplacement pour nous rejoindre.

Rafael de Rezende: C’est un plaisir d’être ici. Permettez-moi de vous en dire un peu plus sur moi et mon parcours. Je travaille chez Lokad depuis trois ans. J’ai une expérience en supply chain, je suis ingénieur industriel, et pendant mon temps ici chez Lokad, mon rôle a beaucoup évolué. Actuellement, je suis le Head of Product Development chez Lokad, et mon équipe et moi nous attaquons aux sujets très geek de Lokad. Nous travaillons sur la prévision des séries temporelles, la résolution d’images et les MOQs, dont je crois qu’il a déjà été question dans cette émission.

Kieran Chandler: Super, et Joannes, aujourd’hui nous allons parler d’une récente compétition Kaggle qui portait entièrement sur l’examen de la distribution de l’incertitude des ventes de Walmart. Pourriez-vous nous donner un aperçu du défi en lui-même ainsi que de Kaggle ?

Joannes Vermorel: Oui, et peut-être aussi sur Kaggle lui-même. C’est une sous-culture très spécifique. Kaggle est une organisation assez importante qui a été acquise par Google. Ce que Kaggle organise, ce sont des compétitions de machine learning où il faut prédire ou prévoir quelque chose. Pour lancer une compétition, il vous faut un jeu de données pour prévoir ou prédire quelque chose, et de gros prix. Pour la compétition dont nous parlons, la mise en jeu était de 100 000 $. C’est un environnement très compétitif, avec des centaines de personnes qui sont de véritables professionnelles dans ce domaine. C’est en quelque sorte comme un sport de haut niveau.

La communauté qui remporte les compétitions Kaggle n’est généralement pas composée de chercheurs, mais de personnes très habiles à déterminer ce qu’est l’état de l’art. Ils examinent en permanence tout ce qui est publié et identifient ce qui va constituer l’état de l’art. Ensuite, ils doivent ajouter une touche de magie supplémentaire pour obtenir un petit pourcentage d’exactitude en plus qui leur permet de gagner. Ils doivent trouver un tout petit détail qui leur offre un avantage minime, et ils seront devant les autres. C’est une sous-culture très spécifique et immense. Kaggle compte plus d’un million de participants inscrits à travers le monde, même si les gagnants proviennent habituellement d’Amérique du Nord ou d’Asie.

Kieran Chandler: Je veux dire, il a été acheté par Google, donc c’est définitivement en plein essor. Joannes a mentionné l’analogie avec un événement sportif, où des data scientists se font concurrence tout en collaborant, ce que je trouve être une très belle analogie. Parlons donc un peu plus du défi lui-même. Quels ont été les principaux défis auxquels vous avez été confrontés et contre qui étiez-vous en compétition ?

Joannes Vermorel: Je trouve que l’analogie sportive est vraiment bonne. En effet, Kaggle ressemble bien à un sport. Ce qui est appréciable dans Kaggle, c’est l’approche très collaborative où les gens s’entraident et consacrent beaucoup de temps à aider les autres à s’améliorer. Cela se produit en même temps que la compétition acharnée, car de l’argent est en jeu et de grandes organisations parrainent ou surveillent de près ce que vous faites. Nous étions novices sur Kaggle, mais notre équipe avait déjà participé à une forme de compétition auparavant, avec des clients mettant au défi notre solution en matière de supply chain. Cependant, ce n’était pas au même niveau que Kaggle. Sur Kaggle, nous avions 900 équipes, alors qu’auparavant, nous pouvions être en compétition contre deux ou trois équipes. Tout le monde essayait vraiment de s’entraider encore plus que sur Kaggle.

Rafael de Rezende: Une chose intéressante concernant le côté collaboratif de Kaggle est que beaucoup de gens le critiquent pour freiner potentiellement la créativité. Ce qui se passe souvent, c’est que certaines personnes publient une solution qui obtient un bon score au début, et soudain, de nombreuses autres équipes commencent à la suivre, abandonnant ce qu’elles faisaient auparavant. Il y a donc cet effet de troupe, et tout le monde se dirige du même côté. La notion collaborative est bénéfique, mais je dois reconnaître que, parfois, elle entrave la créativité.

Kieran Chandler: Qu’en est-il d’un point de vue entreprise ? Vous avez ces personnes qui travaillent sur leur temps libre. Qu’en pensez-vous ?

Joannes Vermorel: Je suis très content qu’ils l’aient fait. Il n’a jamais fait partie de la stratégie de Lokad de tenter de gagner ces compétitions. J’en ai fait quelques-unes avec beaucoup moins de succès durant les premières années de Lokad, mais j’ai réalisé que ces compétitions ne modifient pas fondamentalement l’état de l’art. Elles clarifient ce qu’est l’état de l’art, ce qui est très bien. Par exemple, cette compétition où l’équipe de Rafael s’est classée sixième sur 909 équipes était initialement prévue comme une compétition de prévision de la demande, mais s’est transformée en une compétition de prévision des ventes parce qu’on n’avait pas correctement pris en compte les ruptures de stock. Ils prévoyaient donc les ventes, et non la demande. C’était une compétition de prévision de la demande pour 30 000 SKUs dans les magasins Walmart sur 28 jours. Ces compétitions révèlent l’état de l’art sans le modifier fondamentalement.

Kieran Chandler: Il est très intéressant que, dans cette compétition, c’était la première fois, à ma connaissance, qu’ils utilisaient une fonction de perte pinball comme métrique pour déterminer le gagnant. C’est très obscur, vous savez ? C’est littéralement la métrique utilisée pour mesurer la précision.

Joannes Vermorel: Je crois que Lokad a été le premier à proposer, dès 2012, que les prévisions supply chain devaient évoluer vers des prévisions quantiles. En fait, par la suite, nous avons affirmé qu’il fallait passer aux prévisions probabilistes et faire encore plus de choses. Il y a huit ans, nous avons déclaré qu’il fallait opérer cette transition. Soit dit en passant, ces prévisions sont très particulières car elles comportent volontairement un biais. Pour ceux qui pourraient être un peu confus, pourquoi voudrait-on délibérément un biais dans une prévision de la demande ? La réponse est que, dans les magasins, on veut garantir la disponibilité des marchandises. Vous ne souhaitez pas une prévision où, en moyenne, les gens trouvent ce qu’ils recherchent seulement la moitié du temps. Ce n’est pas l’objectif. Vous voulez que les clients bénéficient, par exemple, d’un taux de service de 98 % ou quelque chose du genre, où habituellement ce qu’ils recherchent est présent en magasin. Ainsi, on souhaite obtenir une prévision avec un biais, et cette technique est connue sous le nom de prévision quantile. Cette compétition était très intéressante, car c’était la première fois qu’une compétition publique précisait explicitement qu’il s’agissait d’une prévision quantile. Rafael de Rezende: Ensuite, il faut construire la technologie et les outils pour résoudre ce problème. Je suis très heureux et fier que mon équipe ait réussi à se classer sixième dans une compétition aussi brutale. Kieran Chandler: Parlons un peu plus de votre équipe. Vous avez mentionné que vous travailliez en équipe. Combien étiez-vous dans cette équipe, et qui étaient les autres personnes avec qui vous collaboriez ? Rafael de Rezende: Nous étions une équipe de quatre. Il y avait moi et trois designers de chez Lokad. L’un d’eux ne travaille plus ici, mais il venait tout de même de chez nous. Chacun avait un rôle très spécifique au sein de l’équipe. Huggy collaborait avec moi sur le modèle central en se concentrant sur les petits détails mathématiques de la façon dont nous allions aborder le problème. Catarina y apportait sa vision business, en analysant les données et en identifiant les points essentiels à retenir pour modéliser correctement la situation. Enfin, il y avait Marine, qui effectuait environ 80 % du travail réellement difficile. Elle travaillait cette fois en tant que data engineer et a construit notre propre infrastructure pour la compétition. Mon rôle était de faire en sorte que tout le monde collabore et de maintenir la motivation de l’équipe. Kieran Chandler: Pouvez-vous nous en dire un peu plus sur l’approche que vous avez adoptée ? En quoi différait-elle des autres méthodologies existantes ? Qu’est-ce qui était différent ? Rafael de Rezende: Je pense qu’une bonne analogie est de comparer cela à la Formule 1. Si vous comparez une voiture de Formule 1 à une voiture ordinaire, vous verrez que ce n’est pas exactement la même voiture que celle que vous achetez en magasin. Ce sont toutes des voitures, mais elles ne sont pas identiques. Dans ce genre de compétition, les gens ont tendance à travailler plus ou moins de la même manière. Ils élaborent des méthodes extrêmement coûteuses en calcul, ce qui est idéal pour la compétition, mais ce n’est pas exactement ce que vous obtiendrez si vous achetez réellement le produit à la fin. Il peut être nécessaire d’apporter quelques modifications. Par exemple, la plupart des dix premiers gagnants ont utilisé des méthodes dont l’exécution prenait beaucoup de temps, même pour un sous-ensemble relativement restreint de données provenant de Walmart. C’était totalement absurde, comme dix heures rien que pour un tout petit sous-ensemble. Alors, Kieran Chandler: Nous avons pris une direction différente, ce que nous avons fait, et je pense que cette idée était vraiment présente dès le départ. Nous voulions appliquer le même cadre théorique que celui que nous utilisons quotidiennement ici et le mettre en pratique. En réalité, la plupart des choses que nous utilisons ne sont pas si éloignées de ce que nous faisons chaque jour. Bien sûr, nous avons peut-être modifié la voiture en lui donnant une configuration de course plus légère, en effectuant quelques changements – comme retirer les sièges arrière, par exemple – pour la rendre davantage orientée performance. Mais si vous examinez réellement ce que nous avons fait et ce que font les autres ici, il faudrait être un expert pour identifier précisément ce qui fait la différence. Rafael de Rezende: D’accord, donc, sur le plan du calcul, parce qu’il n’y avait qu’environ 30 000 SKUs, certaines de ces autres approches fonctionnaient, mais si elles étaient mises à l’échelle, il serait beaucoup plus difficile de les faire fonctionner dans le monde réel. Je pense que c’est bien ainsi. Je ne dis pas qu’elles ne fonctionneraient pas dans le monde réel ; je pense simplement que ce serait compliqué. Je veux dire, cela demande beaucoup de maintenance. Nous avons utilisé des méthodes de faible dimensionnalité, connues depuis longtemps, mais la manière dont nous avons résolu le problème ne relevait pas uniquement de la data science. Nous étions avant tout des professionnels de la supply chain. Nous avons mis à profit tout ce que nous savons sur les supply chains et notre intuition sur le problème, car nous avons participé à de nombreuses compétitions internes, et nous savons donc comment les choses se comportent. C’est exactement ce que nous avons mis en avant. Kieran Chandler: Quelles ont été vos impressions sur cette approche, et pourriez-vous nous donner un aperçu de la manière dont vous la perceviez ? Joannes Vermorel: C’est très intéressant car, dans le top 10, il y avait en réalité 909 équipes en compétition. Je n’ai pas examiné toutes les solutions proposées, j’ai juste regardé le top 10. Il y avait des équipes meilleures que Lokad et d’autres moins bonnes. Ce qui est particulièrement intéressant, c’est que les dix meilleures solutions étaient toutes numériquement incroyablement proches. En gros, de la première à la dixième place, il n’y a presque aucune différence. Je pense que nous étions à environ 0,01 % derrière la personne classée cinquième, et celle classée septième accusait également environ 0,01 % de retard. L’équipe classée première avait quelques pourcentages d’avance, mais c’était tout de même incroyablement serré dans l’ensemble. Rafael de Rezende: Je tiens à ajouter qu’il s’agissait d’une compétition de supply chain. C’est agréable de constater que la connaissance du domaine est réellement utile. Nous étions principalement en concurrence avec des personnes qui n’étaient pas des experts de la supply chain, mais des experts en data science. Nous étions le fournisseur de supply chain, tout en étant nous-mêmes des experts en data science évoluant dans ce domaine, ce qui a peut-être fait notre différence lors de la compétition. Kieran Chandler: Super. Et, Rafael, que vous réserve l’avenir ? Avez-vous d’autres compétitions en perspective ? Rafael de Rezende: Non, je pense que nous avons eu beaucoup de stress cette année, donc nous allons laisser cela pour l’année prochaine, prendre un peu de temps pour nous ressourcer, et peut-être revenir l’année prochaine. Kieran Chandler: Je pense que vous méritez probablement une pause. Voilà le spectacle, et laissons-en là. Merci pour votre temps. C’est tout pour cette semaine. Merci beaucoup de nous avoir suivis, et nous vous retrouverons dans le prochain épisode. Au revoir pour le moment!

Maintenant, je pense qu’il y a au moins trois angles selon lesquels ces compétitions ne reflètent pas réellement ce dont vous avez besoin dans le monde de la supply chain. Et je pense que la différence entre avoir une Formule 1 et une voiture que vous avez simplement réglée pour la course illustre parfaitement ce propos. Il y avait en réalité trois préoccupations majeures.

Premièrement, le coût opérationnel pour obtenir des résultats. Parmi les méthodes du top 10, Lokad était la seule à ne pas présenter des coûts de calcul exorbitants. Et encore, imaginez une voiture qui consomme environ 50 litres aux 100 kilomètres. Ce serait quelque chose de dix fois plus cher que n’importe quelle voiture qui consomme autant de carburant qu’un truck. Je veux dire, si vous pouvez faire des arrêts aux stands toutes les 20 minutes, c’est plutôt bien, mais sinon, non. Et d’ailleurs, avec cloud computing, ces coûts sont bien réels. Si vous devez louer mille serveurs, cela coûte énormément.

La deuxième chose concerne la maintenabilité. Les réglages sont, par exemple, comme le montre cette analogie avec la Formule 1, que je trouve excellente : une Formule 1 est vraiment remarquable parce qu’elle fonctionne sur des circuits où la route est impeccable.

Kieran Chandler: C’est littéralement comme si vous tentiez de faire fonctionner une voiture de Formule 1 à Paris. Par exemple, même l’humidité sur les trottoirs endommagerait la voiture. La voiture ne peut supporter qu’une bosse de plus de quelques centimètres, car la Formule 1 est tellement proche de la route – elle est littéralement à un centimètre du sol. Ainsi, le moindre obstacle pourrait casser la voiture. Évidemment, si vous optez pour une voiture normale, vous avez un peu plus de marge et vous n’êtes pas complètement collé au sol. Vous ne roulez pas aussi vite, mais, devinez quoi ? Si votre route est un peu plus cahoteuse, vous franchirez les obstacles.

Joannes Vermorel: Donc, les modèles dont je parle, en termes de stabilité numérique, doivent être tels que, si vos données ne sont pas parfaites, si elles sont un peu corrompues ici et là, votre modèle ne devienne pas fou et ne produise pas des résultats complètement aberrants – comme une Formule 1 quittant complètement la piste. La maintenabilité signifie que, même dans des conditions non idéales, le système reste relativement raisonnable et conservateur, ce qui garantit qu’il fonctionnera.

La dernière chose, qui est également complètement absente de cette compétition, est l’extensibilité. En réalité, par exemple, dans cette compétition, les niveaux de stocks étaient absents, tout comme les promotions futures. L’équipe devait prévoir 28 jours à l’avance. Ils disposaient de l’historique des tarifs, mais ils n’avaient pas les futurs prix pour la période à prévoir, qui était de 28 jours. Essentiellement, ils ne connaissaient pas les futures promotions. Si nous voulions mettre en place une configuration réelle, il faudrait intégrer les niveaux de stocks, les promotions futures, et probablement que nous aurions souhaité avoir des contraintes d’étagère sur la quantité de stocks réellement disponibles. Ce sont des contraintes qui, de plus, étaient évaluées avec une perte pinball, alors qu’en réalité, vous pouvez rencontrer toutes sortes de non-linéarités.

Kieran Chandler: Et quelles sont vos impressions maintenant que la compétition est terminée ? Joannes a mentionné qu’il y avait des écarts aussi fins que 0,1 %. Atteindre le top 5 doit être assez frustrant. Des idées sur ce que vous auriez pu améliorer ?

Joannes Vermorel: Nous avons eu de nombreuses choses que nous n’avons pas essayées pendant la compétition. À un moment donné, en approchant de la date limite, il faut se dire : “D’accord, ça suffit, allons-y.” Bien sûr, il y a plein d’idées que nous aurions pu optimiser. Je ne pense pas que ce soit notre prochain objectif pour l’instant. L’objectif principal serait de prendre les quelques améliorations que nous avons apportées et de les diffuser à toute l’équipe, à tous les autres scientifiques, afin que ces connaissances soient rapidement reproduites pour l’ensemble de nos clients.

Rafael de Rezende: Ce Walmart ne l’est pas, d’ailleurs. Nous allons donc mettre en pratique tout ce que nous avons appris et essayer de l’exploiter aussi rapidement que possible, en partageant notamment ces connaissances avec d’autres afin d’aider davantage de clients.

Kieran Chandler: Bien. Et vous, Joannes, y a-t-il quelque chose que vous avez remarqué que l’équipe faisait et que vous pensez être particulièrement utile pour l’avenir ?

Joannes Vermorel: Honnêtement, c’était génial. Cela a validé tellement de notre approche. Quand je dis qu’il nous faut un modèle ultra-optimisé, maintenable et extensible, cela crée de nombreuses contraintes totalement indépendantes de la précision des prévisions. La question est : en tenant compte de ces contraintes, à quel point êtes-vous éloigné du state-of-the-art ? Peut-être que la conclusion aurait été que nos modèles présentent de bonnes propriétés, sont maintenables et extensibles, mais qu’ils sont à des années-lumière de ce que l’on pourrait obtenir avec le state-of-the-art. La conclusion est exactement l’inverse : nous ne sommes en réalité qu’à un cheveu de l’état-of-the-art.

Rafael de Rezende: Je tiens à ajouter qu’il s’agissait d’une compétition de supply chain. C’est agréable de constater que la connaissance du domaine est réellement utile. Nous étions principalement en concurrence avec des personnes qui n’étaient pas des experts de la supply chain, mais des experts en data science. Nous étions le fournisseur de supply chain, tout en étant nous-mêmes des experts en data science opérant dans ce domaine, ce qui a peut-être fait notre différence lors de la compétition.

Kieran Chandler: Super. Et, Rafael, que vous réserve l’avenir ? Avez-vous d’autres compétitions en perspective ?

Rafael de Rezende: Non, je pense que nous avons eu beaucoup de stress cette année, donc nous allons remettre cela à l’année prochaine, prendre un peu de temps pour nous ressourcer, et peut-être revenir l’année prochaine.

Kieran Chandler: Je pense que vous méritez probablement une pause. Voilà le spectacle, et laissons-en là. Merci pour votre temps. C’est tout pour cette semaine. Merci beaucoup de nous avoir suivis, et nous vous retrouverons dans le prochain épisode. Au revoir pour le moment!

Kieran Chandler: Je pense que vous méritez probablement une pause. Voilà le spectacle, et laissons-en là. Merci pour votre temps. C’est tout pour cette semaine. Merci beaucoup de nous avoir suivis, et nous vous retrouverons dans le prochain épisode. Au revoir pour le moment!