Login Contattaci

Competizione di forecasting Walmart - analisi post-game (con Rafael de Rezende)

Back to Lokad TV

luglio 9, 2020

guest speakers

00:00:07 Introduzione a Kaggle e all’ospite Rafael de Rezende.
00:00:39 Il ruolo di Rafael e il suo background presso Lokad.
00:01:29 Kaggle e le sue competizioni di machine learning.
00:04:22 La natura competitiva e collaborativa di Kaggle.
00:06:55 L’impatto della collaborazione sulla creatività nelle competizioni di Kaggle.
00:08:02 Competizione M5 e la sua portata (previsione delle vendite per 30,000 SKUs nei negozi Walmart).
00:08:39 Funzione di perdita pinball come metrica di punteggio.
00:10:26 I membri del team e i loro ruoli specifici nella competizione.
00:12:05 La differenza tra le metodologie delle competizioni e le applicazioni nel mondo reale.
00:14:25 Analisi delle prime 10 soluzioni e della loro vicinanza in termini di prestazioni.
00:16:00 Discussione sui costi operativi e sulla manutenibilità dei modelli.
00:17:47 Importanza della stabilità numerica negli scenari del mondo reale.
00:19:21 Estendibilità e vincoli del mondo reale nei modelli di competizione.
00:20:35 Possibili miglioramenti e focus futuro dopo la competizione.
00:22:14 Significato dell’expertise di settore e confronto delle prestazioni con lo stato dell’arte.

Riassunto

In un’intervista con Kieran Chandler, Joannes Vermorel e Rafael de Rezende di Lokad discutono della loro partecipazione a una competizione Kaggle che ha coinvolto la previsione delle vendite di Walmart. Essi sottolineano l’importanza di avere modelli numericamente stabili, manutenibili ed estensibili. Nonostante le limitazioni, il loro approccio ha portato a risultati vicini allo stato dell’arte, convalidando il loro focus su metodi pratici, economici e manutenibili per l’ottimizzazione della supply chain optimization. L’esperienza ha dimostrato i benefici di essere esperti sia di supply chain che di data science. Il team ora intende implementare le intuizioni acquisite per migliorare le soluzioni offerte ai loro clienti.

Riassunto Esteso

In questa intervista, il conduttore Kieran Chandler parla con Joannes Vermorel, fondatore di Lokad, e Rafael de Rezende, Head of Product Development di Lokad. Entrambi gli ospiti vantano un background nell’ottimizzazione della supply chain e mettono a disposizione la loro esperienza per discutere di una recente competizione Kaggle che ha riguardato la distribuzione dell’incertezza delle vendite di Walmart.

Rafael de Rezende si presenta come un ingegnere industriale con un background in supply chain. Lavora presso Lokad da tre anni, e il suo ruolo si è evoluto nel tempo. Attualmente, ricopre il ruolo di Head of Product Development, guidando un team che si occupa degli argomenti più “geeky” di Lokad. Lavorano principalmente sulla previsione delle time series, oltre che sulla risoluzione di immagini a multi-scala e sul sistema MOQ, già discusso in precedenza nel programma.

Joannes Vermorel offre una panoramica della competizione Kaggle in questione e di Kaggle stesso, descrivendolo come una “subcultura molto specifica”. Kaggle, ora di proprietà di Google, è un’organizzazione che ospita competizioni di machine learning in cui i partecipanti devono prevedere o fare forecasting di determinati risultati. Le aziende generalmente forniscono un dataset e offrono grandi premi in denaro per incentivare la partecipazione. Nel caso della competizione sulle vendite di Walmart, erano in palio $100,000.

L’ambiente in queste competizioni è altamente competitivo, attirando centinaia di professionisti esperti negli algoritmi più recenti e nelle pubblicazioni di punta. Nonostante la sua natura di nicchia, Kaggle vanta una presenza globale significativa, con oltre un milione di partecipanti registrati. I concorrenti non sono necessariamente ricercatori, ma sono abili nell’individuare gli algoritmi all’avanguardia per un dato problema. Successivamente, apportano piccoli miglioramenti per ottenere un lieve vantaggio sugli altri e infine vincere la competizione.

Secondo Vermorel, i vincitori di Kaggle provengono tipicamente dal Nord America o dall’Asia, ma la comunità dei partecipanti è mondiale. L’acquisizione della piattaforma da parte di Google sottolinea ulteriormente la sua crescente popolarità e importanza nel campo del machine learning e della data science.

Sia Vermorel che Rezende apprezzano l’analogia sportiva applicata alla competizione. Sottolineano l’approccio collaborativo dell’evento, in cui i partecipanti si aiutano a vicenda a migliorare le proprie competenze. Al contempo, riconoscono la feroce competizione che scaturisce dagli incentivi economici e dal coinvolgimento di grandi organizzazioni.

Il team Lokad era nuovo a questa competizione, ma aveva già maturato esperienze in competizioni intense di supply chain management. Rezende riconosce che il livello della competizione in questo evento era molto più alto rispetto alle sfide precedenti affrontate.

Alcuni critici sostengono che la natura collaborativa della competizione possa ostacolare la creatività, poiché i partecipanti potrebbero abbandonare le proprie idee per seguire quelle delle soluzioni con punteggi elevati. Questo effetto gregge potrebbe limitare il pensiero innovativo.

Da un punto di vista aziendale, Vermorel è lieto che il team abbia partecipato alla competizione, anche se la vittoria non faceva parte della roadmap strategica di Lokad. Egli crede che tali competizioni chiariscano lo stato dell’arte nel settore senza necessariamente modificarlo in modo fondamentale. In questa competizione, il team, guidato da Rezende, si è classificato al sesto posto su 909 squadre in una sfida di previsione delle vendite che ha coinvolto 30,000 SKUs nei negozi Walmart per 28 giorni.

Vermorel ritiene interessante il fatto che questa competizione abbia utilizzato per la prima volta una pinball loss function come metrica di valutazione, qualcosa che Lokad aveva proposto anni prima. Egli spiega che le quantile forecasts presentano un bias intenzionale per garantire la disponibilità delle merci nei negozi, mirando a un alto livello di servizio. Questa competizione ha esplicitamente previsto l’uso di una quantile forecast, una novità nel settore.

Il team di Rezende era composto da quattro persone, ciascuna con un ruolo specifico. Hanno lavorato sul modello centrale, analizzato i dati e costruito l’infrastruttura per la competizione. In qualità di leader del team, Rezende si è concentrato nel mantenere alta la motivazione di tutti e nel far lavorare insieme il gruppo.

L’intervista si conclude con Rezende che paragona il loro approccio a un’analogia sportiva, suggerendo che potrebbero aver adottato un approccio unico o strategico nella competizione.

La conversazione ha ruotato attorno alle differenze tra i modelli di competizione e le applicazioni nel mondo reale per l’ottimizzazione della supply chain.

I partecipanti hanno paragonato i modelli di competizione alle auto di Formula Uno, che sono calibrate per circuiti specifici ma non pratiche per l’uso quotidiano. Hanno osservato che i metodi usati nelle competizioni sono computazionalmente costosi e non sempre adatti agli scenari reali. Ad esempio, i dieci vincitori di una recente competizione hanno impiegato circa 10 ore per elaborare un piccolo sottoinsieme dei dati di Walmart, operazione che risulterebbe impraticabile nelle operazioni quotidiane.

Vermorel e de Rezende hanno spiegato che Lokad ha adottato un approccio diverso, utilizzando un framework teorico simile alle operazioni quotidiane, apportando solo piccoli aggiustamenti per le esigenze della competizione. Hanno sottolineato l’importanza di essere, prima di tutto, professionisti della supply chain, sfruttando la propria esperienza e intuizione per guidare le decisioni.

Gli intervistati hanno anche osservato che le prime 10 soluzioni della competizione erano numericamente molto vicine, con solo piccole differenze nelle prestazioni. Hanno identificato tre aspetti chiave che distinguono i modelli da competizione dalle soluzioni reali per la supply chain: costo operativo, manutenibilità e adattabilità a condizioni non perfette. L’approccio di Lokad, invece, si è concentrato sulla minimizzazione dei costi di calcolo e sull’assicurare la manutenibilità, tenendo conto anche degli ostacoli e delle imperfezioni del mondo reale.

Nel complesso, la discussione ha evidenziato la necessità di metodi pratici, economicamente vantaggiosi e manutenibili per l’ottimizzazione della supply chain che possano essere applicati in scenari reali, anziché approcci puramente teorici o dettati dalle competizioni.

Hanno parlato dell’importanza di avere modelli numericamente stabili, manutenibili ed estensibili. La stabilità numerica garantisce che i modelli possano gestire dati imperfetti senza produrre risultati estremamente imprecisi. La manutenibilità assicura che il modello funzioni bene anche in condizioni non ideali. L’estendibilità permette di incorporare ulteriori fattori, come i livelli di magazzino e le future promotions, nel modello.

Il team ha partecipato a una forecasting competition che ha messo in luce l’importanza della conoscenza di settore nell’ottimizzazione della supply chain. Nonostante le limitazioni non collegate all’forecasting accuracy, sono riusciti a ottenere risultati vicini allo stato dell’arte. La sfida ha convalidato il loro approccio, dimostrando che i loro modelli sono davvero competitivi, pur essendo snelli, manutenibili ed estensibili.

Dopo la competizione, l’obiettivo ora è trasmettere le intuizioni e i miglioramenti acquisiti a tutto il team di Lokad, assicurando un’implementazione rapida per i loro clienti. L’esperienza ha evidenziato anche i benefici di essere esperti sia di supply chain che di data science nella competizione, rispetto all’essere esclusivamente esperti di data science.

Trascrizione Completa

Kieran Chandler: Oggi siamo lieti di essere affiancati da uno dei nostri colleghi, Rafael de Rezende. Ci parlerà di una recente competizione M5 che ha esaminato la distribuzione dell’incertezza delle vendite di Walmart. Quindi, Rafael, grazie mille per aver fatto il viaggio lungo il corridoio per unirti a noi.

Rafael de Rezende: È un piacere essere qui. Forse posso raccontarvi un po’ di me e del mio percorso. Lavoro qui a Lokad da tre anni. Ho un background in supply chain, sono un ingegnere industriale, e durante il mio tempo qui a Lokad il mio ruolo è cambiato molto. Attualmente, sono il Head of Product Development di Lokad, e io e il mio team ci occupiamo degli argomenti più “geeky” di Lokad. Lavoriamo sulla previsione delle serie temporali, sulla risoluzione delle immagini e sui MOQs, che credo siano già stati trattati qui nello show.

Kieran Chandler: Ottimo, e Joannes, oggi parleremo di una recente competizione Kaggle che riguardava l’analisi della distribuzione dell’incertezza delle vendite di Walmart. Forse potresti darci una panoramica della sfida effettiva e di Kaggle in generale?

Joannes Vermorel: Sì, e magari anche di Kaggle in sé. È una subcultura molto specifica. Kaggle è un’organizzazione piuttosto grande, acquisita da Google. Ciò che Kaggle organizza sono competizioni di machine learning in cui bisogna prevedere o fare forecasting di qualcosa. Per organizzare una competizione, è necessario un dataset su cui basare le previsioni e servono grandi premi. Nella competizione di cui parliamo, erano in palio $100,000. È un ambiente molto competitivo, con centinaia di persone che sono veri professionisti. È in un certo senso come uno sport di alto livello.

La comunità che vince le competizioni Kaggle non è tipicamente composta da ricercatori, ma da professionisti abili nell’individuare lo stato dell’arte. Analizzano continuamente ciò che viene pubblicato e individuano quale approccio diventerà lo stato dell’arte. Poi, devono aggiungere un tocco in più per ottenere un piccolo extra di precisione che consenta loro di vincere, trovando un dettaglio minimo che offra un leggero vantaggio e li metta davanti agli altri. È una subcultura molto specifica ed è enorme. Kaggle conta più di 1 milione di partecipanti registrati da tutto il mondo, anche se i vincitori provengono solitamente dal Nord America o dall’Asia.

Kieran Chandler: Voglio dire, è stata acquistata da Google, quindi è decisamente in ascesa. Joannes ha menzionato l’analogia con un evento sportivo, in cui i data scientist competono ma collaborano anche, e trovo che sia un’analogia davvero bella. Quindi, parliamo un po’ più nel dettaglio della sfida stessa. Quali sono state le principali difficoltà che avete affrontato e contro chi vi siete trovati a competere?

Joannes Vermorel: Credo che l’analogia sportiva sia davvero azzeccata. Voglio dire, Kaggle si percepisce come uno sport, davvero. Ciò che è bello in Kaggle è l’approccio fortemente collaborativo, in cui le persone si aiutano a vicenda e dedicano molto tempo a far progredire gli altri. Questo avviene accanto a una concorrenza spietata, dato che c’è denaro in gioco e grandi organizzazioni sponsorizzano o osservano da vicino ciò che fate. Noi eravamo principianti in Kaggle, ma il nostro team aveva già partecipato a qualche competizione con clienti che mettevano in discussione la nostra soluzione in ambito supply chain. Tuttavia, non era la stessa cosa di Kaggle. In Kaggle eravamo 900 squadre, mentre in passato potevamo confrontarci con due o tre team. Tutti cercavano davvero di aiutarsi a vicenda, anche più di quanto accada in Kaggle.

Rafael de Rezende: Una cosa interessante del lato collaborativo di Kaggle è che molti lo criticano, sostenendo che possa in alcuni casi ostacolare la creatività. Spesso, infatti, qualcuno pubblica una soluzione che inizialmente segna un buon punteggio, e all’improvviso molte altre squadre iniziano a seguirla, abbandonando il percorso che stavano seguendo. Si crea così un effetto gregge, e tutti finiscono per convergere nello stesso punto. Il lato collaborativo è benefico, ma devo concordare con chi afferma che talvolta ostacola la creatività.

Kieran Chandler: E dal punto di vista aziendale? Avete queste persone che lavorano nel loro tempo libero. Che cosa ne pensate?

Joannes Vermorel: Sono molto contento che l’abbiano fatto. Non è mai stata la strategia di Lokad cercare di vincere queste competizioni. Ne ho fatte alcune con molto meno successo nei primi anni di Lokad, ma ho capito che queste competizioni non modificano fondamentalmente lo stato dell’arte. Chiariscono qual è lo stato dell’arte, il che è molto positivo. Ad esempio, questa competizione in cui il team di Rafael si è classificato sesto su 909 squadre era intesa come una competizione di previsione della domanda, ma si è rivelata invece una competizione di previsione delle vendite a causa della mancata corretta esclusione degli rotture di stock. Quindi stavano prevedendo le vendite, non la domanda. Era una competizione di previsione della domanda per 30.000 SKU nei negozi Walmart su un arco di 28 giorni. Queste competizioni rivelano lo stato dell’arte, ma non lo modificano fondamentalmente.

Kieran Chandler: È molto interessante che in questa competizione, per quanto ne sappia, sia stata usata per la prima volta una funzione di perdita pinball come metrica per determinare il vincitore. È davvero oscura, sai? È letteralmente la metrica usata per misurare l’accuratezza.

Joannes Vermorel: Credo che Lokad sia stato il primo a proporre, già nel 2012, che le previsioni della supply chain dovessero passare alle previsioni di quantile. In realtà, in seguito abbiamo detto che dovevamo passare alle previsioni probabilistiche e fare ancora di più. Otto anni fa, abbiamo affermato che era necessario compiere questa transizione. A proposito, queste previsioni sono molto strane perché presentano volutamente un bias. Per il pubblico che potrebbe essere un po’ confuso, perché mai vorresti avere intenzionalmente un bias in una previsione della domanda? La risposta è che, nei negozi, ciò che si desidera è garantire la disponibilità della merce. Non vuoi una previsione in cui, in media, le persone trovi ciò che cercano solo la metà delle volte. Non è questo l’obiettivo. Vuoi che le persone abbiano, diciamo, un livello di servizio del 98% o qualcosa del genere, in modo che di solito ciò che cercano sia presente nel negozio. Quindi, vuoi avere una previsione con un bias, e questa tecnica è conosciuta come previsione di quantile. Questa competizione è stata molto interessante perché è stata la prima volta in cui c’era una competizione pubblica in cui era esplicitamente dichiarato come previsione di quantile.

Rafael de Rezende: Successivamente, bisogna costruire la tecnologia e gli strumenti per risolvere questo problema. Sono molto contento e orgoglioso che il mio team sia riuscito a classificarsi sesto in una competizione così dura.

Kieran Chandler: Parliamo un po’ di più del tuo team. Hai detto che stavi lavorando con un team. Quanti eravate e chi erano le altre persone con cui lavoravi?

Rafael de Rezende: Eravamo un team di quattro. C’erano io e tre designer di Lokad. Uno non lavora più qui, ma proveniva comunque da qui. Ognuno aveva un ruolo molto specifico all’interno del team. Huggy lavorava con me sul modello di base, concentrandosi sui piccoli dettagli matematici su come affrontare il problema. Catarina portava la sua visione imprenditoriale, analizzava i dati e identificava i punti principali da considerare per assicurarci di modellare correttamente le cose. Infine, c’era Marine, che ha svolto circa l'80% del lavoro davvero duro. Questa volta lavorava come data engineer e ha costruito la nostra infrastruttura per la competizione. Il mio ruolo era quello di far lavorare tutti insieme e mantenere alta la motivazione.

Kieran Chandler: Puoi parlare un po’ di più dell’approccio che avete adottato? In che modo differiva dalle altre metodologie esistenti? Cosa c’era di diverso?

Rafael de Rezende: Penso che una buona analogia sia paragonarla alla Formula One. Se prendi una monoposto di Formula One rispetto a un’auto normale, vedrai che non è esattamente la stessa auto di quella che compri in un negozio. Sono entrambe auto, ma non sono la stessa cosa. Quando si tratta di questo tipo di competizione, le persone tendono a lavorare più o meno allo stesso modo. Costruiscono metodi estremamente costosi dal punto di vista computazionale, che vanno bene per la competizione, ma non sono esattamente ciò che otterresti se acquistassi effettivamente il prodotto alla fine. Potrebbero essere necessari alcuni cambiamenti. Ad esempio, la maggior parte dei vincitori tra i primi dieci ha utilizzato metodi che richiedevano molto tempo per essere eseguiti, anche per un sottoinsieme abbastanza ridotto di dati di Walmart. Era completamente assurdo, tipo dieci ore solo per un sottoinsieme molto piccolo. Quindi,

Kieran Chandler: Abbiamo preso una direzione diversa, quello che abbiamo fatto e penso che quest’idea sia stata davvero presente fin dall’inizio. Volevamo applicare lo stesso quadro teorico che usiamo qui quotidianamente e metterlo su binari. Quindi, ciò che abbiamo fatto è stato che la maggior parte delle cose che utilizziamo non è poi così distante da quelle che facciamo ogni giorno. Ovviamente, potremmo aver modificato l’auto per un setup da gara più ridotto, abbiamo fatto alcune modifiche, tolto il sedile posteriore, ecc., per renderla più orientata alla performance. Ma se controlli davvero ciò che abbiamo fatto e ciò che le persone stanno facendo qui, dovresti essere un esperto solo per identificare qual è realmente la differenza.

Rafael de Rezende: Ok, quindi quello che stai dicendo è che, computazionalmente, dato che c’erano solo circa 30.000 SKU, alcuni di quegli altri approcci funzionavano, ma se fossero stati su scala, sarebbe stato molto più difficile farli funzionare nel mondo reale. Credo di sì. Non sto dicendo che non funzionerebbero nel mondo reale; penso che sarebbe complicato. Voglio dire, c’è molta manutenzione. Abbiamo utilizzato metodi a bassa dimensionalità che sono noti da molto tempo, ma il modo in cui abbiamo affrontato il problema non è stato da una prospettiva di data science. Siamo stati prima di tutto professionisti della supply chain. Abbiamo messo insieme tutto ciò che sappiamo sulle supply chain e la nostra intuizione sul problema perché avevamo già partecipato a molte altre competizioni interne, quindi sappiamo come si comportano le cose, ed è proprio questo che abbiamo messo in campo.

Kieran Chandler: Quali sono state le tue impressioni su questo approccio, e forse potresti dare una panoramica di base su come lo hai visto dalla tua prospettiva?

Joannes Vermorel: È molto interessante perché, tra i primi 10, in sostanza c’erano 909 squadre che hanno partecipato. Non ho esaminato tutte le soluzioni fornite, mi sono concentrato sui primi 10. Quindi, c’erano persone migliori di Lokad e altre peggiori. La cosa molto interessante è che se guardi le prime 10 soluzioni, sono tutte incredibilmente vicine numericamente. Insomma, dalla prima alla decima posizione, la differenza è quasi nulla. Penso che eravamo circa allo 0,01% dopo il ragazzo classificato quinto, e la persona al settimo posto era circa dello 0,01% indietro. Il team classificato al primo posto era avanti di qualche percento, ma nel complesso erano ancora incredibilmente vicini.

Ora, penso che ci siano almeno tre aspetti in cui queste competizioni non riflettono ciò che è necessario nel mondo reale della supply chain. E penso che la differenza tra avere una Formula One e un’auto che hai appena messo a punto per la gara sia molto accurata a questo proposito. In realtà, c’erano tre preoccupazioni principali.

La prima era il costo operativo solo per ottenere risultati. Dei metodi tra i primi dieci, Lokad è stato l’unico che non aveva costi computazionali assurdi. E ancora, immagina un’auto che consuma qualcosa come 50 litri per 100 chilometri. Sarebbe qualcosa di dieci volte più costosa di qualsiasi auto che consuma tanto carburante quanto un truck. Voglio dire, se puoi fare soste ai box ogni 20 minuti, sarebbe fantastico, altrimenti no. E tra l’altro, con il cloud computing, quei costi sono molto reali. Se hai bisogno di noleggiare mille server, costa un sacco di soldi.

La seconda cosa è la manutenibilità. Gli scenari sono, per esempio, se guardi questa analogia con la Formula One, che trovo eccellente, una Formula One è davvero fantastica perché funziona su circuiti dove la strada è perfetta.

Kieran Chandler: È letteralmente come se stessi cercando di far correre una monoposto di Formula One a Parigi. Ad esempio, anche solo l’umidità sui marciapiedi danneggerebbe l’auto. L’auto non può subire più di un urto, anche di pochi centimetri, perché la Formula One è così vicina alla strada. È letteralmente a un centimetro dal suolo. Quindi, se c’è un ostacolo, l’auto si romperebbe. Ovviamente, se scegli un’auto normale, hai un po’ più di margine e non sei completamente attaccato al suolo. Non guidi così veloce, ma indovina un po’? Se la strada è un po’ più accidentata, l’auto sopravvive agli ostacoli.

Joannes Vermorel: Quindi, quei modelli di cui parlo, in termini di stabilità numerica, devono essere tali che, se i dati non sono perfetti, se ci sono delle imprecisioni qua e là, il modello non impazzisca e non finisca con risultati completamente insensati, proprio come una monoposto di Formula One che esce completamente di pista. La manutenibilità significa che, anche in condizioni non ideali, il modello rimane relativamente ragionevole e conservativo, il che si traduce nel fatto che funzionerà.

In questa competizione, ci sono persone che passeranno letteralmente centinaia di ore a far sì che tutto sia perfetto, proprio come in un circuito di gara. Ma nel mondo reale accadono cose continuamente, ed è tutto caotico, e le strade non sono perfette. Ciò si traduce nel fatto che la stabilità numerica è fondamentale per avere modelli numericamente stabili, magari un po’ meno accurati, in modo tale che, quando c’è un po’ di “spazzatura” nei dati, come dice il proverbio nel data mining: “garbage in, garbage out”. Ma la realtà è che c’è sempre un po’ di spazzatura, quindi serve qualcosa che non impazzi quando i dati sono un po’ sporchi.

L’ultima cosa, che è completamente assente in questa competizione, è l’estendibilità. La realtà è che, per esempio, in questa competizione, i livelli di stock erano assenti, così come le promozioni future. Il team doveva fare previsioni per 28 giorni successivi. Avevano la storia dei prezzi, ma non avevano i prezzi futuri per il periodo da prevedere, ovvero 28 giorni. Quindi, in sostanza, non conoscevano le promozioni future. Se volessimo avere un setup nel mondo reale, dovremmo integrare i livelli di stock, le promozioni future e probabilmente ci sarebbero piaciuti dei vincoli sugli scaffali su quanta merce si può effettivamente avere esposta. Questi sono vincoli che, e poi avresti, diciamo, la perdita utilizzata per valutare l’accuratezza era una perdita pinball, ma la realtà è che possono verificarsi ogni sorta di non linearità.

Kieran Chandler: E quali sono i tuoi pensieri ora che la competizione è finita? Joannes ha menzionato che le differenze sono davvero minime, dell'0,1%. Raggiungere i primi cinque deve essere stato piuttosto frustrante. Hai qualche idea su come avreste potuto migliorare?

Joannes Vermorel: Avevamo molte cose che non abbiamo sperimentato durante la competizione. A un certo punto, si arriva alla scadenza e devi dire: “Ok, questo è tutto. Andiamo avanti.” Naturalmente, ci sono molte idee che avremmo potuto migliorare. Non credo che questo sarà il focus principale al momento. L’obiettivo principale sarà prendere i pochi miglioramenti che abbiamo realizzato e cercare di estenderli a tutto il team, a tutti gli altri scientist, e assicurarci che queste intuizioni vengano rapidamente riprodotte per tutti i nostri clienti.

Rafael de Rezende: Che Walmart non è, a proposito. Quindi prenderemo tutto ciò che abbiamo imparato e cercheremo di metterlo in pratica il più rapidamente possibile, specialmente condividendo la conoscenza con gli altri, così da poter aiutare più clienti.

Kieran Chandler: Bello. E per quanto riguarda te, Joannes? C’è qualcosa che hai notato che il team fa e che pensi possa essere particolarmente utile per il futuro?

Joannes Vermorel: Francamente, è stato fantastico. Ha convalidato gran parte del nostro approccio. Quando dico che abbiamo bisogno di un modello che sia super snello, manutenibile ed estendibile, ci troviamo di fronte a molte restrizioni che sono completamente indipendenti dall’accuratezza delle previsioni. La domanda è: se si tengono conto di queste restrizioni, quanto siamo lontani dallo stato dell’arte? Forse la conclusione sarebbe stata che i nostri modelli hanno buone proprietà, sono manutenibili ed estendibili, ma che sono anni luce indietro rispetto a quanto si potrebbe ottenere con lo stato dell’arte. La conclusione è esattamente l’opposto: siamo in realtà a un soffio dallo stato dell’arte.

Rafael de Rezende: Vorrei aggiungere che si trattava di una competizione di supply chain. È bello sapere che la tua conoscenza del settore è davvero utile. Stavamo competendo principalmente contro persone che non erano Supply Chain Scientists, ma esperti di data science. Noi eravamo il provider di supply chain, che per di più consisteva in esperti di data science che operavano nel settore, e questo potrebbe averci differenziato nella competizione.

Kieran Chandler: Ottimo. E, Rafael, cosa c’è in programma per te? Hai altre competizioni all’orizzonte?

Rafael de Rezende: No, penso che quest’anno abbiamo avuto molto stress, quindi lo rimanderemo all’anno prossimo, ci prenderemo un po’ di tempo per rinfrescarci, e poi magari l’anno prossimo.

Kieran Chandler: Penso che meritiate davvero una pausa. Questo è il programma, e lasciamo qui. Grazie per il vostro tempo. Questo è tutto per questa settimana. Grazie mille per averci seguito, e ci vediamo nel prossimo episodio. Ciao per ora!

PREVIOUS EPISODES