Previsioni migliori per le promozioni nel retail
Da quando lo scorso autunno abbiamo effettuato l’upgrade principale dei Tags+Events, stiamo lavorando molto attivamente alle previsioni promotion per il retail. Ora abbiamo migliaia di eventi promozionali nei nostri database; e l’analisi di tali eventi ci ha portato a scoprire risultati molto interessanti.
E, non sorprende affatto, abbiamo riscontrato che:
- le previsioni promozionali effettuate manualmente dai professionisti mostrano solitamente errori di previsione medi superiori al 60%. I risultati possono variare, ma gli errori tipici nelle previsioni di vendita nel retail si attestano generalmente intorno al 20%.
- includere i dati relativi alle promozioni tramite tags ed events riduce l’errore medio di previsione di circa il 50%. Ancora, i risultati possono variare a seconda della quantità di dati che possiedi sugli eventi promozionali.
Come risultato meno intuitivo, abbiamo anche constatato che i metodi basati su regole e i metodi lineari, sebbene ampiamente promossi da alcuni esperti e strumenti software, sono molto deboli nei confronti dell’overfitting, e possono distorcere la valutazione dell’errore di previsione, portando a una falsa percezione delle prestazioni nella previsione delle promozioni.
Inoltre, nota che questo miglioramento del 50% è stato ottenuto di solito con una quantità di informazioni piuttosto limitata, solitamente non più di 2 o 3 descrittori binari per promozione.
Anche dati grezzi sulle tue promozioni portano a miglioramenti significativi nelle previsioni, che si traducono in notevoli risparmi di capitale circolante.
Il primo passo per migliorare le tue previsioni promozionali consiste nel raccogliere dati accurati sulle promozioni. Secondo la nostra esperienza, questo passaggio è il più difficile e costoso. Se non hai registrazioni accurate delle tue promozioni, c’è poche speranze di ottenere previsioni accurate. Come si dice, Garbage In, Garbage Out.
Tuttavia, abbiamo notato che anche un singolo descrittore della promozione, una variabile binaria che indica semplicemente se l’articolo è attualmente in promozione o meno, può portare a un miglioramento significativo delle previsioni. Quindi, sebbene i tuoi registri debbano essere accurati, non è necessario che siano dettagliati per migliorare le tue previsioni.
Pertanto, ti consigliamo di tenere traccia con precisione della tempistica delle tue promozioni: quando è iniziata? quando è terminata? Nota che per l’eCommerce, l’esposizione in prima pagina ha spesso un effetto paragonabile a quello di una promozione del prodotto, perciò è necessario monitorare l’evoluzione della tua front page.
Poi, la descrizione dell’articolo conta. Infatti, secondo la nostra esperienza, anche gli articoli promossi più frequentemente non avranno più di una dozzina di promozioni nel corso della loro vita sul mercato. In media, la quantità di promozioni passate conosciute per un dato articolo è ridicolmente bassa, variando da zero a una promozione passata in media. Di conseguenza, non puoi aspettarti risultati affidabili concentrandoti sulle promozioni passate di un singolo prodotto alla volta, perché per la maggior parte del tempo non ce ne sono.
Quindi, invece, devi concentrarti sugli articoli che somigliano a quello che intendi promuovere. Con Lokad, puoi farlo associando tags alle tue vendite. Tipicamente, i rivenditori utilizzano una gerarchia per organizzare il loro catalogo. Pensa a una gerarchia di articoli con famiglie, sottofamiglie, articoli, varianti, ecc.
La traduzione di un catalogo gerarchico in tags può essere eseguita in modo piuttosto semplice seguendo il processo illustrato qui sotto per un ipotetico rivenditore di caramelle:

I tags associati alla storia delle vendite di lecca-lecca al limone di taglia media sarebbero LOLLIPOPS, LEMON, MEDIUM
Questo processo creerà tipicamente da 2 a 6 tag per articolo nel tuo catalogo - a seconda della complessità del catalogo.
Abbiamo detto che anche informazioni molto limitate sulle tue promozioni possono essere utilizzate per migliorare immediatamente le previsioni di vendita. Tuttavia, informazioni promozionali più dettagliate migliorano chiaramente la precisione delle previsioni.
Abbiamo riscontrato che due elementi sono particolarmente preziosi per migliorare la precisione delle previsioni:
- il meccanismo che descrive la natura dello sconto offerto ai tuoi clienti. I meccanismi tipici sono sconto fisso (es. -20%), ma esistono molti altri meccanismi come la spedizione gratuita o sconto per quantità maggiori (es: compra uno e prendi uno gratis).
- la comunicazione che descrive come i tuoi clienti vengono avvisati dell’evento promozionale. Tipicamente, la comunicazione include operazioni di marketing come radio, giornali o pubblicità locali, ma anche un packaging personalizzato (se presente) e la visibilità degli articoli in promozione nel punto vendita.
Nel caso di reti distributive più estese, la disponibilità complessiva della promozione dovrebbe essere descritta anche se gli articoli non sono promossi ovunque. Tale situazione si verifica tipicamente se i responsabili dei punti vendita possono rinunciare alle operazioni promozionali.
Parlando con i professionisti, abbiamo constatato che molti rivenditori si aspettano che Lokad produca un insieme di regole; e che tali regole siano in grado di spiegare promozioni quali ad esempio
SE TV_ADS E PERCENT25_DISCOUNT
ALLORA PROMO_SALES = 5 * REGULAR_SALES;
Fondamentalmente, quelle regole attese seguono più o meno gli stessi schemi:
- Un insieme di condizioni binarie che definiscono l’ambito della regola.
- Un insieme di coefficienti lineari per stimare l’effetto della regola.
Abbiamo constatato che esistono molti strumenti nel mercato software che possono aiutarti a scoprire quelle regole nei tuoi dati; il che, apparentemente, ha portato molte persone a credere che questo approccio fosse l’unico disponibile.
Eppure, secondo i nostri esperimenti, i metodi basati su regole sono tutt’altro che ottimali. Peggio ancora, quelle regole sono davvero deboli nei confronti dell’overfitting. Questa debolezza porta frequentemente a situazioni problematiche in cui esiste un divario significativo tra la precisione di previsione stimata e quella reale.
Overfitting è un fenomeno molto sottile eppure molto importante nella previsione statistica. Fondamentalmente, il problema centrale nella previsione è che si desidera costruire un modello molto accurato contro i dati che non possiedi.
In particolare, la teoria statistica indica che è possibile costruire modelli che risultino molto accurati quando applicati ai dati storici, eppure molto imprecisi nel prevedere il futuro. Il problema è che, nella pratica, se non si considera attentamente il problema dell’overfitting in anticipo, costruire un tale modello non è una mera possibilità, ma il risultato più probabile del tuo processo.
Pertanto, devi davvero ottimizzare il tuo modello rispetto ai dati che non possiedi. Tuttavia, questo problema sembra essere un completo paradosso, perché, per definizione, non puoi misurare nulla se non hai i dati corrispondenti. E abbiamo constatato che molti professionisti hanno rinunciato a questa problematica, perché non appare un’idea trattabile comunque.
Il nostro consiglio è: NON MOLLARE
Il problema fondamentale con quelle regole è che esse performano troppo bene sui dati storici. Ogni regola che aggiungi riduce meccanicamente l’errore di previsione che stai misurando sui dati storici. Se aggiungi abbastanza regole, finisci per avere un apparente errore di previsione quasi nullo. Eppure, l’errore empirico che misuri sui dati storici è un artefatto del processo utilizzato per costruire le regole in primo luogo. Zero errore di previsione sui dati storici non si traduce in zero errore di previsione per le promozioni future. Anzi, al contrario, tali modelli tendono a performare molto male sulle promozioni future.
Anche se ottimizzare per i dati che non possiedi è difficile, la teoria dell’apprendimento statistico offre sia una comprensione teorica che soluzioni pratiche a questo problema. L’idea centrale consiste nell’introdurre la nozione di minimizzazione del rischio strutturale che equilibra l’errore empirico.
Questo verrà discusso in un post successivo, restate sintonizzati.
(Plug senza vergogna) Molte di queste soluzioni moderne, ossia modelli matematici che si preoccupano dell’overfitting, sono state implementate da Lokad, in modo che tu non debba assumere un team di esperti per beneficiarne.
Commenti dei lettori (1)
Gestire i dati del segnale della domanda presenta gli stessi problemi che i dati in tempo reale causano in qualsiasi settore: come accedere e integrare grandi volumi di dati, e successivamente combinarli e analizzarli insieme alle informazioni storiche.
Business Opportunities (9 anni fa)