Dopo il nostro importante aggiornamento Tags+Events dello scorso autunno, abbiamo lavorato attivamente sulle previsioni di promozione nel settore del retail. Ora abbiamo migliaia di eventi promozionali nei nostri database; e l’analisi di questi eventi ci ha portato a risultati molto interessanti.

Inoltre, non sorprende che abbiamo scoperto che:

  • le previsioni di promozione effettuate manualmente dagli operatori comportano in media errori di previsione superiori al 60%. I risultati possono variare, ma gli errori di previsione delle vendite tipici nel settore del retail sono solitamente più vicini al 20%.
  • l’inclusione dei dati sulla promozione tramite tag ed eventi riduce l’errore di previsione medio di circa il 50%. Anche in questo caso, i risultati possono variare a seconda della quantità di dati che si hanno sugli eventi promozionali.

Come risultato meno intuitivo, abbiamo anche scoperto che i metodi basati su regole e i metodi lineari, sebbene ampiamente pubblicizzati da alcuni esperti e alcuni strumenti software, sono molto deboli contro l’overfitting, e possono distorcere la valutazione dell’errore di previsione, portando a una falsa impressione di prestazioni nella previsione delle promozioni.

Inoltre, si noti che questo miglioramento del 50% è stato ottenuto di solito con una quantità di informazioni piuttosto limitata, di solito non più di 2 o 3 descrittori binari per promozione.

Anche i dati grezzi sulle tue promozioni portano a significativi miglioramenti delle previsioni, che si traducono in significativi risparmi di capitale di lavoro.

Il primo passo per migliorare le previsioni di promozione consiste nel raccogliere dati accurati sulla promozione. Dalla nostra esperienza, questo passo è il più difficile e il più costoso. Se non si dispone di registrazioni accurate delle proprie promozioni, allora c’è poco speranza di ottenere previsioni accurate. Come si dice, Spazzatura dentro, Spazzatura fuori.

Tuttavia, abbiamo notato che anche un singolo descrittore di promozione, una variabile binaria che indica semplicemente se l’articolo è attualmente in promozione o meno, può portare a un significativo miglioramento delle previsioni. Pertanto, anche se i tuoi dati devono essere accurati, non è necessario che siano dettagliati per migliorare le tue previsioni.

Pertanto, ti consigliamo di tenere traccia con precisione dei tempi delle tue promozioni: quando è iniziata? quando è finita? Si noti che per il commercio elettronico, l’esposizione in prima pagina spesso ha un effetto paragonabile a una promozione del prodotto, quindi è necessario tenere traccia dell’evoluzione della tua pagina principale.

Inoltre, la descrizione dell’articolo conta. Infatti, dalla nostra esperienza, anche gli articoli più frequentemente promossi non avranno più di una dozzina di promozioni nella loro vita commerciale. In media, la quantità di promozioni passate conosciute per un determinato articolo è ridicolmente bassa, variando da zero a una promozione passata in media. Di conseguenza, non puoi aspettarti risultati affidabili concentrandoti sulle promozioni passate di un singolo prodotto alla volta, perché nella maggior parte dei casi non ce ne sono.

Quindi, invece, devi concentrarti sugli articoli che assomigliano all’articolo che stai pianificando di promuovere. Con Lokad, puoi farlo associando tag alle tue vendite. Tipicamente, i rivenditori utilizzano una gerarchia per organizzare il loro catalogo. Pensa a una gerarchia di articoli con famiglie, sottofamiglie, articoli, varianti, ecc.

Tradurre un catalogo gerarchico in tag può essere fatto abbastanza semplicemente seguendo il processo illustrato di seguito per un rivenditore fittizio di caramelle:

I tag associati alla cronologia delle vendite delle lecca-lecca al limone di media grandezza sarebbero LOLLIPOPS, LEMON, MEDIUM

Questo processo creerà tipicamente da 2 a 6 tag per articolo nel tuo catalogo, a seconda della complessità del catalogo.

Abbiamo detto che anche informazioni molto limitate sulle tue promozioni potrebbero essere utilizzate per migliorare immediatamente le tue previsioni di vendita. Tuttavia, informazioni più dettagliate sulla promozione migliorano chiaramente l’accuratezza delle previsioni.

Abbiamo scoperto che due elementi sono molto preziosi per migliorare l’accuratezza delle previsioni:

  • il meccanismo che descrive la natura dello sconto offerto ai tuoi clienti. I meccanismi tipici sono lo sconto fisso (es. -20%), ma ci sono molti altri meccanismi come la spedizione gratuita o lo sconto per quantità maggiori (es: acquista uno e ottieni uno gratis).
  • la comunicazione che descrive come i tuoi clienti vengono informati dell’evento promozionale. Tipicamente, la comunicazione include operazioni di marketing come la radio, i giornali o gli annunci locali, ma anche l’imballaggio personalizzato (se presente) e la visibilità degli articoli promossi all’interno del punto vendita.

Nel caso di reti di distribuzione più ampie, dovrebbe essere descritta anche la disponibilità complessiva della promozione se gli articoli non vengono promossi ovunque. Questa situazione si verifica tipicamente se i responsabili dei punti vendita possono escludersi dalle operazioni promozionali.

Parlando con professionisti, abbiamo scoperto che molti rivenditori si aspettano che Lokad produca un insieme di regole; e queste regole sono destinate a spiegare promozioni come

SE TV_ADS E PERCENT25_DISCOUNT 
ALLORA PROMO_SALES = 5 * REGULAR_SALES;

Fondamentalmente, queste regole attese seguono sempre più o meno gli stessi schemi:

  • Un insieme di condizioni binarie che definisce l’ambito della regola.
  • Un insieme di coefficienti lineari per stimare l’effetto della regola.

Abbiamo scoperto che molti strumenti presenti sul mercato del software sono disponibili per aiutarti a scoprire queste regole nei tuoi dati; il che, apparentemente, ha portato molte persone a credere che questo approccio fosse l’unico disponibile.

Tuttavia, secondo i nostri esperimenti, i metodi basati su regole sono ben lontani dall’essere ottimali. Peggio ancora, queste regole sono molto deboli contro l’overfitting. Questa debolezza porta spesso a situazioni dolorose in cui c’è una differenza significativa tra l’accuratezza delle previsioni stimata e l’accuratezza delle previsioni reale.

L’overfitting è un fenomeno molto sottile eppure molto importante nella previsione statistica. Fondamentalmente, il problema centrale nella previsione è che si desidera costruire un modello che sia molto accurato rispetto ai dati che non si hanno.

In particolare, la teoria statistica indica che è possibile costruire modelli che si rivelano molto accurati quando applicati ai dati storici e tuttavia molto inaccurati per prevedere il futuro. Il problema è che, nella pratica, se non si pensa attentamente al problema dell’overfitting in anticipo, costruire un tale modello non è una semplice possibilità, ma il risultato più probabile del processo.

Pertanto, è davvero necessario ottimizzare il modello rispetto ai dati che non si hanno. Tuttavia, questo problema sembra un completo paradosso, perché, per definizione, non si può misurare nulla se non si hanno i dati corrispondenti. E abbiamo scoperto che molti professionisti hanno rinunciato a questo problema, perché non sembra un modo praticabile di pensare.

Il nostro consiglio è: NON ARRENDERTI

Il problema principale di queste regole è che si comportano molto bene sui dati storici. Ogni regola che si aggiunge riduce meccanicamente l’errore di previsione che si sta misurando sui dati storici. Se si aggiungono abbastanza regole, si arriva a un errore di previsione apparentemente vicino allo zero. Tuttavia, l’errore empirico che si misura sui dati storici è un artefatto del processo utilizzato per costruire le regole in primo luogo. Un errore di previsione zero sui dati storici non si traduce in un errore di previsione zero sulle promozioni future. Anzi, tali modelli tendono a comportarsi molto male sulle promozioni future.

Anche se, ottimizzare per i dati che non si hanno è difficile, la teoria dell’apprendimento statistico offre sia una comprensione teorica che soluzioni pratiche a questo problema. L’idea centrale consiste nell’introdurre la nozione di minimizzazione del rischio strutturale che bilancia l’errore empirico.

Questo sarà discusso in un post successivo, rimanete sintonizzati.

(Pubblicità sfacciata) Moltissime di queste soluzioni moderne, ovvero modelli matematici che si preoccupano dell’overfitting, sono state implementate da Lokad, in modo che non sia necessario assumere un team di esperti per trarne vantaggio.


Commenti dei lettori (1)

Gestire i dati dei segnali di domanda presenta gli stessi problemi che i dati in tempo reale causano in qualsiasi settore: come accedere e integrare grandi volumi di dati, e poi combinarli e analizzarli insieme alle informazioni storiche. 9 anni fa | Opportunità di business