La previsione statistica è una scienza controintuitiva. Questo è stato già detto in passato, ma vogliamo sottolineare nuovamente questo punto.

Spesso, le persone ci chiedono supporto perché hanno appena caricato dei dati su Lokad e le previsioni che ottengono sono piatte. In altre parole, i valori previsti sono costanti per tutti i passi futuri. Ad esempio, valori di vendita costanti per i prossimi 6 mesi, se stiamo considerando previsioni mensili delle vendite a 6 mesi di distanza.

È perfettamente chiaro, però, che non c’è possibilità che le vendite aziendali siano perfettamente piatte per i prossimi 6 mesi, quindi perché Lokad continua a produrre risultati così insignificanti?

Beh, sappiamo con certezza che l’attività aziendale cambierà (almeno un po’) nei prossimi sei mesi. Non ci sono dubbi al riguardo. Tuttavia, il problema è: come possiamo produrre una previsione il più vicina possibile a quei futuri cambiamenti? Se prendiamo la strada statistica, allora abbiamo bisogno di un modello statistico per le previsioni.

Il problema è che abbiamo bisogno di un modello di previsione buono; e la regola cardinale della previsione statistica è che più complesso è il modello, più dati sono necessari affinché il modello sia affidabile. I modelli che producono previsioni distinte per ogni passo futuro sono decisamente più complessi di quelli che producono lo stesso valore per tutti i passi futuri.

Al contrario, possiamo anche dire che quei modelli più complessi sono anche meno affidabili su set di dati limitati, il che significa che usarli è molto probabile che diminuisca l’accuratezza complessiva delle previsioni in determinate situazioni.

Tornando alla situazione in cui le persone si lamentano delle previsioni piatte, di solito sta semplicemente accadendo che i dati appena caricati sono o molto brevi (come solo 3 mesi di storico mensile) o molto sparsi (come un eCommerce con solo poche vendite per ogni prodotto). In queste situazioni, Lokad spesso opta per previsioni piatte.

Non è un difetto, è una funzionalità per migliorare l’accuratezza.


Commenti dei lettori (6)

Ciao Johan, la rappresentazione efficiente delle serie temporali nei database relazionali è un’operazione piuttosto complicata. In breve, dipende molto dalla lunghezza delle serie temporali che stai considerando. Dubito che esista uno “standard del settore” in questa area. Allo stesso modo, per il codice sorgente stesso, tutto dipende molto dalla lunghezza e dal numero di serie temporali prese in considerazione. Spero che ti sia utile. 7 anni fa | Joannes Vermorel


Stiamo lavorando a un progetto sulle serie temporali con una definizione tipica delle serie temporali e delle osservazioni associate. Puoi aiutarci con quanto segue:

  1. Hai una struttura standard del settore per la definizione delle serie temporali e le relative osservazioni dal punto di vista del design del database?
  2. Quali sono le migliori pratiche per il codice che rappresenta una serie temporale, ad esempio [Livello 1].[Livello 2].[Numero di sequenza].[Versione]. Qualsiasi guida e assistenza sarà apprezzata. 7 anni fa | Johan Strydom

Ciao Izi, è un pensiero interessante :-) Ho pensato a questo tipo di “attacco” fin dall’inizio, anche se non è ampiamente pubblicizzato sul nostro sito web. Fondamentalmente, per farlo avresti bisogno di conoscere molto precisamente i dati che il tuo obiettivo sta inviando a Lokad. Inoltre, devi conoscere molto precisamente il tipo di correlazioni che stiamo analizzando. Semplici spostamenti delle serie temporali non sono “naturali” nei dati aziendali reali. Infine, ti costerebbe qualche soldo poiché non ci fidiamo dei dati degli utenti non paganti. Per quanto riguarda le nostre tecniche, utilizziamo una complessa combinazione di molti modelli, che include anche classici ben noti. Questo argomento è ovviamente un po’ delicato per noi, ma cercherò di pubblicare una panoramica non troppo dettagliata in seguito. Inoltre, va notato che è ancora in rapida evoluzione. 9 anni fa | Joannes Vermorel


Quindi, se carico dati errati, accuratamente elaborati per correlare a un fornitore / partner che so utilizza il tuo prodotto, posso rovinare i suoi risultati? È interessante e sembra piuttosto facile da fare! In caso contrario, sarebbe bello saperne di più sulle tecniche che usi (ad esempio ARIMA, ANN, ecc.). 9 anni fa | Izi


Ciao Stephen, Ottimo punto. Il problema principale qui è che l’utente potrebbe volere non solo le previsioni stesse, ma anche la loro giustificazione o, almeno, un commento. In futuro, probabilmente cercheremo di migliorare le app client di Lokad con linee guida automatizzate, che “commenteranno” le previsioni fornite da Lokad. 9 anni fa | Joannes Vermorel


Ciao Joannes, pensi che questo sia un feedback utile per descrivere le aspettative dell’utente? Potenzialmente potresti limitare l’utente a eseguire solo un compito di previsione per alcuni mesi, diciamo 3, e se ne supera di più, gli verrà data un’avvertenza sull’effetto sulla precisione delle previsioni. Immagino che potrebbe dipendere anche dalla disponibilità dei dati storici, quindi forse ci sarebbe un modo per correlare i due, non sono sicuro. Inoltre, penso che dal punto di vista degli utenti, anche se potrebbe essere più corretto restituire loro una previsione piatta, potrebbero essere notificati in qualche modo su questo caso e/o avere la possibilità di accettarlo o accettare un risultato più ingenuo? 9 anni fa | Stephen