Modelli di Previsione Preferiti
Che tipo di modelli di previsione usate internamente? Questa è una domanda posta frequentemente sia dai clienti che dai partner di Lokad.
Rispondere a questa domanda è complicato per noi per due ragioni:
- La nostra tecnologia è un patrimonio fondamentale. Pertanto, non abbiamo alcuna intenzione di svelare tutti i dettagli (anche se non siamo completamente riservati).
- La nostra tecnologia è complessa. Utilizziamo molti modelli, e un componente fondamentale è proprio la selezione dei modelli.
Quindi, invece di fornire l’elenco esatto dei modelli utilizzati da Lokad, elencherò la mia personale lista di modelli preferiti. Non sostengo che questi modelli rappresentino l’intero insieme dei modelli utilizzati da Lokad né che tutti questi modelli siano effettivamente in produzione presso Lokad; tuttavia, dovrebbero darti qualche intuizione su ciò che facciamo a Lokad.
Prima ci sono i classici intramontabili: autoregressivi, medie mobili, (doppia, tripla) smorzatura esponenziale, Box-Jenkins, Holt-Winters, ARMA, ARIMA … Questi modelli tipicamente non gestiscono né serie multiple né tag o eventi; tuttavia, la semplicità è sovrana in molte situazioni. Non scartare le medie mobili solo perché sembrano troppo semplici per essere efficaci.
Poi, per modelli più avanzati, preferisco parlare di approcci piuttosto che di modelli. Infatti, più il modello è complesso, maggiore è la libertà concessa al matematico di modificare in modi sottili il comportamento del modello di previsione.
L’approccio bayesiano: stabilire grafi di relazioni è particolarmente utile nel contesto di Lokad, dove sfruttiamo le correlazioni tra le serie temporali. È inoltre utile per gestire tag e eventi.
L’approccio a vasto margine: le Support Vector Machines (SVM) sono diventate incredibilmente popolari in questi giorni. Anche se, per quanto riguarda le serie temporali, è piuttosto la Support Vector Regression (SVR) ad essere la più utile per noi. Come piccolo svantaggio, SVM e SVR sono tipicamente piuttosto costose in termini di potenza di calcolo grezza.
L’approccio a miscela / boosting: combinare un gran numero di predittori semplici per migliorare la previsione complessiva funziona bene. La combinazione di un gran numero di predittori semplici può essere utilizzata per riflettere comportamenti davvero complessi.
L’approccio metaeuristico: algoritmi genetici, reti neurali, programmazione genetica e altri approcci evolutivi / adattivi. Questi approcci sono potenti ma anche notoriamente conosciuti per la loro intrinseca sensibilità a molti parametri di tuning.
In chiusura, la nostra tecnologia è ancora in rapida evoluzione. Nuovi modelli vengono messi in produzione ogni mese più o meno. Questa lista non è definitiva e il cloud computing sta effettivamente creando molte opportunità per spingere modelli che in passato erano semplicemente troppo costosi.