Che tipo di modelli di previsione state utilizzando internamente? Questa è una domanda che ci viene posta frequentemente sia dai clienti che dai partner di Lokad.

Rispondere a questa domanda è complicato per noi per due ragioni:

  • La nostra tecnologia è un asset fondamentale. Pertanto, non abbiamo intenzione di divulgare tutti i dettagli (anche se non siamo completamente segreti).
  • La nostra tecnologia è complessa. Utilizziamo molti modelli e un componente fondamentale è proprio la selezione del modello.

Pertanto, anziché fornire l’elenco esatto dei modelli utilizzati da Lokad, elencherò la mia personale lista di modelli preferiti. Non affermo che questi modelli rappresentino l’elenco completo dei modelli utilizzati da Lokad né che tutti questi modelli siano effettivamente utilizzati in produzione da Lokad; tuttavia, dovrebbero fornire alcune informazioni su ciò che facciamo in Lokad.

Innanzitutto ci sono i classici modelli di previsione: autoregressivo, media mobile, (doppia, tripla) media esponenziale, Box-Jenkins, Holt-Winters, ARMA, ARIMA … Questi modelli di solito non gestiscono né serie multiple né tag o eventi; tuttavia, la semplicità è fondamentale in molte situazioni. Non scartare la media mobile solo perché sembra troppo semplice per essere buona.

Poi, per modelli più avanzati, preferisco parlare di approcci piuttosto che di modelli. Infatti, più complesso è il modello, più libertà viene lasciata al matematico per regolare in modo sottile il comportamento del modello di previsione.

L’approccio bayesiano: stabilire grafi di relazioni è particolarmente utile nel contesto di Lokad, dove sfruttiamo le correlazioni tra serie temporali. È anche utile per gestire tag ed eventi.

L’approccio del margine vasto: le Support Vector Machines (SVM) sono diventate incredibilmente popolari in questi giorni. Tuttavia, per quanto riguarda le serie temporali, è piuttosto la Support Vector Regression (SVR) che è più utile per noi. Come piccolo svantaggio, SVM e SVR sono tipicamente abbastanza costose in termini di potenza di elaborazione grezza.

L’approccio di miscelazione / potenziamento: mescolare molti semplici predittori per migliorare la previsione complessiva funziona bene. La combinazione di un gran numero di semplici predittori può essere utilizzata per riflettere comportamenti davvero complessi.

L’approccio meta-euristico: algoritmo genetico, reti neurali, programmazione genetica e altri approcci evolutivi / adattivi. Questi approcci sono potenti, ma sono anche notoriamente noti per la loro sensibilità intrinseca a molti parametri di tuning.

Come nota finale, la nostra tecnologia è ancora in rapida evoluzione. Nuovi modelli vengono messi in produzione ogni mese circa. Questo elenco non è definitivo e il cloud computing sta creando molte opportunità per noi di utilizzare modelli che erano semplicemente troppo costosi in passato.