La parola previsione copre un ampio spettro di processi, tecnologie e persino mercati. In passato, abbiamo introdotto i mondi del software di previsione, distinguendo tra:

Lokad rientra nell’ultima categoria poiché la nostra tecnologia è puramente statistica. Tuttavia, Lokad è lontano dall’essere in grado di coprire l’intero spettro statistico da solo. Esistono due ampie categorie di previsioni nella previsione statistica (*):

  • Previsioni di classificazione
  • Previsioni di regressione

(*) Semplifichiamo eccessivamente qui per una questione di chiarezza, poiché le sottigliezze dell’apprendimento statistico vanno ben oltre lo scopo di questo modesto post del blog.

La classificazione cerca di separare (o classificare) gli oggetti in base alle loro proprietà. L’illustrazione sottostante di Tomasz Malisiewicz mostra un compito di classificazione che cerca di separare le immagini che raffigurano una sedia dalle immagini che raffigurano un tavolo.

Illustrazione dal blog di tombone

L’output di una classificazione è binario (o piuttosto discreto): gli oggetti vengono assegnati a classi con maggiore o minore confidenza, cioè probabilità più alte o più basse.

D’altra parte, le regressioni producono tipicamente curve. L’illustrazione sottostante considera una serie temporale che rappresenta le vendite storiche e mostra la previsione corrispondente.

La previsione di regressione è una curva anziché un’impostazione binaria (o combinazione di binari). Gli input vengono prolungati nel futuro.

Come influisce questa distinzione sul business?

Beh, si scopre che Lokad - come si presenta all’inizio del 2010 - fornisce solo previsioni di regressione. Pertanto, ci sono molti problemi interessanti che non possono essere affrontati da Lokad perché si tratta di problemi di classificazione:

  • Segmentazione dei clienti: per ogni cliente, vorremmo valutare la probabilità di ottenere un’azione di up-sale di successo attraverso un’azione di marketing diretto. Seguendo la stessa idea, potremmo cercare di prevedere anche il churn.
  • Rilevamento delle frodi: per ogni transazione, vorremmo valutare - in base al modello di transazione - la probabilità che l’operazione sia un tentativo di frode.
  • Prioritizzazione delle offerte: in base alle proprietà del potenziale cliente (disponibilità di budget, settore, rango di contatto nell’azienda, livello di interesse espresso, …), vorremmo valutare la probabilità di ottenere un’affare redditizio da ciascun potenziale cliente per prioritizzare gli sforzi del team di vendita.

Spesso ci viene chiesto se Lokad potrebbe fornire anche previsioni di classificazione. Purtroppo, la risposta sarà negativa per il momento. Sebbene siano radicate nella stessa teoria matematica, la classificazione e la regressione comportano tecnologie molto diverse; e Lokad sta concentrando tutti i suoi sforzi sui problemi di regressione.

Tuttavia, non siamo disinteressati ai problemi di classificazione, meritano davvero attenzione e sforzi. Per il 2010, ci atteniamo alla nostra roadmap, ma in futuro la classificazione potrebbe essere un’estensione naturale dei nostri servizi di previsione.