Offuscamento dei dati (catena logistica)

L'offuscamento è un metodo che consente di rimuovere da un set di dati tutte le informazioni sensibili (solitamente private), pur preservando i pattern di comportamento statistici rilevanti per un dato compito, ad esempio l'ottimizzazione della catena logistica.

Le serie temporali contengono a volte dati molto sensibili. Probabilmente qualcuno si chiederà persino se non sia affrettato affidare dati così delicati a una terza parte che opera online come Lokad. Siamo d'accordo: la sensibilità dei dati è un problema, ma possiamo risolverlo facilmente.

Per proteggere i dati più sensibili, possiamo ricorrere al cosiddetto offuscamento. L'offuscamento si basa su un principio semplice: senza le corrette informazioni contestuali, le serie temporali e i dati che contengono diventano illeggibili. Senza una descrizione dei dati (cosa misura questa serie temporale?) e una unità di misura (come sono misurate le serie temporali?), una serie temporale si riduce a una mera lista di numeri senza senso. Offuscando i dati, è possibile rendere illeggibili sia le descrizioni, sia le unità di misura delle serie archiviate all'interno di un account Lokad.

Offuscare i dati è semplice: basta scegliere nomi arbitrari per le serie temporali, come T1, T2, T3, ...

Lokad offre anche la possibilità di applicare alle serie temporali tag ed eventi. Questi metadati possono essere offuscati allo stesso modo. I tag leggibili da un essere umano devono essere sostituiti con identificativi. Lokad segue un approccio puramente statistico, per cui questo tipo di sostituzione non ha alcun effetto sui risultati delle previsioni.

Seguendo queste linee guida, neanche i competitor più agguerriti potranno accedere ai dati su un account Lokad: se le serie temporali non vengono descritte, e se non si forniscono numeri chiave come le unità di misura, nessuno potrà mai decodificare i dati.

Ricordiamo che l'offuscamento non intralcia le operazioni di previsione da parte di Lokad, che seguono un metodo puramente statistico. I nomi delle serie temporali sono necessari per comodità dell'utente, ma non hanno alcun ruolo nell'elaborazione delle previsioni.