Revisione di TigerGraph, piattaforma avanzata di analisi dei grafi

Di Léon Levinas-Ménard

Ultimo aggiornamento: aprile, 2025

TigerGraph è una società software privata fondata nel 2012 dal Dr. Yu Xu a Redwood City, California, che offre una piattaforma di analisi dei grafi in tempo reale costruita su un’architettura grafica parallela nativa. Progettata per elaborare enormi set di dati connessi, TigerGraph consente alle organizzazioni di eseguire query complesse a più passaggi e analisi avanzate – con applicazioni che spaziano dal rilevamento delle frodi, al contrasto del riciclaggio di denaro, all’analisi customer 360, alla supply chain visibility e alla cybersecurity¹². La sua piattaforma è sviluppata in C++ e sfrutta un linguaggio di query proprietario Turing-completo, chiamato GSQL, per consentire sia interrogazioni ad hoc sia l’integrazione della data science grafica direttamente nel database. Combinando una compressione dati efficiente con un modello di elaborazione massivamente parallelo che opera su vertici e spigoli, TigerGraph supporta l’ingestione dei dati ad alta velocità (fino a 100 GB/ora/nodo in configurazioni ideali) e opzioni di distribuzione scalabili sia in ambienti self-managed che nella sua offerta cloud-native “Savanna” su AWS, GCP e Azure³⁴⁵. Inoltre, l’integrazione di una Graph Data Science Library e di un assistente AI — TigerGraph CoPilot — collega tecniche avanzate di machine learning a query grafiche intuitive, trasformando relazioni complesse direttamente in approfondimenti azionabili sia per tecnici che per dirigenti supply chain.

Storia e Finanziamenti

TigerGraph fu fondata nel 2012 (inizialmente lanciata come GraphSQL) e rebrandizzata nel 2017. L’azienda ha attratto un significativo capitale di rischio nel corso degli anni – emergendo dall’ombra con 33 milioni di dollari di finanziamento iniziale e successivamente chiudendo un notevole round di Serie C da 105 milioni di dollari nel febbraio 2021, portando il finanziamento complessivo a oltre 170 milioni di dollari¹². Piuttosto che perseguire una strategia di acquisizioni, TigerGraph si è concentrata sull’innovazione continua del prodotto e sull’espansione della propria presenza sul mercato.

Tecnologia e Architettura di Base

La base tecnica di TigerGraph si concentra sulla sua architettura Native Parallel Graph (NPG):

Motore Nativo e Implementazione: Il motore principale è stato costruito da zero in C++ utilizzando avanzate tecniche di programmazione di sistema. Comprende un Graph Storage Engine (GSE) e un Graph Processing Engine (GPE) progettati per collocare insieme calcolo e dati, sfruttando così la località dei dati per un’elaborazione efficiente³⁶.
Linguaggio di Query – GSQL: TigerGraph utilizza il suo linguaggio proprietario, simile a SQL, GSQL, che è Turing-completo e supporta costrutti procedurali come cicli e condizionali. Questo non solo facilita le query ad hoc, ma consente anche la creazione di librerie di data science grafica integrate nel database¹.
Compressione dei Dati e Parallelismo: La piattaforma presenta una compressione dati proprietaria che spesso riduce drasticamente i requisiti di archiviazione, mentre il suo modello di elaborazione massivamente parallelo tratta ogni vertice e spigolo come unità di calcolo, ottimizzando così l’esecuzione degli algoritmi sui grafi su ampi set di dati⁴.

Offerta di Prodotti e Casi d’Uso

TigerGraph viene commercializzato per l’analisi in tempo reale in una vasta gamma di ambiti applicativi:

Applicazioni Chiave: La piattaforma è utilizzata in settori quali il rilevamento delle frodi, il contrasto al riciclaggio di denaro (AML), l’analisi customer 360, la supply chain visibility, la cybersecurity e l’analisi delle reti. La sua capacità di eseguire query multi-hop – spesso attraversando 10 o più passaggi – consente alle organizzazioni di scoprire relazioni non ovvie nei loro dati¹².
Integrazione di AI e Machine Learning: TigerGraph si integra con l’intelligenza artificiale attraverso la sua Graph Data Science Library integrata nel database, che offre oltre 50 algoritmi per grafi, inclusi clustering, centralità, similarità e flusso. Inoltre, la funzione TigerGraph CoPilot funge da assistente AI che traduce richieste in linguaggio naturale in query grafiche, democratizzando così l’accesso a un’analisi avanzata dei grafi per utenti non esperti⁷⁸.

Distribuzione e Scalabilità

TigerGraph supporta diversi modelli di distribuzione per soddisfare le diverse esigenze aziendali:

Opzioni Self-Managed e Cloud-Native: La piattaforma può essere distribuita su server Linux, all’interno di contenitori Docker, o tramite Kubernetes per ambienti self-managed. Per la distribuzione in cloud, l’offerta Savanna fornisce una soluzione di database grafico completamente distribuita e cloud-native disponibile sui principali provider di cloud come AWS, GCP e Azure⁵.
Caratteristiche Operative: TigerGraph enfatizza funzionalità come il partizionamento automatico, l’espansione/compressione elastica del cluster e il caricamento dati ottimizzato, vantando velocità di ingestione dei dati fino a 100 GB per ora per nodo. Queste capacità lo posizionano come una soluzione scalabile per imprese che gestiscono dati grafici su vasta scala, sebbene tali metriche di prestazione siano meglio verificate in modo indipendente⁴⁵.

Integrazione con AI e Graph Data Science

TigerGraph collega l’analisi dei grafi con l’intelligenza artificiale:

Graph Data Science Library: Questa suite integrata nel database contiene un’ampia gamma di algoritmi che convertono complesse relazioni grafiche in funzionalità per il machine learning, supportando compiti quali clustering, analisi della centralità e rilevamento della similarità⁷.
TigerGraph CoPilot: Progettato come assistente AI, CoPilot sfrutta l’AI generativa e l’elaborazione del linguaggio naturale per permettere agli utenti di ottenere approfondimenti dai dati dei grafi senza richiedere una profonda competenza tecnica, facilitando così l’integrazione dell’analisi dei grafi nelle tradizionali pipeline di data science⁸.

Scetticismo Tecnico e Considerazioni Critiche

Sebbene TigerGraph faccia ampie affermazioni tecniche, è necessaria una valutazione critica:

Metriche di Benchmark: Affermazioni come risposte alle query in meno di un secondo su decine di milioni di record e alti tassi di ingestione dovrebbero essere valutate nel contesto, poiché tali metriche dipendono spesso da specifiche configurazioni hardware e condizioni di carico⁹.
Innovazioni Proprietarie: La compressione dei dati proprietaria e i metodi di elaborazione parallela, pur promettenti, possono produrre benefici variabili in ambienti reali. Il benchmarking indipendente è essenziale per verificare tali miglioramenti prestazionali.
Complessità e Curva di Apprendimento: Le funzionalità avanzate di GSQL, pur essendo potenti, possono rappresentare una curva di apprendimento ripida per i nuovi utenti, e l’adozione con successo dipenderà dalla capacità dell’organizzazione di integrare gli strumenti sofisticati di TigerGraph nei flussi di lavoro esistenti.

TigerGraph vs Lokad

Anche se sia TigerGraph che Lokad sfruttano calcolo e analisi avanzate, le loro aree di focalizzazione principali sono notevolmente diverse. TigerGraph è una piattaforma nativa di analisi dei grafi costruita attorno a un motore di elaborazione parallelo guidato da C++ ottimizzato per l’esplorazione di dati connessi attraverso query multi-hop e algoritmi sui grafi. Al contrario, Lokad è dedicata all’ottimizzazione predittiva della supply chain tramite un modello SaaS, utilizzando il suo Envision DSL proprietario (sviluppato con F#, C# e TypeScript) per generare previsioni probabilistiche e decisioni attuabili per la gestione degli inventari, la determinazione dei prezzi e la pianificazione della produzione. Mentre TigerGraph enfatizza la data science dei grafi in tempo reale e approfondimenti guidati dall’intelligenza artificiale (con funzionalità quali GSQL e CoPilot), Lokad si concentra sull’automatizzazione e l’ottimizzazione delle operazioni supply chain. I modelli di distribuzione distinguono ulteriormente le due soluzioni: TigerGraph offre opzioni sia self-managed che cloud-native, mentre Lokad è esclusivamente un servizio cloud multi-tenant. In sostanza, le organizzazioni che cercano di sfruttare una profonda connettività dei dati e analisi di relazioni complesse per applicazioni diverse — inclusa la supply chain visibility — potrebbero rivolgersi a TigerGraph, mentre coloro che mirano all’automazione end-to-end delle decisioni sulla supply chain troveranno l’approccio specifico di Lokad più in linea con le loro esigenze.

Conclusione

TigerGraph offre una piattaforma robusta e all’avanguardia per l’analisi dei grafi, che fonde l’elaborazione parallela nativa con capacità AI integrate per affrontare le complesse sfide della connettività dei dati. La sua architettura scalabile, le opzioni di distribuzione flessibili e il linguaggio di query avanzato consentono alle organizzazioni di estrarre approfondimenti azionabili da vasti set di dati interconnessi. Tuttavia, come accade con qualsiasi sistema ad alte prestazioni, gli utenti potenziali dovrebbero valutare criticamente le affermazioni sulle prestazioni, considerare la curva di apprendimento associata agli strumenti proprietari e verificare che le sue capacità siano in linea con la loro infrastruttura tecnica esistente. In confronto a piattaforme focalizzate sulla supply chain come Lokad, TigerGraph offre un approccio distinto basato sulla graph data science piuttosto che sull’ottimizzazione end-to-end della supply chain.