Analyse de TigerGraph, plateforme d'analyse de graphes avancée

Par Léon Levinas-Ménard
Dernière mise à jour: April, 2025

Retour à Étude de marché

TigerGraph est une entreprise privée de logiciels fondée en 2012 par le Dr. Yu Xu à Redwood City, Californie, qui propose une plateforme d’analyse de graphes en temps réel construite sur une architecture de graphes parallèle native. Conçue pour traiter d’énormes ensembles de données connectées, TigerGraph permet aux organisations d’exécuter des requêtes complexes à plusieurs sauts et des analyses avancées – avec des applications allant de la détection de fraude, la lutte contre le blanchiment d’argent, l’analyse customer 360, la supply chain visibility et la cybersécurité12. Sa plateforme est conçue en C++ et exploite un langage de requête propriétaire, Turing-complet, appelé GSQL pour permettre à la fois des requêtes ad hoc et l’intégration de la data science de graphes directement dans la base de données. Combinant une compression de données efficace à un modèle de traitement massivement parallèle sur les sommets et les arêtes, TigerGraph prend en charge une ingestion de données à grande vitesse (jusqu’à 100 GB/hour/node dans des configurations idéales) et des options de déploiement évolutives pour des environnements autogérés ainsi que son offre cloud-native “Savanna” sur AWS, GCP et Azure345. De plus, l’intégration d’une Graph Data Science Library et de l’assistant IA—TigerGraph CoPilot—relie des techniques avancées de machine learning à une interrogation de graphes intuitive, transformant des relations complexes directement en informations exploitables pour les cadres techniques et supply chain.

Historique et Financement

TigerGraph a été créée en 2012 (initialement lancée sous le nom de GraphSQL) et a été rebrandée en 2017. L’entreprise a attiré d’importants capitaux de risque au fil des ans – sortant de l’ombre avec un financement initial de 33 millions de dollars et concluant par la suite une levée de fonds notable de 105 millions de dollars lors d’un tour de série C en février 2021, portant son financement cumulé à plus de 170 millions de dollars12. Plutôt que de poursuivre une stratégie d’acquisition, TigerGraph s’est concentrée sur l’innovation continue de ses produits et l’expansion de sa portée sur le marché.

Technologie de Base et Architecture

La fondation technique de TigerGraph repose sur son architecture Native Parallel Graph (NPG):

  • Moteur natif et implémentation : Le moteur de base a été construit de zéro en C++ en utilisant des techniques avancées de programmation système. Il comprend un Graph Storage Engine (GSE) et un Graph Processing Engine (GPE) conçus pour rapprocher le calcul des données, exploitant ainsi la localité des données pour un traitement efficace36.
  • Langage de requête – GSQL : TigerGraph utilise son langage propriétaire, semblable à SQL, GSQL, qui est Turing-complet et supporte des constructions procédurales telles que les boucles et les conditionnels. Cela facilite non seulement les requêtes ad hoc, mais permet également la création de bibliothèques de data science de graphes intégrées à la base de données1.
  • Compression de données et parallélisme : La plateforme propose une compression de données propriétaire qui réduit souvent drastiquement les besoins en stockage, tandis que son modèle de traitement massivement parallèle considère chaque sommet et chaque arête comme une unité de calcul, optimisant ainsi l’exécution des algorithmes de graphes sur de vastes ensembles de données4.

Offre de produits et cas d’utilisation

TigerGraph est commercialisé pour l’analyse en temps réel dans divers domaines d’application:

  • Applications Clés : La plateforme est utilisée dans des domaines tels que la détection de fraude, la lutte contre le blanchiment d’argent (AML), l’analyse customer 360, la supply chain visibility, la cybersécurité et l’analyse de réseaux. Sa capacité à exécuter des requêtes multi-sauts — souvent parcourant 10 sauts ou plus — permet aux organisations de découvrir des relations non évidentes dans leurs données12.
  • Intégration de l’IA et du Machine Learning : TigerGraph s’intègre à l’IA via sa Graph Data Science Library intégrée à la base de données, qui propose plus de 50 algorithmes de graphes, incluant le clustering, la centralité, la similarité et le flux. De plus, sa fonctionnalité TigerGraph CoPilot agit comme un assistant IA qui traduit les demandes en langage naturel en requêtes de graphes, démocratisant ainsi l’accès à l’analyse avancée de graphes pour les utilisateurs non spécialistes78.

Déploiement et Scalabilité

TigerGraph supporte plusieurs modèles de déploiement pour répondre à des besoins commerciaux variés:

  • Options Autogérées et Cloud-Native : La plateforme peut être déployée sur des serveurs Linux, au sein de conteneurs Docker, ou via Kubernetes pour des environnements autogérés. Pour le déploiement dans le cloud, son offre Savanna fournit une solution de base de données de graphes entièrement distribuée et cloud-native, disponible sur les principaux fournisseurs de cloud tels que AWS, GCP et Azure5.
  • Fonctionnalités Opérationnelles : TigerGraph met en avant des fonctionnalités telles que le partitionnement automatique, l’expansion/compression élastique du cluster, et le chargement optimisé des données, revendiquant des vitesses d’ingestion de données allant jusqu’à 100 GB par heure par nœud. Ces capacités en font une solution évolutive pour les entreprises traitant des données de graphes à grande échelle, bien que ces indicateurs de performance soient mieux vérifiés de manière indépendante45.

Intégration avec l’IA et la Graph Data Science

TigerGraph relie l’analyse de graphes à l’intelligence artificielle:

  • Graph Data Science Library : Cette suite intégrée à la base de données contient un large éventail d’algorithmes qui transforment des relations complexes de graphes en caractéristiques pour le machine learning, soutenant des tâches telles que le clustering, l’analyse de centralité et la détection de similarité7.
  • TigerGraph CoPilot : Conçu comme un assistant IA, CoPilot exploite l’IA générative et le traitement du langage naturel pour permettre aux utilisateurs d’extraire des informations exploitables à partir des données de graphes sans nécessiter une expertise technique approfondie, facilitant ainsi l’intégration de l’analyse de graphes dans des pipelines de data science conventionnels8.

Scepticisme Technique et Considérations Critiques

Bien que TigerGraph présente de nombreuses affirmations techniques, une évaluation critique s’impose :

  • Indicateurs de Référence : Des affirmations telles qu’une réactivité des requêtes en moins d’une seconde sur des dizaines de millions d’enregistrements et des taux d’ingestion élevés doivent être évaluées dans leur contexte, car ces indicateurs dépendent souvent de configurations matérielles spécifiques et des conditions de charge de travail9.
  • Innovations Propriétaires : La compression de données propriétaire et les méthodes de traitement parallèle, bien que prometteuses, peuvent produire des bénéfices variables dans des environnements réels. Des tests de référence indépendants sont essentiels pour valider ces améliorations de performance.
  • Complexité et Courbe d’Apprentissage : L’ensemble de fonctionnalités avancées de GSQL, bien que puissant, peut présenter une courbe d’apprentissage abrupte pour les nouveaux utilisateurs, et l’adoption réussie dépendra de la capacité de l’organisation à intégrer les outils sophistiqués de TigerGraph dans ses flux de travail existants.

TigerGraph vs Lokad

Bien que TigerGraph et Lokad exploitent des capacités de calcul et d’analyse avancées, leurs orientations fondamentales diffèrent nettement. TigerGraph est une plateforme d’analyse de graphes native construite autour d’un moteur de traitement parallèle en C++ optimisé pour explorer des données connectées via des requêtes multi-sauts et des algorithmes de graphes. En revanche, Lokad se consacre à l’optimisation prédictive de la supply chain via un modèle SaaS, en utilisant son DSL propriétaire Envision (construit avec F#, C# et TypeScript) pour générer des prévisions probabilistes et des décisions exploitables en matière de stocks, de tarification et de planification de la production. Alors que TigerGraph met l’accent sur la Graph Data Science en temps réel et des insights pilotés par l’IA (avec des fonctionnalités telles que GSQL et CoPilot), Lokad se concentre sur l’automatisation et l’optimisation des opérations de la supply chain. Les modèles de déploiement distinguent également les deux : TigerGraph propose des options autogérées et cloud-native, tandis que Lokad est strictement un service cloud multi-tenant. En somme, les organisations souhaitant exploiter une connectivité approfondie des données et une analyse de relations complexes pour des applications diverses — y compris la supply chain visibility — pourront se tourner vers TigerGraph, tandis que celles visant une automatisation complète des décisions supply chain trouveront l’approche ciblée de Lokad mieux adaptée à leurs besoins.

Conclusion

TigerGraph offre une plateforme d’analyse de graphes robuste et à la pointe de la technologie qui fusionne le traitement parallèle natif avec des capacités intégrées d’IA pour relever des défis complexes de connectivité des données. Son architecture évolutive, ses options de déploiement flexibles et son langage de requête avancé permettent aux organisations d’extraire des informations exploitables à partir de vastes ensembles de données interconnectées. Cependant, comme pour tout système haute performance, les utilisateurs potentiels devraient évaluer de manière critique les affirmations de performance, prendre en compte la courbe d’apprentissage associée aux outils propriétaires, et vérifier que ses capacités s’alignent avec leur infrastructure technique existante. Par rapport aux plateformes axées sur la supply chain comme Lokad, TigerGraph propose une approche distincte ancrée dans la Graph Data Science plutôt que dans l’optimisation end-to-end de la supply chain.

Sources