Projet confidentiel — contexte professionnel, nom anonymisé, détails d'implémentation sous restriction IP.
Pourquoi ce projet
Les équipes métier ne devraient pas avoir à écrire du SQL pour interroger leurs propres données. QueryBridge ingère des documents dans plusieurs formats, les indexe, et construit à la volée soit une base relationnelle — quand les données sont structurées et liées — soit un store NoSQL dans les autres cas. Il vectorise ensuite le schéma et ses descriptions pour qu'un agent IA puisse traduire le langage naturel en requêtes fiables. L'objectif : un accès aux données sans friction pour les équipes non-techniques.
Ce que j'ai appris
- C'est la génération dynamique du schéma qui concentre toute la difficulté. Inférer des relations à partir de documents hétérogènes exige une représentation intermédiaire solide avant même de toucher à la base.
- Vectoriser les métadonnées du schéma (noms de colonnes, descriptions, relations) améliore nettement la précision NL-to-SQL, comparé à l'injection brute du DDL dans le prompt.
- Choisir entre SQL et NoSQL est un problème de classification à part entière — la détection de structure doit se faire avant le stockage, pas après.