.Architecture RAG et bases vectorielles

Un LLM générique ne connaît pas votre métier. Le RAG (Retrieval-Augmented Generation) est la technique de référence pour lui injecter votre corpus métier sans avoir à le réentraîner. Bien conçue, une architecture RAG transforme un assistant généraliste en expert de votre domaine.
Anatomie d'un pipeline RAG
- Ingestion : extraction de contenu (PDF, HTML, Confluence, SharePoint, Google Drive, bases de données), nettoyage, déduplication.
- Découpage (chunking) : segmentation en passages exploitables : stratégie sémantique ou découpage fixe, taille des passages, recouvrement.
- Embedding : vectorisation via un modèle d'embeddings (OpenAI, Cohere, Mistral, open-source comme BGE ou Nomic).
- Indexation : stockage dans une base vectorielle (pgvector, Qdrant, Weaviate, Pinecone). La recherche hybride (vectorielle + lexicale) donne souvent de meilleurs résultats.
- Reclassement (reranking) : affinage des résultats via un cross-encoder (Cohere Rerank, Voyage AI, BGE Rerank).
- Génération : construction du prompt final intégrant les passages retrouvés, puis appel au LLM.
- Évaluation continue : jeux de tests de référence, suivi de la qualité en production.
Où se joue la qualité
La qualité d'un RAG dépend essentiellement de la qualité de la recherche de passages, et non du modèle de génération. Un Claude 4.7 sur des passages mal retrouvés produira une mauvaise réponse, un modèle plus modeste alimenté avec les bons passages produira une bonne réponse.
Les leviers les plus déterminants : qualité de l'ingestion, granularité du découpage, qualité des embeddings, présence d'un reranker, recherche hybride (vectorielle + BM25). On itère sur ces leviers en s'appuyant sur un jeu de tests de référence.
Nos technologies
- Bases vectorielles : pgvector, Qdrant, Weaviate, Pinecone, Milvus, Elastic.
- Embeddings : OpenAI text-embedding-3, Cohere embed-v3, Mistral, open-source (BGE, Nomic, jina).
- Rerankers : Cohere Rerank, Voyage AI, BGE Rerank.
- Orchestration : LangChain, LlamaIndex, Haystack, ou code sur mesure selon la maturité du besoin.
- Observabilité : Langfuse, LangSmith, Arize, Phoenix.
Cas client confidentiel
Recherche documentaire sur corpus métier
L'équipe DINNO derrière ce service
Une équipe permanente à Saint-Herblain, qui suit chaque projet du cadrage à la maintenance.

Aline Deschamps
Directrice Générale, spécialiste Data
Co-fondatrice de DINNO, elle pilote la stratégie de l'agence et accompagne les clients dans la valorisation de leurs données. Elle intervient sur le cadrage des projets, la gouvernance et la dimension métier des solutions, en particulier auprès des acteurs de la santé.
LinkedIn →
Antoine Précigout
Directeur Technique
Directeur technique de DINNO, il pilote l'équipe de développement et garantit la qualité d'ingénierie de bout en bout : architecture, industrialisation, CI/CD, tests automatisés et mise en production. Référent technique sur les projets web et mobiles.
LinkedIn →
Cédric Millauriaux
Architecte Logiciel
Architecte logiciel chez DINNO, il intervient sur les audits techniques, la conception d'architecture et l'urbanisation des systèmes d'information. Il accompagne éditeurs et grands comptes dans leurs refontes et leurs choix structurants (cloud, intégration LLM, sécurité).
LinkedIn →