Aller au contenu principal
Module IA Enrichment

Enrichissement IA RAG-first. Coût zéro sur les produits que vous connaissez déjà.

Un pipeline en deux phases qui interroge d'abord vos documents fournisseurs (RAG Qdrant local), bascule sur la recherche web si nécessaire (Perplexity ou SearXNG auto-hébergé), puis synthétise avec le LLM de votre choix. BYOK sur 14 providers.

Le pipeline en deux phases

Phase 01

Collect — RAG + Web

Qdrant local · Perplexity / SearXNG

Le pipeline interroge d'abord votre base documentaire indexée (RAG sur Qdrant local — vos fiches techniques fournisseurs, manuels, certificats). Si la couverture RAG est suffisante (≥ 3 chunks pertinents), aucun appel web n'est déclenché — coût IA zéro. Sinon, fallback automatique sur une recherche web configurable (Perplexity ou SearXNG auto-hébergé).

Phase 02

Synthesize — LLM

OpenAI / Anthropic / Mistral / Ollama…

Un LLM de votre choix consolide les données documentaires (source prioritaire) et les données web (source secondaire) en une fiche enrichie : description SEO, attributs techniques extraits, dimensions, poids, balises alt images, prix concurrents et vidéos officielles. Les sources documentaires priment toujours sur le web.

Ce que contient le module enrichissement

RAG-first — coût zéro quand vos documents sont indexés

Indexez vos PDFs fournisseurs, fiches techniques, manuels et certificats dans Qdrant local. Le pipeline d'enrichissement les interroge d'abord. Quand la couverture est suffisante (≥ 3 chunks pertinents), aucun appel LLM web n'est déclenché — l'enrichissement de ce produit coûte zéro.

Fallback web — Perplexity ou SearXNG auto-hébergé

Quand la couverture RAG est insuffisante, le pipeline bascule sur une recherche web configurable. Utilisez Perplexity (managé) pour la qualité, ou SearXNG (auto-hébergé) pour la souveraineté totale — personne ne sait ce que vous recherchez.

Synthèse LLM avec règles de priorité

Un LLM configurable (OpenAI, Anthropic, Mistral, Ollama local…) consolide les sources RAG et web. Le prompt de synthèse impose que les données documentaires sont plus fiables que le web — vos specs fournisseur gagnent toujours sur un listing Amazon random.

14 providers IA BYOK

Apportez vos clés pour 14 providers IA natifs (OpenAI, Anthropic, DeepSeek, Gemini, Grok, Groq, Jina, Mistral, Ollama, OpenRouter, Perplexity, SearXNG, Together, DeepL). Pas de markup, pas de taxe par token — votre provider vous facture directement.

11 contextes IA assignables à des providers différents

Optimisez le coût/qualité par contexte : modèles bon marché pour la traduction, premium pour la synthèse d’enrichissement, Ollama local pour la compliance. Le Smart Router choisit le bon provider par tâche, le Cost Estimator prédit la facture avant exécution.

Bibliothèque de prompts personnalisés

Définissez vos prompts par catégorie produit — votre ton, vos attributs obligatoires, vos règles SEO. Réutilisés sur tout le catalogue. Surchargez par fournisseur ou par marque si besoin.

Pourquoi le RAG-first change l'économie de l'enrichissement IA

La plupart des outils « d'enrichissement IA » appellent un LLM sur chaque produit, à chaque fois, avec une recherche web greffée par-dessus. À 900k produits et 0,01-0,05€ par appel, la facture explose vite — et le LLM invente généralement des détails qu'il ne connaît pas réellement sur votre SKU spécifique.

Le pipeline de PixeePIM inverse le défaut. Si vous avez indexé la fiche technique fournisseur d'un produit, le RAG récupère les vraies specs — poids, dimensions, certifications, matériaux — et le LLM ne fait que les consolider. Pas d'hallucination, pas d'appel web, pas de coût par produit. Le coût marginal d'enrichir ce produit est le coût d'embedding ponctuel, amorti sur chaque ré-enrichissement futur.

Pour les distributeurs qui ont déjà des PDFs de leurs fournisseurs, c'est la différence entre une facture IA récurrente de 5k€/mois et un coût d'indexation ponctuel de 200€. Le fallback web ne se déclenche que pour les produits où vous n'avez réellement aucune donnée — typiquement les nouveaux SKUs en onboarding.

L'enrichissement IA est inclus dans tous les plans payants

BYOK sur vos clés provider IA. Pas de markup PixeePIM, pas de taxe par token — votre provider vous facture directement.