Interrogez votre bibliographie avec l'IA
RefChat est l'assistant de recherche pour vos PDF scientifiques. Recherche hybride, détection automatique du mode de requête, multilingue, OCR intégré. Au choix : 100 % en local ou cloud sécurisé.
Pourquoi RefChat ?
Un assistant de recherche pensé pour la rigueur scientifique et la souveraineté des données.
Confidentialité absolue
Vos documents ne quittent jamais votre machine en mode local. Mode cloud disponible si vous préférez décharger les calculs sur nos serveurs européens.
Recherche hybride précise
Recherche sémantique multilingue (E5-large), keyword BM25 et reranking cross-encoder. Résultats plus pertinents qu'un RAG basique, sources citées explicitement.
5 modes intelligents
RefChat détecte automatiquement ce que vous voulez : question, résumé, liste de références, recherche par auteur, fact-check.
OCR & parsing avancé
PDFs scannés ? Anciens rapports image ? EasyOCR + GROBID extraient texte, métadonnées et structure scientifique.
Thématiques automatiques
Clustering BERTopic pour organiser votre bibliothèque en thèmes cohérents. Renommez, fusionnez, divisez selon votre vision.
Multilingue natif
Posez une question en français sur un article en anglais (ou inversement) — RefChat retrouve le contenu pertinent quelle que soit la langue.
Deux modes d'utilisation, votre choix
Vous gardez le contrôle. Décidez à tout moment si vos données restent chez vous ou bénéficient de la puissance du cloud.
🔒 Mode 100% Local
- Confidentialité absolue : aucun envoi de données vers Internet
- Aucun serveur externe utilisé pour le traitement
- LLM local via llama.cpp (modèles GGUF Mistral, Llama, etc.)
- Indexation locale (embeddings + BM25 + reranking)
- Idéal pour données sensibles (industrie, juridique, médical)
- PC moins puissant : indexation et requêtes plus lentes
- Recommandé : 16 Go RAM minimum, GPU NVIDIA pour de bonnes performances
☁️ Mode 100% Cloud
- LLM en ligne (API Mistral) : qualité de réponse maximale
- Indexation déportée sur nos serveurs OVHcloud (France)
- Pas de contrainte matérielle côté utilisateur
- Vitesse d'indexation et de requête fortement accélérée
- Données chiffrées en transit (TLS) et hébergées en UE
- Idéal pour gros volumes, configurations légères, équipes distribuées
Trois étapes, c'est tout
De votre dossier de PDFs à votre assistant de recherche personnel, en quelques minutes.
Pointez votre bibliothèque
Indiquez votre dossier Zotero, Mendeley, ou n'importe quel dossier contenant vos PDFs.
Indexation intelligente
Pipeline multi-threadé : parsing GROBID, OCR, chunking sémantique, embeddings, BM25, thématiques.
Discutez avec vos articles
Posez vos questions en langage naturel. Réponses sourcées avec citations cliquables.
5 modes de requête détectés automatiquement
| Mode | Déclencheur | Comportement |
|---|---|---|
| Question | (par défaut) | Réponse narrative avec citations sourcées |
| Résumé | « résume », « synthèse » | Synthèse d'un ou plusieurs articles |
| Références | « quelles publications » | Liste d'articles pertinents avec explications |
| Auteur | « articles de », « travaux de » | Recherche par auteur via OpenAlex |
| Fact-check | « vérifie », « est-ce correct » | Vérification d'affirmations contre votre bibliographie |
RefChat en images
Un aperçu de l'interface — du chat sourcé à l'exploration thématique de votre bibliothèque.
Conversation sourcée
Chaque réponse cite les passages exacts des articles, avec liens directs vers le PDF.
Cartographie thématique
Visualisez les grands axes de votre bibliothèque, regroupés automatiquement par sujet.
Indexation transparente
Progression détaillée du parsing GROBID, OCR, embeddings et thématiques.
Pour qui ?
Conçu pour des environnements exigeants où la confidentialité et la rigueur priment.
🔬 Recherche R&D et académique
Synthèse d'état de l'art, croisement de centaines d'articles. Accélérez vos revues de littérature.
📊 Veille technologique
Rapports sectoriels, brevets, publications. Posez des questions stratégiques sans risque de fuite.
📚 Capitalisation industrielle
Retrouvez l'information enfouie dans des décennies de rapports internes (OCR + RAG).
🏛️ Cabinets et expertises
Idéal pour les structures qui manipulent des documents sensibles (juridique, médical, géoscience).
Tarifs
Trois forfaits adaptés à votre usage. Tarifs indicatifs HT — un devis personnalisé est fourni après échange.
Solo Local
Chercheur ou expert indépendant — tout reste sur votre machine.
- Indexation 100% locale
- LLM local (llama.cpp / GGUF)
- Aucune donnée envoyée sur Internet
- 1 poste utilisateur, bibliothèque illimitée
- Mises à jour & support email 48 h
Solo Cloud
Chercheur ou expert — performances optimales, sans contrainte matérielle.
- Indexation sur nos serveurs OVHcloud (France)
- Interaction IA via l'API Mistral
- Pas de configuration GPU requise
- 1 poste utilisateur, bibliothèque illimitée
- Données chiffrées (TLS), hébergées en UE
Équipe
Pour les laboratoires, cabinets, R&D de PME.
- Mode local + cloud sécurisé
- Jusqu'à 10 postes
- Indexation déportée OVHcloud (FR)
- API Mistral incluse (quota dédié)
- Support prioritaire & onboarding
Entreprise
Besoins spécifiques, environnements sensibles, volumes importants.
Chaque demande est étudiée au cas par cas : installation sur vos serveurs avec accompagnement, adaptation à vos volumes, formation de vos équipes. Parlons de votre besoin.
Nous contacterEssai possible sur un échantillon de votre bibliothèque avant engagement. Conditions détaillées dans les CGV.
Questions fréquentes
Les questions qui reviennent le plus souvent. Une autre interrogation ? Écrivez-nous.
Quelle configuration matérielle pour le mode 100% local ?
Minimum confortable : 16 Go de RAM, CPU récent (4+ cœurs), 10 Go d'espace disque pour l'index.
Recommandé : 32 Go de RAM et un GPU NVIDIA (8 Go VRAM+) pour des LLM locaux fluides (Mistral 7B, Llama 3 8B). Sans GPU, les requêtes restent possibles mais plus lentes (10–30 s par réponse).
Sur Mac Apple Silicon (M1/M2/M3), Metal est utilisé automatiquement — pas besoin de GPU NVIDIA.
Combien de PDFs RefChat peut-il indexer ?
Aucune limite logicielle. En pratique, des bibliothèques de 5 000 à 20 000 articles sont gérées sans difficulté. L'indexation d'un PDF typique prend 2 à 8 secondes selon le mode (avec ou sans OCR) et le matériel.
Pour des volumes supérieurs (50 000+), le mode cloud ou un déploiement on-premise dédié est conseillé.
Zotero et Mendeley sont-ils supportés ?
Oui. RefChat pointe simplement votre dossier de stockage Zotero (`storage/`) ou Mendeley. Les métadonnées sont enrichies automatiquement via GROBID et OpenAlex. Pas d'extension à installer côté Zotero.
Quelles langues sont supportées ?
Le modèle d'embedding (E5-large multilingue) couvre une centaine de langues. Les langues les mieux gérées sont français, anglais, allemand, espagnol, italien, portugais, néerlandais. Vous pouvez poser une question en français sur un corpus mixte FR/EN — RefChat retrouve les passages pertinents dans les deux langues.
Mes données restent-elles vraiment confidentielles ?
Mode local : aucune donnée ne sort de votre machine. Vous pouvez même travailler hors ligne après l'installation.
Mode cloud : indexation et LLM sur nos serveurs OVHcloud (Roubaix, France). Données chiffrées en transit (TLS 1.3), suppression sur demande, aucun entraînement de modèle sur vos contenus. Conformité RGPD documentée.
Puis-je tester RefChat avant achat ?
Oui. Sur demande, nous proposons une démo live (30 min) et un essai sur un échantillon de votre propre bibliothèque, sous accord de confidentialité si nécessaire. Demandez une démo.
Quelle différence avec ChatGPT, NotebookLM ou Perplexity ?
RefChat est spécialisé sur les bibliothèques scientifiques (parsing GROBID, OCR EasyOCR, recherche hybride dense+BM25+reranking, détection automatique de mode de requête). Surtout : option 100% locale — vos articles, brevets ou rapports sensibles ne quittent jamais votre machine.
Les solutions cloud généralistes envoient vos documents vers des serveurs aux États-Unis et n'offrent pas le même niveau de citation source ni d'organisation thématique.
Contactez-nous
Demande de licence, démo, question technique : écrivez-nous, nous répondons sous 48 h ouvrées.