Agent IA qui répond aux FAQ clients 24/7 (intégration site + WhatsApp)
Chatbot FAQ IA PME : installer un agent GPT-4 + RAG sur ton site et WhatsApp pour répondre à tes clients 24/7, sans inventer, sans déborder.
Tu reçois 40 messages WhatsApp par jour qui posent les trois mêmes questions. Ton équipe passe deux heures le matin à répondre « Oui, on livre en Afrique francophone », « Non, pas de stock avant jeudi », « Voici le PDF tarif ». Un agent IA qui lit ta doc, répond pile-poil et tourne 24/7 sur ton site et WhatsApp, ça te parle ? Voici comment monter ça sans bullshit.
Un agent IA lit ta base documentaire et répond en langage naturel, nuit et jour — Photo : Sonkiki, Wikimedia Commons, CC0.
Pourquoi GPT-4 + RAG, pas un chatbot à scripts figés
Les chatbots classiques (« Tapez 1 pour les tarifs, 2 pour les délais ») sont morts. Le client moderne tape « Vous livrez au Sénégal combien de temps ? » en langage naturel. GPT-4 comprend l'intention. Mais seul, GPT-4 invente : il va te sortir un délai bidon s'il n'a pas l'info.
RAG (Retrieval-Augmented Generation) résout ça. Principe :
- Tu charges tes docs (PDF tarifs, FAQ, conditions générales, fiches produits).
- L'agent indexe le contenu dans une base vectorielle.
- Quand un client pose une question, l'IA récupère les paragraphes pertinents, puis GPT-4 formule la réponse en citant ta doc.
- Zéro invention, zéro hallucination.
Résultat : ton agent répond « Livraison Dakar : 12-15 jours ouvrés, 180-220 EUR selon poids (cf. grille tarif mai 2026) », pas « environ 10 jours » sorti de nulle part.
Intégration site web : widget live + tunnel de qualification
Sur ton site, l'agent se présente comme un widget en bas à droite. Le client clique, dialogue en texte, l'IA répond en temps réel. Deux modes possibles :
Mode FAQ pure : le visiteur demande « Vous acceptez PayPal ? », l'agent cherche dans ta doc, répond, fin.
Mode qualification + handoff : l'agent pose 2-3 questions (« Quel volume mensuel ? », « Destination finale ? »), collecte les réponses, puis :
- Soit il répond direct si la réponse est dans la base.
- Soit il transfère à un humain (ton commercial reçoit un résumé structuré sur Slack/email).
Stack technique typique :
| Composant | Outil | Rôle |
|---|---|---|
| Frontend widget | Voiceflow / Botpress embed | Interface chat sur le site |
| LLM | GPT-4 Turbo (OpenAI API) | Compréhension + génération |
| Base vectorielle | Pinecone / Qdrant | Stockage embeddings des docs |
| Orchestration | LangChain / LlamaIndex | Pipeline RAG (retrieval + prompt) |
| Backend | Node.js / Python FastAPI | API entre le widget et l'IA |
Coût mensuel pour une PME (500-1000 conversations/mois) : 80-150 EUR (OpenAI API + hébergement + base vectorielle). Loin du 800 EUR/mois d'un support client à mi-temps.
WhatsApp Cloud API : l'agent où tes clients sont déjà
En Afrique francophone et en France, WhatsApp écrase tout (80 % des échanges B2C en Côte d'Ivoire, 60 % au Maroc, 40 % en France selon nos observations terrain). Intégrer l'agent IA sur WhatsApp Business via la Cloud API (pas l'app Business classique) devient indispensable.
Différence critique :
- WhatsApp Business App (gratuite) : toi tu tapes à la main, max 5 devices, pas d'API.
- WhatsApp Cloud API (hébergée par Meta) : ton agent IA répond automatiquement, volume illimité, webhook vers ton backend.
Flow typique :
- Client envoie « Bonjour, tarif ciment 50 kg Abidjan ? » sur ton numéro WhatsApp Business.
- Meta relaie le message à ton serveur via webhook.
- Ton backend appelle le pipeline RAG (récupère la doc tarif ciment, génère la réponse).
- GPT-4 formule « Ciment 50 kg départ Chine, rendu Abidjan : 8,2-8,9 USD/sac CIF selon volume (cf. grille avril 2026). Commande mini 500 sacs. »
- L'agent répond sur WhatsApp en moins de 3 secondes.
Limites à connaître :
- Templates obligatoires pour initier : tu ne peux pas envoyer de message spontané à un client sans qu'il t'ait écrit d'abord, sauf via templates pré-approuvés par Meta (« Bonjour, votre commande X est prête »).
- Fenêtre 24h : après le dernier message du client, tu as 24h pour répondre librement. Au-delà, template obligatoire.
- Coût : gratuit jusqu'à 1000 conversations/mois (« conversation » = fenêtre 24h), puis ~0,03-0,10 USD par conversation selon destination (France, Maroc, Sénégal…). Négligeable face au gain de temps.
Entraîner l'agent : ta doc, tes règles, ton ton
L'agent IA n'est pas magique out-of-the-box. Il faut le nourrir proprement :
1. Prépare tes documents sources
- PDF tarifs, conditions générales, FAQ interne, fiches techniques produits.
- Format structuré (titres clairs, paragraphes courts). Un PDF scanné illisible = agent muet.
- Mets à jour régulièrement. Si tu changes un délai de livraison, recharge le doc dans la base vectorielle.
2. Définis les limites
Prompt système type :
« Tu es l'assistant client de [Ton Entreprise]. Tu réponds uniquement aux questions sur nos produits, tarifs, délais et conditions. Si la réponse n'est pas dans les documents fournis, tu dis "Je n'ai pas cette information, je transfère à l'équipe." Tu ne donnes jamais de conseil juridique, technique ou médical. Ton ton est pro, concis, francophone Afrique et France. »
3. Teste en boucle
Crée une liste de 30-50 questions réelles (récupère les emails/WhatsApp des derniers mois). Fais tourner l'agent, note les ratés, ajuste le prompt ou enrichis la doc.
4. Handoff intelligent
L'agent doit savoir quand passer la main. Règle simple : si la réponse nécessite une négo prix custom, un devis complexe ou une réclamation SAV sensible, il collecte les infos et transfère à un humain avec un résumé.
Exemple de handoff :
Client : « Je veux 10 000 pièces, délai 3 semaines, possible ? »
Agent IA : « Volume et délai nécessitent une étude sur-mesure. Je transfère votre demande à notre équipe commerciale. Confirmez-vous votre email [email saisi] pour recevoir le devis sous 24h ? »
[Webhook envoie les infos au CRM, commercial prend le relais.]
Coût réel et ROI pour une PME
Montons une config typique pour une PME importatrice (50-100 demandes client/semaine) :
| Poste | Coût mensuel (EUR) |
|---|---|
| OpenAI API (GPT-4 Turbo, ~2000 requêtes) | 50-80 |
| Base vectorielle (Pinecone Starter ou Qdrant Cloud) | 20-40 |
| WhatsApp Cloud API (500-1000 conversations) | 0-30 |
| Hébergement backend (VPS ou serverless) | 15-30 |
| Maintenance / mise à jour docs (2h/mois) | 0 (interne) |
| Total mensuel | 85-180 EUR |
Temps gagné : si ton équipe passe 10h/semaine à répondre aux FAQ répétitives, tu libères 40h/mois. À 25 EUR/h chargé, ça fait 1000 EUR de temps de travail récupéré. ROI en 2-3 mois.
Bonus : l'agent collecte les questions non résolues. Tu vois en temps réel les points flous de ta doc, les nouveaux besoins clients, les frictions récurrentes. Dashboard analytics = mine d'or pour améliorer ton offre.
Les erreurs à éviter (on les a toutes vues)
Erreur #1 : Vouloir que l'agent fasse tout
Un agent IA FAQ remplace 60-70 % des demandes simples. Il ne négocie pas un contrat cadre, ne gère pas une réclamation complexe. Accepte le handoff.
Erreur #2 : Doc pourrie = agent pourri
Si ta base documentaire est un PDF de 80 pages tout en paragraphes denses, l'agent va galérer. Structure : titres, listes, tableaux. Pense « Wikipédia », pas « rapport annuel ».
Erreur #3 : Oublier le ton
Un agent qui répond « Veuillez consulter notre catalogue en ligne » en mode banque, ça casse l'expérience. Ton prompt système doit refléter ton identité de marque. Si tu es direct et cool, l'agent aussi.
Erreur #4 : Ne pas tester WhatsApp en conditions réelles
WhatsApp a des limites réseau, des clients qui envoient 5 messages d'affilée, des photos floues de bons de commande. Teste avec des vraies personnes, pas juste toi sur ton iPhone.
Erreur #5 : Croire que c'est « set and forget »
L'agent IA évolue avec ta boîte. Nouveau produit ? Nouveau tarif ? Nouvelle zone de livraison ? Recharge la doc, re-teste. Budget 1-2h par mois de maintenance.
Monte ton agent IA FAQ en 4 semaines
Semaine 1 : Prépare la doc
Rassemble PDF, FAQ, fiches produits. Nettoie, structure. Crée une Google Sheet avec les 30 questions les plus fréquentes (récupère tes emails/WhatsApp).
Semaine 2 : Installe le pipeline RAG
Stack rapide : LangChain + OpenAI API + Pinecone (ou Qdrant si tu préfères de l'open-source). Charge ta doc, teste le retrieval (est-ce que l'IA retrouve les bons paragraphes ?).
Semaine 3 : Intègre site + WhatsApp
- Site : widget Voiceflow ou Botpress, connecte à ton backend RAG.
- WhatsApp : inscris ton numéro sur WhatsApp Cloud API (via Meta Business Manager), configure le webhook, teste le flow.
Semaine 4 : Teste, ajuste, lance en bêta
Fais tourner avec 5-10 clients pilotes. Collecte les ratés, améliore le prompt, enrichis la doc. Puis ouvre à tout le monde.
Tu veux un agent IA FAQ qui répond vraiment à tes clients, pas un bot qui débite du vent ? Chez KOMO Digital, on monte des pipelines RAG sur-mesure (GPT-4 + base vectorielle + intégration site/WhatsApp) pour les PME franco-chinoises et africaines. On part de ta doc réelle, on teste en conditions réelles, on livre un agent qui tourne 24/7 sans inventer. Découvre notre service IA automation et parlons de ton cas concret.