Agent IA qui répond aux FAQ clients 24/7 (intégration site + WhatsApp)

Chatbot FAQ IA PME : installer un agent GPT-4 + RAG sur ton site et WhatsApp pour répondre à tes clients 24/7, sans inventer, sans déborder.

Tu reçois 40 messages WhatsApp par jour qui posent les trois mêmes questions. Ton équipe passe deux heures le matin à répondre « Oui, on livre en Afrique francophone », « Non, pas de stock avant jeudi », « Voici le PDF tarif ». Un agent IA qui lit ta doc, répond pile-poil et tourne 24/7 sur ton site et WhatsApp, ça te parle ? Voici comment monter ça sans bullshit.

Agent conversationnel sur ordinateur portable Un agent IA lit ta base documentaire et répond en langage naturel, nuit et jour — Photo : Sonkiki, Wikimedia Commons, CC0.

Pourquoi GPT-4 + RAG, pas un chatbot à scripts figés

Les chatbots classiques (« Tapez 1 pour les tarifs, 2 pour les délais ») sont morts. Le client moderne tape « Vous livrez au Sénégal combien de temps ? » en langage naturel. GPT-4 comprend l'intention. Mais seul, GPT-4 invente : il va te sortir un délai bidon s'il n'a pas l'info.

RAG (Retrieval-Augmented Generation) résout ça. Principe :

Tu charges tes docs (PDF tarifs, FAQ, conditions générales, fiches produits).
L'agent indexe le contenu dans une base vectorielle.
Quand un client pose une question, l'IA récupère les paragraphes pertinents, puis GPT-4 formule la réponse en citant ta doc.
Zéro invention, zéro hallucination.

Résultat : ton agent répond « Livraison Dakar : 12-15 jours ouvrés, 180-220 EUR selon poids (cf. grille tarif mai 2026) », pas « environ 10 jours » sorti de nulle part.

Intégration site web : widget live + tunnel de qualification

Sur ton site, l'agent se présente comme un widget en bas à droite. Le client clique, dialogue en texte, l'IA répond en temps réel. Deux modes possibles :

Mode FAQ pure : le visiteur demande « Vous acceptez PayPal ? », l'agent cherche dans ta doc, répond, fin.

Mode qualification + handoff : l'agent pose 2-3 questions (« Quel volume mensuel ? », « Destination finale ? »), collecte les réponses, puis :

Soit il répond direct si la réponse est dans la base.
Soit il transfère à un humain (ton commercial reçoit un résumé structuré sur Slack/email).

Stack technique typique :

Composant	Outil	Rôle
Frontend widget	Voiceflow / Botpress embed	Interface chat sur le site
LLM	GPT-4 Turbo (OpenAI API)	Compréhension + génération
Base vectorielle	Pinecone / Qdrant	Stockage embeddings des docs
Orchestration	LangChain / LlamaIndex	Pipeline RAG (retrieval + prompt)
Backend	Node.js / Python FastAPI	API entre le widget et l'IA

Coût mensuel pour une PME (500-1000 conversations/mois) : 80-150 EUR (OpenAI API + hébergement + base vectorielle). Loin du 800 EUR/mois d'un support client à mi-temps.

WhatsApp Cloud API : l'agent où tes clients sont déjà

En Afrique francophone et en France, WhatsApp écrase tout (80 % des échanges B2C en Côte d'Ivoire, 60 % au Maroc, 40 % en France selon nos observations terrain). Intégrer l'agent IA sur WhatsApp Business via la Cloud API (pas l'app Business classique) devient indispensable.

Différence critique :

WhatsApp Business App (gratuite) : toi tu tapes à la main, max 5 devices, pas d'API.
WhatsApp Cloud API (hébergée par Meta) : ton agent IA répond automatiquement, volume illimité, webhook vers ton backend.

Flow typique :

Client envoie « Bonjour, tarif ciment 50 kg Abidjan ? » sur ton numéro WhatsApp Business.
Meta relaie le message à ton serveur via webhook.
Ton backend appelle le pipeline RAG (récupère la doc tarif ciment, génère la réponse).
GPT-4 formule « Ciment 50 kg départ Chine, rendu Abidjan : 8,2-8,9 USD/sac CIF selon volume (cf. grille avril 2026). Commande mini 500 sacs. »
L'agent répond sur WhatsApp en moins de 3 secondes.

Limites à connaître :

Templates obligatoires pour initier : tu ne peux pas envoyer de message spontané à un client sans qu'il t'ait écrit d'abord, sauf via templates pré-approuvés par Meta (« Bonjour, votre commande X est prête »).
Fenêtre 24h : après le dernier message du client, tu as 24h pour répondre librement. Au-delà, template obligatoire.
Coût : gratuit jusqu'à 1000 conversations/mois (« conversation » = fenêtre 24h), puis ~0,03-0,10 USD par conversation selon destination (France, Maroc, Sénégal…). Négligeable face au gain de temps.

Entraîner l'agent : ta doc, tes règles, ton ton

L'agent IA n'est pas magique out-of-the-box. Il faut le nourrir proprement :

1. Prépare tes documents sources

PDF tarifs, conditions générales, FAQ interne, fiches techniques produits.
Format structuré (titres clairs, paragraphes courts). Un PDF scanné illisible = agent muet.
Mets à jour régulièrement. Si tu changes un délai de livraison, recharge le doc dans la base vectorielle.

2. Définis les limites

Prompt système type :

« Tu es l'assistant client de [Ton Entreprise]. Tu réponds uniquement aux questions sur nos produits, tarifs, délais et conditions. Si la réponse n'est pas dans les documents fournis, tu dis "Je n'ai pas cette information, je transfère à l'équipe." Tu ne donnes jamais de conseil juridique, technique ou médical. Ton ton est pro, concis, francophone Afrique et France. »

3. Teste en boucle

Crée une liste de 30-50 questions réelles (récupère les emails/WhatsApp des derniers mois). Fais tourner l'agent, note les ratés, ajuste le prompt ou enrichis la doc.

4. Handoff intelligent

L'agent doit savoir quand passer la main. Règle simple : si la réponse nécessite une négo prix custom, un devis complexe ou une réclamation SAV sensible, il collecte les infos et transfère à un humain avec un résumé.

Exemple de handoff :

Client : « Je veux 10 000 pièces, délai 3 semaines, possible ? »
Agent IA : « Volume et délai nécessitent une étude sur-mesure. Je transfère votre demande à notre équipe commerciale. Confirmez-vous votre email [email saisi] pour recevoir le devis sous 24h ? »
[Webhook envoie les infos au CRM, commercial prend le relais.]

Coût réel et ROI pour une PME

Montons une config typique pour une PME importatrice (50-100 demandes client/semaine) :

Poste	Coût mensuel (EUR)
OpenAI API (GPT-4 Turbo, ~2000 requêtes)	50-80
Base vectorielle (Pinecone Starter ou Qdrant Cloud)	20-40
WhatsApp Cloud API (500-1000 conversations)	0-30
Hébergement backend (VPS ou serverless)	15-30
Maintenance / mise à jour docs (2h/mois)	0 (interne)
Total mensuel	85-180 EUR

Temps gagné : si ton équipe passe 10h/semaine à répondre aux FAQ répétitives, tu libères 40h/mois. À 25 EUR/h chargé, ça fait 1000 EUR de temps de travail récupéré. ROI en 2-3 mois.

Bonus : l'agent collecte les questions non résolues. Tu vois en temps réel les points flous de ta doc, les nouveaux besoins clients, les frictions récurrentes. Dashboard analytics = mine d'or pour améliorer ton offre.

Les erreurs à éviter (on les a toutes vues)

Erreur #1 : Vouloir que l'agent fasse tout

Un agent IA FAQ remplace 60-70 % des demandes simples. Il ne négocie pas un contrat cadre, ne gère pas une réclamation complexe. Accepte le handoff.

Erreur #2 : Doc pourrie = agent pourri

Si ta base documentaire est un PDF de 80 pages tout en paragraphes denses, l'agent va galérer. Structure : titres, listes, tableaux. Pense « Wikipédia », pas « rapport annuel ».

Erreur #3 : Oublier le ton

Un agent qui répond « Veuillez consulter notre catalogue en ligne » en mode banque, ça casse l'expérience. Ton prompt système doit refléter ton identité de marque. Si tu es direct et cool, l'agent aussi.

Erreur #4 : Ne pas tester WhatsApp en conditions réelles

WhatsApp a des limites réseau, des clients qui envoient 5 messages d'affilée, des photos floues de bons de commande. Teste avec des vraies personnes, pas juste toi sur ton iPhone.

Erreur #5 : Croire que c'est « set and forget »

L'agent IA évolue avec ta boîte. Nouveau produit ? Nouveau tarif ? Nouvelle zone de livraison ? Recharge la doc, re-teste. Budget 1-2h par mois de maintenance.

Monte ton agent IA FAQ en 4 semaines

Semaine 1 : Prépare la doc

Rassemble PDF, FAQ, fiches produits. Nettoie, structure. Crée une Google Sheet avec les 30 questions les plus fréquentes (récupère tes emails/WhatsApp).

Semaine 2 : Installe le pipeline RAG

Stack rapide : LangChain + OpenAI API + Pinecone (ou Qdrant si tu préfères de l'open-source). Charge ta doc, teste le retrieval (est-ce que l'IA retrouve les bons paragraphes ?).

Semaine 3 : Intègre site + WhatsApp

Site : widget Voiceflow ou Botpress, connecte à ton backend RAG.
WhatsApp : inscris ton numéro sur WhatsApp Cloud API (via Meta Business Manager), configure le webhook, teste le flow.

Semaine 4 : Teste, ajuste, lance en bêta

Fais tourner avec 5-10 clients pilotes. Collecte les ratés, améliore le prompt, enrichis la doc. Puis ouvre à tout le monde.

Tu veux un agent IA FAQ qui répond vraiment à tes clients, pas un bot qui débite du vent ? Chez KOMO Digital, on monte des pipelines RAG sur-mesure (GPT-4 + base vectorielle + intégration site/WhatsApp) pour les PME franco-chinoises et africaines. On part de ta doc réelle, on teste en conditions réelles, on livre un agent qui tourne 24/7 sans inventer. Découvre notre service IA automation et parlons de ton cas concret.

Agent IA qui répond aux FAQ clients 24/7 (intégration site + WhatsApp)

Pourquoi GPT-4 + RAG, pas un chatbot à scripts figés

Intégration site web : widget live + tunnel de qualification

WhatsApp Cloud API : l'agent où tes clients sont déjà

Entraîner l'agent : ta doc, tes règles, ton ton

Coût réel et ROI pour une PME

Les erreurs à éviter (on les a toutes vues)

Monte ton agent IA FAQ en 4 semaines

À lire aussi

Articles récents

Les 5 erreurs des PME françaises qui s'attaquent au marché chinois

Logistique multimodale Chine ↔ Afrique : maritime, ferroviaire ou aérien ?

Construire son 1er agent IA interne : feuille de route 4 semaines