Agent vocal IA et relation client : le cas Sharlie par Converteo
David Guede, Partner Data / IA et Expert Agentique chez Converteo, est spécialisé dans le déploiement d’architectures d’IA en production. Il accompagne les entreprises dans l’industrialisation d’agents intelligents, transformant des processus métiers complexes en véritables leviers de performance et d’avantage concurrentiel.
A retenir
-
Sosh a déployé « Sharlie », un agent vocal de nouvelle génération basé sur une architecture de 30 agents spécialisés orchestrés pour garantir un dialogue fluide, naturel et personnalisé.
-
Les processus conçus pour les humains doivent être réinventés pour l’IA, car l’obéissance littérale d’un LLM face à des procédures trop contraintes génère des interactions rigides et artificielles.
-
La sécurisation de cet agent probabiliste repose sur trois piliers indispensables : la simulation de masse via un client virtuel, le monitoring en temps réel par un « LLM as a Judge » et l’intégration de garde-fous sémantiques stricts.
-
Le pilotage de la solution évolue de l’IT traditionnel vers le management de la performance sémantique, où l’IA est supervisée, réécoutée et corrigée en continu à l’image d’un conseiller humain.
Concevoir le premier agent vocal européen de bout en bout, capable de dialoguer naturellement avec ses clients sans menu prédictif ni script rigide : c’est le challenge audacieux que nous avons relevé avec Sosh. Lancé mi-mars, “Sharlie” inaugure une nouvelle génération de centres d’appel 100% IA dédiés à l’excellence du Care. Son enjeu : offrir une disponibilité totale et une fluidité de dialogue inédite pour les clients de la marque. Une cri forte sous-tendue par une prouesse technique : comment confier sa relation client à une technologie probabiliste sans risquer l’hallucination ou la rupture de ton à chaque seconde ?
L’excellence relationnelle par l’orchestration multi-agents
Ce que l’utilisateur perçoit comme un interlocuteur unique est en réalité une orchestration complexe. Plutôt qu’un agent unique suivant un script linéaire, Sharlie repose sur une architecture multi-agents : 30 agents spécialisées (facturation, réclamation, gestion de forfait…) reliés au SI d’Orange se transmettent le contexte selon la logique naturelle de la conversation. La technologie novatrice, aussi appelée voice to voice ou full duplex (open ai realtime) permet d’apporter une réponse experte et personnalisée à chaque demande, sans jamais imposer au client un parcours rigide.
Le premier enseignement est crucial : les processus conçus pour des humains ne se transplantent pas tels quels dans une IA. Un conseiller s’approprie une procédure pour la rendre fluide ; un LLM, par son obéissance littérale, produit une interaction rigide et artificielle s’il est trop contraint. Pour Sosh, nous avons réinventé cette logique métier afin que l’IA puisse sortir d’une mécanique de réponse et s’inscrire dans un dialogue naturel avec son interlocuteur.
Comment sécuriser l’expérience client avec un agent probabiliste ?
Les obstacles techniques (latence, gestion du contexte, stabilité des modèles) sont aujourd’hui maîtrisés. Le vrai défi est ailleurs : valider un agent vocal ne ressemble à rien de ce que les DSI ont connu jusqu’ici : la priorité n’est pas seulement la réussite de la tâche, mais la qualité de l’interaction vécue par l’abonné.
Un logiciel déterministe se teste par cas d’usage.
Un LLM, lui, est probabiliste : il peut répondre avec justesse 99 fois et déraper à la centième. Comment anticiper un imprévu sémantique… qu’on ne peut anticiper ?
Pour garantir une expérience irréprochable, nous avons déployé trois piliers :
- Le client virtuel : capable de simuler des milliers de variations d’une même intention.
- Le « LLM as a Judge » : pour monitorer la qualité sémantique en temps réel et s’assurer que chaque réponse est en parfaite adéquation avec l’exigence de la marque.
- Des garde-fous sémantiques : si tutoyer un client est acceptable, vanter une offre concurrente déclenche un kill switch immédiat.
Piloter la performance sémantique au quotidien
Avec les agents vocaux, la nature du monitoring change radicalement. Les indicateurs traditionnels (disponibilité, temps de réponse) deviennent secondaires face à la cohérence sémantique, la détection des hallucinations et le respect du tone of voice.
En production, Sharlie est managé comme un conseiller humain : ses conversations sont réécoutées, ses dérives identifiées et ses apprentissages injectés dans le backlog. Nous ne pilotons plus un projet informatique figé, mais un collaborateur non-humain en constante évolution. Cette transition de l’IT vers le management de la performance sémantique est la clé pour transformer l’IA en un actif pérenne et digne de confiance pour la marque.
- Comment choisir son architecture LLM et s’y tenir dans un écosystème qui change tous les mois ?
- Comment organiser la validation à grande échelle d’un agent probabiliste ?
- Comment monitorer la qualité sémantique en production avec un « LLM as a Judge » ?
- Comment gouverner un agent vocal qui évolue en continu, entre équipes IT et métier ?