Étude de cas agent vocal : le succès d’Orange et Converteo
Orange x Converteo : Sharlie, l’un des premiers agents vocaux au monde en production
Contexte
La relation client devient un actif stratégique pour les opérateurs télécoms. Orange a ainsi souhaité réaffirmer son positionnement d'opérateur de référence sur la relation, en commençant par sa marque digitale Sosh.
Sosh, marque historiquement innovante à l'ADN digital fort, s'appuyait jusque-là sur un site et une application excellents mais par nature textuels. Pour une partie de ses millions d'abonnés, l'expérience était devenue routinière, et l'écart entre la promesse d'innovation et la réalité quotidienne se creusait.
Fin 2024, le comité exécutif d'Orange France lance le programme First, qui place la relation client au cœur de la transformation, sur les deux marques Orange et Sosh. Orange cherche aujourd'hui à incarner cette ambition sur le terrain du vocal et de l'agentique, en pariant sur des technologies qui ne sont pas encore disponibles, et en construisant un service de production capable de tenir dans la durée.
Objectifs
Converteo avait pour objectifs d'accompagner Orange dans la conception, la construction et le déploiement d'un agent vocal en production sur Sosh, permettant de :
- déployer un conseiller vocal capable d'expliquer une facture, de souscrire une option et de prendre un forfait, branché aux systèmes back-office Orange
- parier sur l'architecture voice-to-voice avant même la disponibilité générale du modèle, pour éviter une migration ultérieure depuis un pipeline STT/TTS
- construire une méthode de validation adaptée à un système probabiliste, inspirée de la formation des conseillers en centre d'appel
- garantir la robustesse en production via des clients virtuels, un LLM-as-a-judge et un bug bounty spécifique à l'IA
Étapes de la mission
Cadrage et choix d'architecture
- Définition du périmètre fonctionnel :
Identification des intentions à couvrir, des sous-intentions et des scénarios concrets. Priorisation des cas d'usage pertinents pour un premier déploiement.
Résultat : un scope clair et partagé entre les équipes métier, technique et sponsors, condition de la mise en production.
- Choix de l'architecture voice-to-voice :
Décision structurante prise dès avril 2024, avant la disponibilité générale du modèle (sortie en août 2025), pour éviter une migration coûteuse depuis un pipeline STT/TTS.
Résultat : latence ramenée à environ 1 seconde contre près de 3 secondes en STT/TTS, et préservation de la richesse vocale (émotions, respirations, naturel).
- Alignement des sponsors :
Acceptation explicite par la gouvernance projet de la nature probabiliste du système, avec identification des thèmes critiques où la marge d'erreur tolérable est minimale.
Résultat : un cadre de prise de risque assumé, qui rend possible le passage en production.
Build multi-agents et intégration à la stack Orange
- Architecture orchestrée :
Construction d'une trentaine d'agents spécialisés, qui se passent la main selon les besoins du client et savent escalader vers un humain.
Résultat : une plateforme évolutive, hébergée en cloud européen, capable d'absorber l'ajout de nouvelles intentions sans tout reconstruire.
- Intégration aux API internes Orange :
Branchement aux systèmes catalogue produit, facturation, gestion du compte, applications mobile et web.
Résultat : un agent capable d'agir réellement (souscription d'une option, push d'information dans l'application Sosh), et pas seulement de répondre à des questions.
Validation, observabilité et passage en production
- Méthode de validation inspirée des centres d'appel :
Trois étapes successives : duo data scientist + conseiller métier, validation par une référente service client expérimentée, puis validation sur la diversité réelle des profils clients.
- Industrialisation des tests :
Mise en place de clients virtuels rejouant automatiquement de grands volumes de conversations, et d'un LLM-as-a-judge évaluant systématiquement la qualité des réponses (exactitude des prix, respect de la posture de marque, traitement correct des objections).
- Bug bounty spécifique IA :
Programme conduit avec une quarantaine de white hackers et un partenaire spécialisé, avec une grille de rétribution adaptée aux risques IA.
- Mise en production le 16 mars 2026 :
Lancement de Charlie, conseiller vocal Sosh, avec un mécanisme prêt à tout arrêter en cas de dérive, et un suivi serré des premières conversations.
Résultats
Transformation d'un POC en un MVP exploitable, avec une qualité de réponse mesurée sur 100 % des cas et non sur une démonstration ponctuelle.
Capacité à détecter une régression dès la nuit suivant un déploiement et à itérer sans peur en production.
Identification et correction de failles propres aux modes d'attaque conversationnels avant l'exposition aux clients.
L'un des tout premiers agents vocaux au monde en architecture voice-to-voice sur un service client réel, avec un passage au 20 heures de TF1.