Agente de voz IA y atención al cliente: el caso Sharlie de Converteo
David Guede, Partner Data / IA y experto en Agentes IA en Converteo, está especializado en el despliegue de arquitecturas de IA en producción. Asesora a las empresas en la industrialización de agentes inteligentes, transformando procesos de negocio complejos en verdaderas palancas de rendimiento y ventaja competitiva.
Ideas clave
-
Sosh ha desplegado a «Sharlie», un agente de voz de nueva generación basado en una arquitectura de 30 agentes especializados y coordinados para garantizar un diálogo fluido, natural y personalizado.
-
Los procesos diseñados para humanos deben reinventarse para la IA, ya que la obediencia literal de un LLM ante procedimientos demasiado encorsetados genera interacciones rígidas y artificiales.
-
La seguridad de este agente probabilístico se apoya en tres pilares indispensables: la simulación masiva mediante un cliente virtual, la monitorización en tiempo real a través de un «LLM como juez» (LLM as a Judge) y la integración de directrices semánticas estrictas.
-
La gestión de la solución evoluciona desde la informática tradicional hacia la gestión del rendimiento semántico, donde la IA es supervisada, auditada (mediante escuchas) y corregida de forma continua, exactamente igual que un asesor humano.
Diseñar el primer agente de voz europeo end-to-end, capaz de dialogar con naturalidad con los clientes sin menús predictivos ni guiones rígidos: este es el audaz reto que hemos superado con Sosh. Lanzado a mediados de marzo, “Sharlie” inaugura una nueva generación de call centers 100% IA dedicados a la excelencia en el Customer Care. Su objetivo: ofrecer una disponibilidad total y una fluidez de diálogo inédita para los clientes de la marca. Una apuesta ambiciosa respaldada por una verdadera proeza técnica: ¿cómo confiar tu atención al cliente a una tecnología probabilística sin arriesgarte a sufrir alucinaciones o salidas de tono a cada segundo?
La excelencia relacional mediante la orquestación multiagente
Lo que el usuario percibe como un interlocutor único es, en realidad, una orquestación compleja. En lugar de un solo agente siguiendo un guion lineal, Sharlie se basa en una arquitectura multiagente: 30 agentes especializados (facturación, reclamaciones, gestión de tarifas…) conectados a los sistemas IT de Orange, que se traspasan el contexto siguiendo la lógica natural de la conversación. Esta tecnología innovadora, también conocida como voice to voice o full duplex (OpenAI realtime) permite dar una respuesta experta y personalizada a cada petición, sin imponer jamás un recorrido rígido al cliente.
El primer aprendizaje es clave: los procesos diseñados para humanos no se pueden trasladar tal cual a una IA. Un agente humano hace suyo un procedimiento para que fluya; un LLM, debido a su obediencia literal, genera una interacción rígida y artificial si se le imponen demasiadas reglas. Para Sosh, hemos reinventado esta lógica de negocio con el fin de que la IA salga de la mecánica de “pregunta-respuesta” y establezca un diálogo verdaderamente natural con su interlocutor.
¿Cómo blindar la experiencia del cliente con un agente probabilístico?
Los obstáculos técnicos (latencia, gestión del contexto, estabilidad de los modelos) ya están superados. El verdadero reto es otro: validar un agente de voz no se parece a nada de lo que los directores de IT hayan visto hasta ahora. La prioridad no es solo ejecutar la tarea con éxito, sino la calidad de la interacción que experimenta el usuario.
Un software determinista se testea mediante casos de uso.
Un LLM, en cambio, es probabilístico: puede responder perfectamente 99 veces y descarrilar en la número cien. ¿Cómo anticiparse a un imprevisto semántico… que por definición es imprevisible?
Para garantizar una experiencia impecable, nos hemos apoyado en tres pilares:
- El cliente virtual: capaz de simular miles de variaciones de una misma intención.
- El “LLM as a Judge”: para monitorizar la calidad semántica en tiempo real y asegurar que cada respuesta encaja a la perfección con los estándares de la marca.
- Los guardrails semánticos: tutear a un cliente puede ser aceptable, pero elogiar una oferta de la competencia activa un kill switch inmediato.
Gestionar el rendimiento semántico en el día a día
Con los agentes de voz, la naturaleza de la monitorización cambia radicalmente. Los KPIs tradicionales (disponibilidad, tiempo de respuesta) pasan a un segundo plano frente a la coherencia semántica, la detección de alucinaciones y el respeto del tone of voice.
En producción, Sharlie se gestiona igual que un agente humano: sus conversaciones se auditan, se identifican las desviaciones y los nuevos aprendizajes se inyectan en el backlog. Ya no lideramos un proyecto IT estático, sino a un colaborador no humano en constante evolución. Esta transición desde el área IT hacia el management del rendimiento semántico es la clave para transformar la IA en un activo duradero y de total confianza para la marca.
- ¿Cómo elegir tu arquitectura LLM y mantener el rumbo en un ecosistema que cambia cada mes?
- ¿Cómo orquestar la validación a gran escala de un agente probabilístico?
- ¿Cómo monitorizar la calidad semántica en producción usando un “LLM as a Judge”?
- ¿Cómo gobernar un agente de voz en continua evolución, alineando a los equipos de IT y de Negocio?