L’innovation IA à la française – avec Patrick Pérez, CEO de Kyutai – Épisode 36
Fin 2023, un laboratoire atypique voit le jour en France : trois cents millions d’euros réunis par Xavier Niel, Rodolphe Saadé et Eric Schmidt pour financer une recherche ouverte, sans visée commerciale immédiate. Son nom : Kyutai. Son pari : prouver que l’Europe peut mener une science de pointe avec une exigence d’utilité publique.
Pour décrypter ce modèle, Laurent Nicolas-Guénoc reçoit Patrick Pérez, directeur et membre fondateur de Kyutai. À la tête du laboratoire privé de recherche en IA le plus en vue de l’Hexagone, il revient sur une aventure qui place la transparence au cœur de l’innovation.
Un modèle à part entière
Le lancement de Kyutai a surpris l’écosystème. Ni startup, ni éditeur de logiciels, ce laboratoire à but non lucratif offre une latitude totale à ses chercheurs. Son financement de départ – 300 millions d’euros – équivaut à deux ans de « mercato » du PSG ou au budget annuel de la ville de Rennes. C’est une anomalie bienvenue dans un paysage dominé par la course effrénée à la valorisation boursière.
Patrick Pérez, diplômé de Centrale Paris et vétéran de la recherche (Inria, Microsoft, Technicolor, Valeo), y a trouvé un environnement rare : les ressources du privé alliées à la liberté académique.
Moshi : quand l’IA prend vraiment la parole
Le premier exploit technique de Kyutai se nomme Moshi, un modèle vocal full duplex. Contrairement aux assistants classiques, Moshi écoute et parle simultanément sans passer par une transcription intermédiaire. L’IA peut interrompre, réagir et émettre des signaux d’engagement – ce que les linguistes appellent le back-channeling.
En maîtrisant l’intégralité de la chaîne (synthèse vocale expressive et modèles ultra-rapides), Kyutai a imposé un nouveau standard. Preuve de cette influence : en 2025, Nvidia a publiquement reconnu que son modèle Persona Plex s’inspirait directement des travaux de Kyutai.
Invincible Voice : la technologie au service de l’humain
L’un des moments les plus marquants de cet échange concerne le projet Invincible Voice. Né de la rencontre entre Patrick Pérez et Olivier Goy (atteint de la maladie de Charcot), cet outil vise à redonner une voix fluide à ceux qui l’ont perdue.
Plutôt que de taper péniblement chaque lettre, l’utilisateur bénéficie d’un système combinant transcription en temps réel, LLM personnalisé et synthèse vocale avec clonage de sa voix originale. En un clic ou un regard, le patient choisit une réponse suggérée. Mis en open source en janvier 2025, le projet suscite déjà un immense espoir chez les soignants et les familles.
Les « World Models » : simuler pour mieux agir
Au-delà de la voix, Kyutai explore les modèles de monde (world models). Contrairement à un simulateur programmé à la main, il s’agit d’un simulateur appris par l’IA pour prédire les conséquences d’une action dans un environnement donné. C’est l’équivalent de la représentation mentale qu’un conducteur se fait du trafic : imparfaite, mais suffisante pour anticiper un danger.
Aujourd’hui, Kyutai collabore avec la startup General Intuition pour intégrer l’audio dans ces modèles, une approche différenciante par rapport aux solutions purement visuelles utilisées dans la robotique et la conduite autonome.
L’Europe face aux géants
Tout en saluant le dynamisme de l’écosystème parisien, Patrick Pérez pointe trois failles persistantes : des rémunérations académiques peu compétitives, un investissement privé encore timide et le manque d’une infrastructure de calcul mutualisée. Son modèle de référence ? Le CERN. Pour lui, l’échelle nationale est désormais obsolète ; seule une union européenne des moyens permettra de rivaliser avec les géants américains et chinois.
Vous avez des questions sur cet épisode ?
Vous voulez nous soumettre une idée d’épisode ou d’invité ?
Écrivez-nous à changement@converteo.com
Changement d’Époque en cours est un podcast réalisé par Converteo.
L’émission est présentée par Laurent Nicolas-Guénoc