[Reportage] À l'Ircam, la voix transformée

Comment crée-t-on ou transforme-t-on une voix ? Réponse auprès des chercheurs de l’institut parisien de recherche acoustique, royaume des sons.

Partager
[Reportage] À l'Ircam, la voix transformée
Pour ses travaux sur les émotions dans la voix, l'Ircam va enregistrer 25 acteurs qui joueront quatre "attitudes sociales".

Sous la fontaine Niki de Saint Phalle, place Igor-Stravinsky, au cœur de Paris, des studios d’enregistrement et des salles de recherche.

Voilà ce que recèlent les sous-sols de l’Institut de recherche et coordination acoustique - musique (Ircam), créé en 1977. Dans l’un des bureaux, murs gris et plafond de néons, l’équipe du département analyse et synthèse des sons (CNRS et Sorbonne université) transforme et créé des voix. "Aujourd’hui, la synthèse vocale est moins une création ad hoc que la reconstruction d’une voix existante à laquelle nous faisons dire ce que nous souhaitons", explique Axel Roebel, le responsable de l’équipe.

Pour faire de la synthèse vocale, l’Ircam s’appuie sur la méthode dite concaténative : à l’aide d’une base de données de sons enregistrés et annotés, un algorithme conçoit une voix synthétique. La méthode donne de très bons résultats avec des bases contenant plusieurs heures d’enregistrement. "Pour rendre la synthèse vocale plus réaliste, nous faisons jouer le texte par un acteur qui adopte la prosodie, renvoyant à la courbe d’intonation et au débit de parole, de la voix voulue, explique Axel Roebel. Sinon les algorithmes créent une voix non contextualisée, qui a un caractère plat ou robotique."


En travaillant à la main sur un logiciel, les chercheurs de l'Ircam peuvent modifier la hauteur ou la résonance d'une voix.

Le chercheur lance un extrait de la série documentaire "Juger Pétain", qui reconstitue le procès de l’ex-maréchal, frappé d’indignité nationale en 1945. Sa voix est synthétique, les images d’archives étant muettes. Mais le spectateur n’y voit que du feu. L’Ircam a croisé la voix réelle de Pétain avec l’enregistrement d’un acteur reproduisant sa prosodie. Le studio de production a même ajouté la réverbération de la salle du procès. "Il ne faut que quelques jours à notre algorithme pour créer une voix, mais le résultat n’est pas toujours satisfaisant et les corrections manuelles peuvent prendre jusqu’à un mois", précise Axel Roebel. Un doctorant travaille sur les réseaux de neurones profonds pour améliorer la qualité du rendu et l’automatisation du processus.

L’Ircam collabore avec PSA, qui souhaite développer des assistants vocaux pour la voiture. "Beaucoup d’entreprises nous contactent parce qu’elles cherchent une voix de synthèse qui corresponde à leur image de marque", précise Nicolas Obin, installé dans le bureau mitoyen. En coopération avec l’institut de recherche en robotique Isir (CNRS, Sorbonne université) et avec des industriels, l’enseignant-chercheur multiplie les projets pour conférer aux voix artificielles des émotions et des "attitudes sociales", comme l’amabilité, la séduction ou l’autorité. L’enjeu : permettre l’adaptation du ton des machines à une situation d’interaction et au ton de l’interlocuteur humain.


La chambre anéchoïque, ou "sourde", est dénuée d'effets de salle car tous ses matériaux sont absorbants.

Un outil à utiliser avec prudence

Des recherches dont la portée interroge. Amazon, en contrôlant l’émotion de la voix d’Alexa, pourrait-il en faire un outil d’incitation à l’achat ? "Les machines actuelles n’ont pas d’intention particulière. Les rendre expressives est une manière de cacher les possibles intentions de leur concepteur, reconnaît Nicolas Obin. Même notre travail sur la voix de Pétain, lié à une production artistique, relève d’une reconstruction de l’histoire qui n’est pas si éloignée des deepfakes." À côté, le bureau de Thomas Hélie s’ouvre sur une vitrine exposant des cartilages du larynx en résine et un conduit vocal en silicone. Son équipe (S3AM) et lui explorent la production vocale en modélisant physiquement l’appareil vocal. Ces travaux pourraient aider à comprendre la fatigue de la voix, par exemple. Au niveau artistique, ils pourraient déboucher sur la création de robots chanteurs ou joueurs d’instruments à vent. En plus de nous parler, un robot nous jouera peut-être un jour du pipeau !

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER Innovation

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

LES ÉVÉNEMENTS L'USINE NOUVELLE

Tous les événements

LES PODCASTS

Ingénieur, un métier au coeur de la souveraineté

Ingénieur, un métier au coeur de la souveraineté

Dans ce nouveau podcast de La Fabrique, nous recevons Anne-Sophie Bellaiche, rédactrice en chef de L'Usine Nouvelle et du Guide de l'ingénieur. Comme son nom l'indique, cette publication annuelle s'intéresse aux différentes...

Écouter cet épisode

L'inventrice du premier lave-vaisselle

L'inventrice du premier lave-vaisselle

L’épouse d’un bourgeois de l’Illinois décide de prendre les choses en main et d’inventer elle-même l’outil dont les femmes ont besoin.

Écouter cet épisode

Qui recrute dans l'industrie en 2024 ?

Qui recrute dans l'industrie en 2024 ?

[Podcast] Dans ce nouvel épisode de La Fabrique, Cécile Maillard, rédactrice en chef adjointe de L'Usine Nouvelle, revient sur l'enquête annuelle consacrée au recrutement dans l'industrie. La cuvée 2024 s'annonce...

Écouter cet épisode

L'étrange disparition d'un Airbus en Chine

L'étrange disparition d'un Airbus en Chine

[Podcast] Dans ce nouvel épisode de La Fabrique, Olivier James, grand reporter suivant le secteur aéronautique à L'Usine Nouvelle, revient sur une bien étrange affaire. Un avion fabriqué par Airbus et livré à la Chine a...

Écouter cet épisode

Tous les podcasts

LES SERVICES DE L'USINE NOUVELLE

Trouvez les entreprises industrielles qui recrutent des talents

MUSEE DU QUAI BRANLY

Chargée/Chargé de projets « Efficacité énergétique » F/H

MUSEE DU QUAI BRANLY - 12/03/2024 - Contractuel - PARIS

+ 550 offres d’emploi

Tout voir
Proposé par

ARTICLES LES PLUS LUS

SOUTENEZ UN JOURNALISME D'EXPERTISE ET ABONNEZ-VOUS DÈS MAINTENANT À L'USINE NOUVELLE

Rejoignez la communauté des professionnels de l’industrie et profitez d'informations et données clés sur votre secteur.

Découvrez nos offres