MERCREDIS DE STMS - Y TEYTAUT et C LE MOINE-VEILLON

  • Recherche
  • Séminaires

Introduction à deux thèses en cours autour des signaux de voix, Yann TEYTAUT et Clément LE MOINE-VEILLON, doctorants dans l’équipe Analyse et synthèse des sons, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la Culture) présentent leurs travaux ainsi que leur collaboration sur ce thème dans la troisième partie :

Le séminaire a lieu en salle Stravinky, mais vous pouvez le suivre en direct sur la chaîne YouTube de l'Ircam :   https://youtu.be/O2YDl_zsb4Q

 Résumé :

1) Alignement automatique phonème-à-audio [Yann TEYTAUT]

S’écouter, se répondre, se coordonner, se suivre, s’adapter, se synchroniser, s’aligner... Le vocabulaire de la performance musicale —— mais aussi de toute conversation orale —— est intrinsèquement lié à son organisation temporelle. L’analyse de la parole et du chant dépend donc fortement de notre capacité à pouvoir expliciter quel événement se produit à quel instant. Dans ce but, ces travaux visent à développer des modèles pour l’alignement automatique (ou synchronisation temporelle) de signaux vocaux. Notre cœur de propos concerne l’alignement phonème-à-audio, particulièrement exigeant de par la haute précision temporelle nécessaire, et riche de par ses applications à la synthèse sonore ou à l’étude du style de chant.

2) Conversion des attitudes vocales [Clément LE MOINE-VEILLON]

Les humains disposent d'une remarquable capacité à communiquer des signaux sociaux avec leur voix, notamment leurs attitudes. Permettre aux machines de comprendre, reproduire et interpréter ces signaux est un enjeu crucial. Cette recherche vise à élaborer un système de conversion des attitudes vocales et à valider ses performances à l'aide de critères objectifs — en évaluant sa capacité à reproduire des stratégies dites de "production" — et subjectifs — en évaluant la perception individuelle des conversions qui en sont issues.

3) Stratégies de productions des attitudes vocales [Yann & Clément]

Enfin, ce séminaire présente un cas d’étude applicatif de l’alignement phonétique sur la base de voix expressive Att-HACK. Grâce à des méthodes d'analyse de la parole couplées aux synchronisations temporelles, les stratégies de production de diverses attitudes vocales sont mises en évidence.

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour nous permettre de mesurer l'audience, et pour vous permettre de partager du contenu via les boutons de partage de réseaux sociaux. En savoir plus.