DEEP VOICE 2022

  • Colloque

Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. Pour cette deuxième édition, keynote, discussions et tables rondes se succèderont pour traiter de la diversité et de l’inclusion dans les technologies vocales  : langues rares, langues peu dotées, langue des signes, dialectes, biais et discriminations. 

Des ateliers techniques - “hands-on” - seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel.

Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction.

Deep Voice est un événement co-organisé par l’Ircam, Sorbonne Université, et SCAI dans le cadre du festival ManiFeste 2022.

Conditions d’accès : sur inscription sur le site de Sorbonne Université (prochainement)

Pour cette deuxième édition : plus de discussions, plus de rencontres, plus d'événements avec les meilleurs spécialistes français et internationaux du domaine, des ateliers de formation technique et des ouvertures culturelle et artistique !

Les organisateurs :

  • Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture)
  • Xavier Fresquet, SCAI (Sorbonne Center for Artificial Intelligence, Sorbonne Université)

Les 4 sessions DeepVoice Ircam sont maintenant accessibles en ligne ici :   https://medias.ircam.fr/xf1c528_session-langue-des-signes-performance-sl


Programme

Mercredi 15 juin (14h-17h, lieu : SCAI)

- 14h00-14h15, Mot d’introduction,  Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Center for Artificial Intelligence, Sorbonne Université

- 14h15-15h30, Keynote “Histoire des technologies vocale, évolutions actuelles et perspectives”
Intervenant : Luc Julia
Animateur : Nicolas OBIN, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture)

- 15h30-17h00, Discussion (en anglais) : “Quoi ma voix, qu’est-ce qu’elle a comme genre ?”
Résumé : Quelles sont les relations entre voix et genre ? Comment le genre interagit avec l’identité et l’émotion ? Comment envisager le genre dans les technologies vocales?
Intervenants : Emil Asmussen, Creative Director of Meet Q, The World’s First Genderless Voice, Melissa A. Barkat-Defradas, Institut des Sciences de l'Evolution, Nadine Lavan, Queen Mary University of London, Giulia Perugia,  Eindhoven University of Technology (TU/e) – Eindhoven (Netherlands)
Animateurs : Victor Rosi (Ircam), Sylvie Saget (Université de Gothenburg, en présence)

- 17h-18h30 : Réception au SCAI, soirée rencontres et réseautage

Jeudi 16 juin (10h-13h lieu : SCAI, puis 14h-17h, lieu : IRCAM)

- 10-13h à SCAI
Atelier #1: Hands-on speech-to-text with neural networks
Intervenants : Yann Teytaut et Clément Le Moine Veillon, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture)

- 14h-15h30 à l'Ircam
Discussion : Diversité des langues dans le monde numérique
Résumé : Quelle représentation des langues minoritaires dans les technologies vocales? Comment la technologie peut-elle aider à préserver les langues et les cultures ?
Intervenants : Laurent Besacier, GIPSA lab, Victoria Khurshudyan, INALCO
Animateurs : to be announced

- 15h30-18h à l'Ircam
Session langue des signes + performance SLAM
Intervenants : Agnès Vourc'h, linguiste-orthophoniste, Michael Filhol, LIMSI, Djenebou Bathily, Université Vincennes - Saint-Denis

Soirée 2 : TBA (to be announced)

Vendredi 17 juin (10h-13h lieu : SCAI, puis 14h-17h, lieu : IRCAM)

- 10-13h à SCAI
Atelier #2 : Hands-on CamemBERT
Intervenants  : to be announced

- 14h-15h30 à l'Ircam
Discussion : Le biais est dans le texte?
Intervenants : Eric de la Clergerie, Inria, Djamé Seddah, Sorbonne Université
Animatrice : Laure Soulier, Sorbonne Université

- 15h30-17h00 à l'Ircam
Table ronde (en anglais) : diversité dialectale et accentuelle dans les technologies vocales
Intervenants : Mathieu Avanzi, Sorbonne Université, Anton Lozhkov, Hugging Face, Maxim Serebryakov, SANAS
Animateur : Carl Robinson (Rumble studio)

- 17h00-17h15 à l'Ircam
Mot de conclusion, Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Université, SCAI

https://www.sorbonne-universite.fr/evenements/deep-voice-paris

L’ensemble des présentations sont libres sur inscription et seront mis en libre accès pour revisionnage. 
Le pack payant inclut un accès privilégié sur place, la soirée de rencontres, et les 2 ateliers techniques (nombre de places limitées).
Un tarif préférentiel est proposé pour les étudiants, avec la possibilité d’assister aux ateliers à distance.

 

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour nous permettre de mesurer l'audience, et pour vous permettre de partager du contenu via les boutons de partage de réseaux sociaux. En savoir plus.