STMS Lab

Biographie :
Je suis Maître de Conférences à Sorbonne Université et chercheur dans l'équipe analyse et synthèse des sons au sein du laboratoire Sciences et Technologies de la Musique et du Son (<a href="https://www.ircam.fr/">Ircam</a>, <a href="https://www.cnrs.fr/fr">CNRS</a>, <a href="https://www.sorbonne-universite.fr/">Sorbonne Université</a>). Ma formation est principalement axée sur les sciences mathématiques, informatique, et physique et je suis membre de la promotion 2005-2006 du Master 2 ATIAM (Acoustique, Traitement du signal, et Informatique Appliqué à la Musique) de l'Université Pierre et Marie Curie; et secondairement en musicologie avec un Master 2 en Arts, Philosophie, Esthétique de l'Université Vincennes Saint-Denis en 2006 sous la direction d'Ivanka Stoïanova. Je suis titulaire d'une thèse de doctorat en informatique et télécommunications intitulée : "<a href="https://theses.fr/2011PA066172">MeLos : modélisation de la prosodie et du style pour la synthèse de la parole à partir du texte</a>" (2011) sous la direction de Xavier Rodet, pour laquelle j'ai a obtenu le prix de la meilleure thèse de doctorat de La Fondation Des Treilles en 2011. En 2023, j'ai soutenu mon Habilitation à Diriger des Recherches (HDR) intitulée : "<a href="https://theses.hal.science/THESES-SU/tel-04223614v1">De la modélisation du signal à l'apprentissage de représentations : modélisation structurée de signaux de parole</a>". A la croisée du monde bio-sensible - en particulier sonore - et des théories formelles de l'information, de la communication et de la cognition, j'ai développé au fil des années un intérêt prononcé pour la modélisation du comportement et des interactions entre humains, animaux et robots. Mes activités de recherche s'articulent principalement autour de la modélisation générative de productions humaines complexes telles que la parole, le chant et la musique avec diverses applications dans la génération sonore et mulitmodale, les systèmes cyber-physiques humains et musicaux, et la création augmentée par les machines. Je suis un chercheur engagé dans les implications technologiques, créatives, et éthiques de mes recherches et en particulier sur l'impact de l'intelligence artificielle sur la création artistique, les métiers de la création, et les industries créatives et culturelles. Je suis également impliqué sur les thématiques de l'inclusion et de la souveraineté numérique, notamment pour favoriser la présence et la diversité des dialectes, des langues et des cultures dans le monde numérique. Je suis responsable du Master en <a href="https://sciences.sorbonne-universite.fr/formation-sciences/masters/master-automatique-robotique/parcours-ingenierie-des-systemes">Ingénierie des Systèmes Intelligents</a> (ISI) au sein duquel j'enseigne le traitement numérique du signal audio et l'apprentissage machine et de réseaux de neurones profonds, et suis également responsable de la formation professionnelle "<a href="https://fc.sorbonne-universite.fr/nos-offres/ia-deep-learning-par-la-pratique/">Deep Learning par la Pratique"</a> délivrée par Sorbonne Université, Je suis le fondateur de <a href="https://www.centrepompidou.fr/fr/programme/agenda/evenement/ObT5U3k">DeepVoice, Paris </a>(depuis 2020) l'événement parisien sur les technologies vocales et l'intelligence artificielle, de <a href="https://sciences.sorbonne-universite.fr/associations/sophia-association-etudiante-intelligence-artificielle-de-sorbonne-universite">SophIA</a> (2021) : l'association étudiante de Sorbonne Université pour l'Intelligence Artificielle en collaboration avec le Centre d'Intelligence Artificielle de la Sorbonne (SCAI), et des <a href="https://forum.ircam.fr/agenda/soiree-fast-foward/detail/">Fast-Forward </a> (2022) les rencontres informelles et expérimentales des sciences et technologies et du sound design au cinéma et à l'image animée. Dans le cadre de mon engagement artistique à l'Ircam, je suis très impliqué dans la promotion des sciences et technologies numériques pour les arts, la culture et le patrimoine, avec de nombreuses collaborations avec des artistes de renom, tels que : Eric Rohmer, Philippe Parreno, Roman Polansky, Leos Carax, George Aperghis, ou Alexander Schubert. Mon CV en ligne est disponible ici en pdf. <a href="/media/uploads/STMS/ASS/persons/nobin/cv_nicolas_obin.pdf" title="CV Nicolas OBIN"><img alt="CV nicolas obin" src="/media/uploads/STMS/ASS/logo/logo_pdf.jpg" width="69" height="68" /></a>

Je suis Maître de Conférences à Sorbonne Université et chercheur dans l'équipe analyse et synthèse des sons au sein du laboratoire Sciences et Technologies de la Musique et du Son (Ircam, CNRS, Sorbonne Université). Ma formation est principalement axée sur les sciences mathématiques, informatique, et physique et je suis membre de la promotion 2005-2006 du Master 2 ATIAM (Acoustique, Traitement du signal, et Informatique Appliqué à la Musique) de l'Université Pierre et Marie Curie; et secondairement en musicologie avec un Master 2 en Arts, Philosophie, Esthétique de l'Université Vincennes Saint-Denis en 2006 sous la direction d'Ivanka Stoïanova. Je suis titulaire d'une thèse de doctorat en informatique et télécommunications intitulée : "MeLos : modélisation de la prosodie et du style pour la synthèse de la parole à partir du texte" (2011) sous la direction de Xavier Rodet, pour laquelle j'ai a obtenu le prix de la meilleure thèse de doctorat de La Fondation Des Treilles en 2011. En 2023, j'ai soutenu mon Habilitation à Diriger des Recherches (HDR) intitulée : "De la modélisation du signal à l'apprentissage de représentations : modélisation structurée de signaux de parole".

A la croisée du monde bio-sensible - en particulier sonore - et des théories formelles de l'information, de la communication et de la cognition, j'ai développé au fil des années un intérêt prononcé pour la modélisation du comportement et des interactions entre humains, animaux et robots. Mes activités de recherche s'articulent principalement autour de la modélisation générative de productions humaines complexes telles que la parole, le chant et la musique avec diverses applications dans la génération sonore et mulitmodale, les systèmes cyber-physiques humains et musicaux, et la création augmentée par les machines. Je suis un chercheur engagé dans les implications technologiques, créatives, et éthiques de mes recherches et en particulier sur l'impact de l'intelligence artificielle sur la création artistique, les métiers de la création, et les industries créatives et culturelles. Je suis également impliqué sur les thématiques de l'inclusion et de la souveraineté numérique, notamment pour favoriser la présence et la diversité des dialectes, des langues et des cultures dans le monde numérique.

Je suis responsable du Master en Ingénierie des Systèmes Intelligents (ISI) au sein duquel j'enseigne le traitement numérique du signal audio et l'apprentissage machine et de réseaux de neurones profonds, et suis également responsable de la formation professionnelle "Deep Learning par la Pratique" délivrée par Sorbonne Université, Je suis le fondateur de DeepVoice, Paris (depuis 2020) l'événement parisien sur les technologies vocales et l'intelligence artificielle, de SophIA (2021) : l'association étudiante de Sorbonne Université pour l'Intelligence Artificielle en collaboration avec le Centre d'Intelligence Artificielle de la Sorbonne (SCAI), et des Fast-Forward (2022) les rencontres informelles et expérimentales des sciences et technologies et du sound design au cinéma et à l'image animée.

Dans le cadre de mon engagement artistique à l'Ircam, je suis très impliqué dans la promotion des sciences et technologies numériques pour les arts, la culture et le patrimoine, avec de nombreuses collaborations avec des artistes de renom, tels que : Eric Rohmer, Philippe Parreno, Roman Polansky, Leos Carax, George Aperghis, ou Alexander Schubert.

Mon CV en ligne est disponible ici en pdf.

Éditer

L'IA au service du sonore ? UNESCO (2024)

Soirée "L'IA au service du sonore?" 18 janvier 2024 Organisée dans le cadre de la 21ème édition de la semaine du son

Soutenance d'habilitation à diriger des recherches

Nicolas Obin soutient son Habilitation à Diriger des Recherches (HDR) le 12 septembre 2023 à 14h - "De la représentation du signal à l’apprentissage de représentations : modélisation structurée de signaux de parole »

Composition du jury

• M. Thomas HUEBER, Directeur de recherche CNRS, GIPSA lab, Rapporteur
• M. Emmanuel VINCENT, Directeur de recherche INRIA, MultiSpeech, Rapporteur
• M. Bjorn SCHULLER, Professeur, Imperial College London, Rapporteur
• M. Gérard BIAU, Professeur, Sorbonne Université, Examinateur
• M. Jean-François BONASTRE, Directeur de Recherche INRIA, Défense et Sécurité, Examinateur
• Mme Catherine PELACHAUD, Directrice de recherche CNRS, ISIR, Examinatrice
• M. Axel ROEBEL, Directeur de recherche, IRCAM, Examinateur
• Mme Isabel TRANCOSO, Professeure, INESC - Université de Lisbonne, Examinatrice
• Mr Nicolas BECKER, Designer sonore et artiste, Membre Invité

Le texte de mon HDR est librement accessible sur HAL.

Deep Voice, Paris

Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. Des ateliers techniques - “hands-on” - seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel. Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction. Deep Voice est un événement co-organisé par l’Ircam, Sorbonne Université, et SCAI dans le cadre du festival ManiFeste 2022.

L'Hôtel du Temps (2022)

Recréation de la voix de Dalida avec de l'intelligence artificielle pour la nouvelle émission de Thierry Ardisson "L'Hôtel du Temps"

Deepfake : le vrai du faux d'une technologie révolutionnaire

Le Meilleur des Mondes, France Culture, 13 Mai 2022 Animé par François Saltiel

Vox ex-machina

Présentation au Collège de France, 6 juin 2017

Assistants, robots affectifs et réalité virtuelle | Deep Voice, Paris 2021

Comment la simulation des émotions va-t-elle modifier notre rapport affectif aux machines et notre immersion dans un monde social artificiel ? Une table-ronde organisée par le Sorbonne Center for Artificial Intelligence (SCAI) et l'Ircam, animée par Nicolas Obin, chercheur à l'Ircam.

On a volé la voix d'André Dussolier

Le Monde, 7 juillet 2014

Artistic Production

[ 2022 ] Anima, par l'artiste Alexander Schubert, Festival Manifeste, Centre-Pompidou.

[ 2021 ] Annette, film du réalisateur Léos Carax, avec le sound designer Erwan Kerzanet

[ 2019 ] Lullaby experience, par le compositeur Pascal Dusapin, Frankfurter Positionen festival (Frankfurt) et Théâtre 104 (Paris).

[ 2018 ] Les guerriers de l'ombre, documentaire réalisé par Frédéric Schoendoerffer, Canal+. Anonymisation réaliste de voix d'agents secrets.

[ 2014-2015 ] Pourquoi j'ai pas mangé mon père, film de Jamel Debbouze. Recréation de la voix de Louis de Funès par la technologie de conversion d'identité de la voix

[ 2014-2015 ] Juger Pétain, films documentaires de Richard Saada, Planète, France 5. Recréation de la voix du maréchal Pétain et de protagonistes de son procès par la technologie de conversion d'identité de la voix

[ 2013 ] Aliados, opéra composé par Sebastian Rivas, Ircam Manifeste festival.

[ 2012-2013 ] Marilyn, film de Philippe Parreno, Fondation Beyeler (2012) et Palais de Tokyo (2013) avec le sound designer Nicolas Becker. Recréation de la voix de Marilyn Monroe par la technologie de conversion d'identité de la voix

[ 2011 ] Luna Park, théâtre musical composé par Georges Aperghis, festival Agora (Paris).

[ 2010 ] Escort Girl, première partie du cycle de documentaires "L'Europe judiciaire" réalisé par Olivier Ballande, Maha Productions, France Télévision. Anonymisation réaliste de voix de protagonistes impliqués dans des enquêtes judiciaires.

[ 2009 ] Hypermusic Prologue, opéra du compositeur Hector Parra, festival Agora (Paris).

Communication

Une sélection non-exhaustive de mes récentes interventions publiques

Conférences

Les enjeux de l'IA dans l'industrie cinématographique. Table ronde avec Mathilde Croze, Festival NUMOK, Bibliothèque François Truffaut, Paris, 2 mai 2024

L’intelligence artificielle : quels impacts sur la création et les métiers du cinéma et de l’audiovisuel ? Table ronde avec Nicolas Becker, Pierre Lanchantin, Lex Dromgoole, et Erwan Kerzanet, La Femis, Paris, 2 avril 2024.

Voix et sons à l'ère de l'intelligence artificielle. Table ronde avec Nicolas Muchielli et Erwan Kerzanet, La Cinémathèque française, Paris, 13 mars 2024.

L'IA au service du sonore ? La semaine du Son, UNESCO, Paris, 18 janvier 2024

Les usages médiatiques du deepfake : rendre la parole aux morts, une alternative aux archives audiovisuelles ?, Les Rendez-vous de l'histoire, Blois, 6 octobre 2023,

Ethics and generative AI. Animateur de la table ronde avec Ambre Davat, Patrick Kuban, et Jeannette Gorzala, Speech Synthesis Workshop 2023, Machine that talks, Grenoble, 27 août 2023

The Sound of Uncertainty. Table ronde sur l'impact de l'IA pour la création musicale avec Nao Tokui et Yotam Mann, "Music, Innvovation & Creativity", SÓNAR+D, Sonar Music Festival, Barcelone, 16 juin 2023

La manipulation dans le discours politique : manipulation par le discours et manipulation du discours, Gouverner, Les Napoléons, Val d'Isère, 14 janvier 2022

Deep fakes audio : entre manipulation et créativité, Voice Tech, Paris, 23-24 Novembre 2020

Trucages, deepfake, clonage vocal : en 2020, ne croyez plus vos yeux et vos oreilles. Futurapolis, Toulouse, 16 novembre 2019. Avec Vincent Nozick, maître de conférences à l’Université Paris-Est Marne la Vallée, et Guerric Poncet, journaliste au Point

Voix artificielle et sound design : concepts, pratiques, enjeux (avec N. Misdariis, de l'équipe Perception et Design Sonore, Ircam), HyperVoix : enjeux de conception des interfaces conversationnelles, Journée d'étude organisée par la Fing, Le Square, Paris, 15 avril 2019.

AI and creativity: can AI be creative?, Changing IP in Changing Europe, Trilateral Seminar of the French, German and Polish Groups of AIPPI, Paris, France, 05 avril 2019.

La voix à l’ère du numérique et de l'IA, CNIL, Paris, France, 15 février 2019

La voix et l'IA, Parcours Innovateur ignorant, Sciences Po, Paris, France, 19 octobre 2018.

Marilyn: histoire de la recréation de la voix d'une icône, Ecole Normale Supérieure, Paris-Saclay, France, 9 octobre 2018

Les voix du numérique pour le design sonore et la création artistique, Festival Vino Voce, Saint-Emilion, France, 8-10 septembre 2017.

Vox ex-machina. La voix et ses doubles numériques, Collège de France, présentation invité de la chaire de création artisique de Philippe Manoury, Paris, France, 6 juin 2017.

Revues grand public, journaux

Deep fake : la guerre des algorithmes. Dossier Espilon. Avril 2024

Affaire Taylor Swift, Usbek & Rica, 6 février 2024

Intelligence artificielle : «Aujourd’hui, on parvient à créer une voix de synthèse à partir de quelques secondes de votre voix», Libération, 12 octobre 2023

Entretien avec l'Association Française du Son à l'Image (AFSI). 26 mars 2023

L’intelligence artificielle pour modifier sa voix : « Pour un être humain, la différence va devenir impossible à détecter », Le Monde, 17 mars 2023

A l'Ircam, la voix transformée. Dossier L'industrie trouve sa voix. L'Usine Nouvelle. Juillet 2019.